IP网络上的话音通信
—— VOIP
计算机芯片技术和计算机网络技术的提高大大推动了Internet的发展,各种网上的新业务纷纷涌现。短短数年中,国际互联网变成一个彩斑斓的多媒体世界。近两年,Internet上的实时,半实时业务也开始出现,如互联网电话,Internet电台等。特别是互联网电话,由于Internet低廉的设备维护费用而成为比传统电话业务更为廉价的通信方式。Internet是基于IP协议的全球性的计算机网络,提供面向连接的(TCP)和非连接(UDP)的分组业务;由源端主机的IP层将上层(TCP/UDP)交给的消息分段装入分组中,分组在网络上各自独立传送,在目的主机的IP层重装成消息并交给上层。Internet上基于IP协议的分组话音通信称为V oIP(V oice Over IP),提供可与PSTN传统业务比拟的话音通信。
基于IP的话音通信与传统的话音通信相比有优势也有缺陷。其显著的优点在于:经济,即数据在带宽动态分配的IP网络上传输的经济性;IP网络灵活的路游选择功能;网络本身的高带宽适于多媒体数据的实时传输;可对话音数据进行加密,从而提供一定的安全保证。而它的缺点是目前分组网在传送实时业务时的固有缺陷,如时延抖动、分组丢失等,这些缺陷将导致话音质量的下降。
目前TCP/IP协议已成为绝大多数计算机网络所支持的协议,它能很好地实现不同主机之间的通信,方便了不同数据网络的互联。而IP的基本功能只是通过网络发送和接收数据,即从高层获得消息,分段成分组并
加上IP包头,然后交给数据链路层将分组发出,IP层不对高层提供QoS服务,也不对下层提出QoS要求,因而并不提供可靠的服务,当网络资源不足时将引起分组传送延时增大或分组丢失。但话音数据分组传送时带宽的动态分配大大提高了经济性,降低了总费用。低廉的价格,TCP/IP日益广泛的应用和技术进步使得V oIP具有很大的发展优势。
关于V oIP的几个技术问题
1.话音数据的编码与压缩。从网络经济性来看,在保证一定话音质量的条件下,应尽可能降低信源编码的比特率。分组话音的信源编码速率一般都比标准PCM (64K)要低,采用的编码方法可以是ADPCM,LPC(线性预测编码),或CELP (码激励线性预测)编码方法。并且,为了进一步降低用户所占的带宽,还可以DSI (数字话音插空)中的静音检测技术,即仅当用户说话时才进行话音编码和分组传输,而在没有话音时释放带宽,实现更有效率的统计复用。
H.323标准要求终端必须支持ITU的G.711话音压缩编码标准,而对于其它ITU 的话音编码标准则是可选的。但是,由于G.711的64kbpsPCM编码的话音取样总为8比特样值,码率不够低,所以它们不适合于实时传输协议。而其它如G.726、G.728、G.729则通过各种方法降低编码后的码流速率、简化编码运算,因而更适合于话音数据的实时传送。
2.传输时延。IP网络中业务分组相对独立地进行路由,节点机根据分组头中的IP 地址信息及网络状况来
决定分组的下段路由。节点机在处理分组时,先奖分组入队,按FIFO策略进行处理。于是在业务分组等待处理时,会造成延时;再加上分组在终、源端拆装时的处理时延以及传输时延,分组在网络上传输的总时延就相当可观
了。这样的时延对于非话音数据分组来说可能是无关紧要的,毕竟大多数数据传送对实时性的要求不高;而话音分组则不然,我们恐怕无法忍受通话时较大的时延,因为由于心理上的作用,人们对话时不习惯说完一句话后等一会儿才听到对方的回答。通常,300毫秒以下的延时可忽略,可接受的延时不应超过600毫秒,而当延时达到1200毫秒时,心理因素会使通话无法进行下去。为了尽可能地降低话音分组的总延时,需要选择恰当的分组长度,减小分组拆装时的时延,并赋予话音分组一定的优先级,使其在节点处排队时能被优先处理,减小排队时延。此外,提高节点机性能也是降低延时的重要方面。
3.时延抖动。由于IP网络,如Internet,上的业务为突发性数据业务,网络上的业务流量和繁忙的网段是不断变化的,因而分组在节点机接受服务的时延是变化的,这种时延的变化称为抖动。时延抖动使到达目的主机的分组在排列的时间间隔上与源端不同,这就造成发音之间产生随机的中断,降低话音质量,因为话音音节之间的停顿以及发音长度是不应改变的,严重时用户无法听懂恢复出的话音。为了消除抖动,必须在源端发送话音分组时加上时间标签(由实时传输协议RTP提供),沿途各节点主机进行修正,并在目的主机设置适当的缓存,根据测得的时延用缓存消除抖动,即使各分组在缓存中停留适当的时间,以使恢复话音时分组间的间隔与源端一致。但是,在消除抖动的同时,也会引入一定的延时。由
于存在传输延时,接入用户端的模拟话机时应加上回波抑制器,虽然数据网络本身不需要回波消除。
4.分组的丢失。在网络中传输的话音分组由于人为或其他原因没有到达目的地,即丢失了分组,会造成话音质量的下降。但由于话音信号有较大的冗余度,因此当话音分组较短时,分组丢失对话音质量下降的影响较小,这里,可接受的话音分组丢失率是话音分组长度的函数。这样,当网络发生拥塞时,可用丢弃话音分组的方法来控制网络的通信量,每个用户可适当丢弃一些话音分组以使网络能容纳更多的用户同时通话。此外在RTP(实时传输协议)包中可以加入用于冗余数据,以恢复丢失的上一分组中的话音。
V oIP协议栈的分层
1996年提出的H.323协议提供不保证业务质量的LAN可视电话系统和终端。在IPV6,RTP/RTCP,RSVP等新协议基本成熟的基础上,考虑制定H.323V2以适应在IP网上实现多媒体数据流的传输。
tcp ip协议在网络中的作用
TCP/UDP,TCP协议是面向连接的,具有超时发送和流量控制功能,保证传输的可靠性,但不保证传输的实时性,所以一般用于实时性要求不强的业务;UDP是无连接的,不提供传输的可靠性,协议简单高效,在网络本身具有一定QoS的情况下提供实时传输。UDP的传输延时小于TCP,在实际应用中能与音频、视频数据流较好地匹配,而TCP用于一般数据和控制信令的传输。
IPV6,第6版的IP协议扩展了地址段,大大增加了可寻址的地址数;为了适应多媒体数据传输要求,减少了IP分组头中不必要的域,以加快处理速度,在IP头中设定实时标志、数据重要标志来指定不同的优先级;增加安全保证机制,即数据包包头认证和安全包头封装,在节点处为数据加密,并保证数据传输时不受到非法的修改;设置流标志,以保证路游器支持需要特殊处理的包。
RTP(实时传输协议)。RTP负责多媒体数据的传输,是音频和视频数据传输所不可却少的。RTP本身不提供实时传输或提供QoS保证的传输机制,而是由下层服务提供。RTP也不进行资源预留。它以多点传送或单点传送方式提供点到点的实时业务数据的传送。RTP在数据分组中加上定时标记,用包序号来提供分组排序服务,并提供包内数据类型标志以指明编码方式,必要的话净荷中还包含用于在分组丢失时恢复上一个分组实时数据(话音)的冗余编码;RTP从上层接收音频数据流,装成数据包,交给下层
的UDP处理。时间标记和包序号用于记录该包中数据的在实时数据流中的位置,在接收端就根据时间标记和序号在缓存中消除抖动,恢复实时数据流。
RTCP(实时传输控制协议)。RTCP通过周期性地向用户传送控制分组来实现对网络服务质量的监视。其主要功能是对分发数据的质量提供回馈报告,与RTP一同构成完整的传输协议。这种回馈机制对于自适应编码控制和数据分发失效分析有着重要作用;RTCP为RTP源携带一个称为规范化名字(CNAME)的永久性传输层标志,使得接收者能够从指定的与会者那里得到相关数据流,或用于保持某个与会者的运作痕迹;RTCP还可以根据与会者的数量来调整RTCP包的发送率;此外,还有一项可选功能,即传送最小的会话控制信息,例如用户界面上所显示的与会者的鉴别。对网络服务质量的监视可由参与通信的用户终端完成,也可以由诸如网络服务提供者的第三方进行。RTCP对各个用户的接收质量和网络的可用带宽进行监视,一旦质量劣化或带宽发生变化,就通知发端作出适应性调整,如改变编码参数等。
RSVP(资源预留协议)。IETF开发资源预留协议是为了在现有Internet上实现带宽资源预留,并设置队列管理方法。RSVP装载在网络节点中,被设计成与网络层无关。在连接建立时考察网络情况和用户的带宽要求,决定是否允许呼叫建立,从而保证端到端的传输带宽,减少时延和抖动。通信的源端在建立连接时向目的地发出一个连接建立请求,沿途各节点建立并维护一个包括输入、输出端口的通道状态表;目的节点(某个客户端)收到请求后根据数据流量规范向源节点发出一个预定消息;此消息沿信宿树历经各个节点时,申请所需预留的带宽资源,节点考察可用资源是否能满足通信的要求,如能,就将
消息转发到下一个节点,否则将拒绝消
息传给目的节点,并丢弃预定;若源节点收到了预定消息,就说明资源预定成功。路由上的各个节点可以把同一个点到多点中的资源请求合并。由此,RSVP就可以按不同应用分配带宽,能有效地减少多媒体应用中的传输延迟和时延抖动。同时,在通信过程中,为了维护各中间节点的通道状态,要周期性地沿信宿树传输刷新消息;客户端终止连接时,要发出通道撤消消息,释放网络的通道状态和预定的资源。
H.323是用于在无QoS的分组网络上实现多媒体通信的新标准。提供了点对点和多点会议中的呼叫控制、多媒体管理、带宽管理规范以及分组网与其它网络的接口规范。H.323会议系统有四个逻辑组件,分别是H.323终端,H.323网闸(Gatekeeper),H.323网关和多点控制单元(MCU);所采取的技术标准有视频标准H.261和H.263,音频标准G.711、G.722、G.723.1、G.728、G.729.A,呼叫信令协议与媒体流分组打包、同步标准H.225.0,控制标准H.245,数据会议标准T.120等。
H.323将TCP用于H.245控制信道、T.120数据会议及呼叫信令信道,从而保证控制信令和数据信息的可靠传输;利用不可靠但低时延的UDP 传输机制、IP多点广播技术和RTP/RTCP来实现音频/视频流的实时传输。
H.323建立了音频、视频数据流的压缩/解压缩标准,并保证了不同厂商设备具有相同在支持特性。H.32
3是运行于网络构架的顶层,所以可以从下层网络技术和带宽管理技术的进步中得益;此外,它还不限定于任何硬件和操作系统,能在PC、CA TV机顶盒、IP话机中使用。H.323还提供了带宽管理功能。网络经营者可以限制网络上同时产生的H.323连接数,以便有足够的带宽保证重要的连接不受到破坏。
H.323支持多点会议的多点传送,通过多点传送,多个站点可以读取同一数据流,从而提高了网络带宽的利用率;同时,H.323也支持不同类型网络之间的会议应用。
H.323终端必须支持H.245,以商议信道的利用和容量。另外,还需要三个组件:呼叫建立和传送呼叫信令的Q.931,用来与网闸通信的RAS (Registration/Admission/Status)协议,以及RTP/RTCP协议。T.120数据会议协议、视频编解码器和MCU为可选部件。呼叫信令信道用Q.931协议在两个终端之间建立连接。H.245控制信道传输管理H.323实体的控制消息,包括容量交换,打开、关闭逻辑信道,优先权请求,流控制信息,以及一般的命令和指示。RAS信令功能执行注册、允许进入、状态维护、带宽的改变,和网闸和终点之间联系的解除过程。在没有网闸的情况下,也就无须RAS了。
H.323标准下的通信可以看作话音、视频、数据、以及控制信令的综合。其中话音通信能力、Q.931呼叫建立功能、RAS控制、和H.245信令是必需的。呼叫控制功能是H.323终端的核心功能之一,包括呼叫建立信令,终端能力的交换,命令和指示信令,以及逻辑信道的打开和容量描述消息。所有的音频、视频、和控制信令都控制层面将数据流处理成消息,并交给网络接口。控制层面还执行逻辑成帧、序列编
号、检错纠错等功能(具体由Q.931,RAS,和RTP/RTCP完成)。总体的系统控制由H.245控制信道、Q.931呼叫信令信道、和RAS信道这三个分立的信令功能完成。H.245控制信道是传送管理H.323实体的控制消息的可靠信道。控制消息包括:能力交换、逻辑信道的开关、优先权请求、流控制消息、和一般的命令指示消息。H.245提供了独立的接收和发送能力,并且提供了向其它终端描述这些细节的方法;H.245控制信道一一对应于呼叫。
V oIP的数据封装
话音根据G.7XX标准取样并编码成帧,帧长约10到20ms。在无话音的时候,编码以简单短小的无声期帧,由收端识别并恢复成空白话音。帧内数据在需要传输多个声道话音时按声道顺序间插。
话音数据帧交给RTP进行封装,加上RTP头,其中包括话音编码方法的识别、有无冗余数据(都在净荷类型域中),用于恢复话音时同步的RTP包序号(16bit)以及时间戳(32bit)等;出于安全等方面考虑,RTP包的序号初始值是随机生成的,以防止攻击者对序号的预测;时间戳反映了RTP包中第一个8位组的取样瞬间,对于固定抽样率的话音数据,每个取样周期时间戳增加1。由于现有Internet上分组丢失的情况比较常见,为了保证一定的通话质量,收端对丢失的话音分组的恢复是必须的,从而在每个RTP包中将带上上一话音帧的冗余编码。冗余编码一般使用较大的压缩率,其数据量大大小于正常的编码方法,自然话音质量也较低。
封装好了的RTP包交给UDP,UDP对RTP包进行封装。UDP不对上层来的RTP 数据分段,只把一个RTP包封装成一个UDP包,然后递交给下层IP。IP层以现有的IPv4形式封装或以IPv6封装,并交给网络接口进行传输。
V oIP通话信令过程
IP网络上的话音通信信令分成内部信令和外部信令两部分。内部信令用于IP网络内部话音链路的建立、保持和撤消,通过IP网络本身的协议实现,即通过信令分组的传送来实现;外部信令用于IP网络边缘的话音代理与PSTN设备之间,遵循普通的电话信令标准,如No.7信令、ISDN的D通路信令等。
H.323终端、网闸、网关和MCU构成一个H.323区域。各区域连到公用网络上。
H.323终端之间的直接通信过程为:RAS信令用于进行预呼叫建立,PC向本地
H.323区域
H.323终端网关MCU
……
网闸
的网闸(Gatekeeper)发请求,网闸的功能是提供地址解析,许可控制(用户接入IP网络的权力认可),带宽控制管理,呼叫控制信令和呼叫权力鉴别等。本地网闸则根据PC请求中的对方号码与对方的网闸取得联系,获得对端PC的Q.931地址,并回送给源端PC;PC获得对网络的访问权后,源端PC开始呼叫建立过程,以Q.931(ISDN的UNI呼叫基本控制协议,说明IP协议运行在ISDN上)通过本地UNI 设备向对端PC发出呼叫建立Setup请求,对端通过本地的UNI设备以呼叫进程Setup Proceeding应答,网络设备接着以Connect向用户表示通过网络的连接已经建立,这个过程交换了分组接入ISDN所需的全部信息并确认、激活了相应的B通路;接着双方遵循H.245协议建立连接,H.245控制信道承载管理H.323系统操作的端到端控制信息,在每个方向上建立一个H.245控制信道,进行通信能力的相互交换确

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。