摘要: 本文主要说明采用RFC2833标准进行DTMF传送的方法和格式。
关键字:RFC2833,RTP,DTMF
一.IP电话传送DTMF的方式
DTMF就是双音多频,我们日常生活中拨打电话的过程中经常会用到,如拨打用户的分机号码,输入帐号和密码等。而随着IP电话的大量使用如何实现传送DTMF成为IP电话中的一个技术问题。
目前传送DTMF信号普遍有两种方式:带内传送和带外传送。
其中带外传送主要通过将DTMF消息封装到协议中进行传送,如H323协议中可以通过Q931和H245进行传送DTMF。
而带内传输主要有两种:透明传送和RFC2833方式。所谓透明传送就是将DTMF音作为语音一起打包到RTP中进行发送。由于网络丢包的影响,有时会造成DTMF信号丢失,而且DTMF音混合在语音包中,容易产生偏差,造成信号失真。所以目前普遍采用的是RFC2833方式,就是将DTMF数字按照一个的规则和格式组成一个数据包,然后封装到RTP中发送。接收端接收后进行解析,再还原成相应的DTMF信号,这种方式的优点是对丢包的容错性强以及识别差错率低。
二.RTP
在介绍RFC2833前,先来了解一下RTP(Real Time Protocal),该协议可参见RFC1889。RTP协议是IP电话中以及NGN中最经典的协议。无论采用H323,H248,MGCP还是SIP,这些都属于信令层的协议,他们之间进行互通、交换其最终目的是为了实现媒体流的收发。而所有的媒体流都是采用RTP协议,无论是视频,语音还是图象,包括本文所提到的DTMF都是建立在RTP的基础上的。
RTP协议用以传送实时数据。RTP协议通常运行在UDP层之上,二者共同完成运输层的功能。UDP提供复用及校验和服务,也就是通过分配不同的端口号传送多个RTP流。协议规定,RTP流使用偶数(2n)端口号,相应的RTCP流使用相邻的奇数(2n+1)端口号。因此,应用进程应在一对端口上接收RTP数据和RTCP控制数据,同时向另一对端口上接收RTP数据和RTCP控制数据。
RTP分组由RTP头部和净荷数据组成;RTP分组由UDP包来进行传输,通常一个UDP包仅含一个RTP分组,若采用一定的封装方法,也可以包含多个RTP分组;其中的RTP净荷就是RTP传送的语音数据。RTP分组的头部的格式如表1:
0-1
|
2
|
3
|
4-7
|
8
|
9-15
|
16-31
|
V
|
P
|
X
|
CC
|
M
|
PT
|
序号
|
时戳
|
||||||
同步源(
×××C
)标识
|
||||||
分信源(
CSRC
)标识(
0~15
个)
|
表1 RTP分组头部格式
RTP分组头部的各字段含义为:
1.V:RTP版本号。为“10”。
2.P:填充指示位。
P为“1”时表示分组结尾含有1个或多个填充字节。
3.X:扩展指示位。
X为“1”时,则表示固定头部后还有一个扩展头部,这种情况较复杂,很少使用。
4.CC:CSRC计数。
指示固定头部后的CSRC的个数
5.M:
由应用文档解释,通常不用。
6.PT:净荷类型
表示RTP分组的净荷类型。我们常用的有:
¨
“0”: G.711μ
¨
“8”: G.711A
¨
“4”: G.723.1
¨
“18”: G.729
¨
“96”:RFC2833
7.序号:
序号顾名思义就是表示RTP分组的次序。初值为随机数,每发送一个增加1。可供接收方检测分组丢失和恢复分组次序。
8.时戳:
表示RTP分组第一个字节的取样时刻。其初值为随机数,每个采用周期加1。如果每次传送20ms的数据,由于音频的采样频率为8000Hz,即每20ms有160次采样,则每传送20ms的数据,时戳增加160。
9.×××C:同步源标识(Synchronous Source)
表示信号的同步源,其值应随机选择,以保证同一个RTP会话中任意两个同步源的×××C标识不同。
10.CSRC:分信源标识(Contributing Source)
CSRC标识由混合器插入,其值就是组成复合信号的各个分信号的×××C标识,用以标识各个组成分信号的信源。RTP分组的头部最多可以包含15个CSRC标识,其数目由CC字段指明。
三.RFC2833
1.标准格式
RFC2833(RTP Payload for DTMF Digits, Telephony Tones and Telephony Signals)是IETF制定的,它规定了传送DTMF数字以及其他电话音和信号的标准。
0-7
|
8
|
9
|
10-15
|
16-31
|
event
|
E
|
R
|
volume
|
duration
|
图2 RFC2833 净荷格式
图2给出RFC2833的标准格式
events: 事件号,8位,用于说明本数据包的事件。RFC2833除了传送DTMF信号外还能传送传真,调制解调器,MF信号等。本文只关注DTMF信号,有关DTMF的事件看见表2。
Event
|
encoding (
十进制
)
|
0—9
|
0--9
|
*
|
10
|
#
|
11
|
A—D
|
12—15
|
Flash
|
16
|
表2DTMF的事件
volume: 音量,6位,用于说明DTMF信号的音频功率级,范围从(0~ -63dbm)。有效的DTMF范围是从0 到-36 dBm0;低于-55 dBm0则必须丢弃。
duration:数字信号的宽度,16位,以时戳单元表示。这样,事件从RTP时间戳表示的瞬间开始,并一直持续到该参数表示的长度。事件可以已经结束也可以没有结束。以8000赫兹
取样来说,本字段最长可以表示8秒。
E:结束位,1位,若设置为1表明数据包中含有事件的结束。因此上述的duration参数即测定了事件的完整宽度。
R:本字段为以后使用而保留。发送方必须将它设为0,接收端则应忽略它。
2.举例
图3 Sniffer抓包截图
图3是采用Sniffer软件所捕获的数据包,从上面可以看到RTP数据为:80 60 03 8e 7d 8b 6a d5 5a 12 02 80 05 f0。我们将该报数据按照格式还原如表3。
0-1
|
2
|
3
|
4-7
|
8
|
9-15
|
16-31
|
||||
V
|
P
|
X
|
CC
|
M
|
PT
|
序号
|
||||
2
|
0
|
0
|
0
|
0
|
96=0x60
|
910 (03 8e)
|
||||
时戳
|
||||||||||
2106288853 (7d 8b 6a d5)
|
||||||||||
同步源(
×××C
)标识
|
||||||||||
(
5a 12 02 80
)
|
||||||||||
Event
|
E
|
R
|
Volume
|
Duration
|
||||||
05
|
1
|
1
|
0
|
|
||||||
表3 DTMF ‘5’的数据格式
在表3中净荷类型为96,这是RFC2833中规定的,在实际情况下可以自己定义类型,只要通信双方能够确认即可。
对于同一个DTMF信号,其时戳是相同的,这样接收方可以通过判断时戳来剔除冗余信息。
3. 安全性
参考资料:
1. RFC1889 RTP: A Transport Protocol for Real-Time Applications
2. RFC2833 RTP Payload for DTMF Digits, Telephony Tones and Telephony Signals