感谢原作者:http://blog.csdn.net/rootusers/article/details/41864387
网络通信分为7层(OSI),是一个理论模型,由高到低分别是:
应用层:文件传输,电邮,文件服务等。HTTP,Telnet,DNS, FTP等协议
表示层:数据格式化,代码转换,数据加密等
会话层:解除或建立与别的接点的联系
传输层:提供端到端的接口 TCP UDP RTP
网络层:为数据包选择路由 IP ICMP RIP
数据链路层:传输有地址的帧以及错误检测功能
物理层:以二进制数据形式在物理媒体上传输数据
TCP/IP五层模型:应用层,传输层,网络层,数据链路层,物理层。
TCP/IP与低层次的数据链路层和物理层无关,这是其重要特点。
在Internet上传输音频和视频有两种方式:下载和流式传输。下载就是将文件下载到本地,才能播放,这是有延迟的,不能实现直播。流式传输是实现流媒体的关键,使用流式传输可以边下载边观看视频。由于Internet是基于分组传输的,所以客户端接收到的数据包会有延迟和乱序。为了降低延迟,在发送端往往采用降低质量或者高效压缩的方式进行处理,在接收端为了恢复时序,往往采用接收缓冲。
接收缓冲的意思就是先将接收到的数据缓存起来,然后根据数据包的封装信息,如包序号或者时间戳等,将乱序的包重新排序,然后将重新排序的包放入播放缓存进行播放。
RTP:全名实时传输协议(Real-time Transport protocol),顾名思义就是用来进行流媒体传输的,因而可以看成传输层的一个子层。
一个典型的协议体系结构如图一:
RTP建立在UDP之上,应用层之下,RTP用来为端到端的实时传输提供时间信息和流同步,但并不保证服务质量,服务质量由RTCP保证。
RTP与其他协议的关系:
但是也有人讲RTP看做应用层的协议,这是站在了开发者的角度。TCP/IP提供的是我们最常用的服务,但是RTP需要应用者自己去开发,从开发者的角度讲,
RTP的实现和应用层的协议的实现没不同,所以可以将RTP看成是应用层的协议。
一个协议的封装满足协议的功能的需求,RTP的封装如图所示:
版本号(V):2比特,用来标志使用RTP版本。
填充位(P):1比特,如果该位置位,则该RTP包的尾部就包含填充的附加字节。
扩展位(X):1比特,如果该位置位,则该RTP包的固定头部后面就跟着一个扩展头部。
CSRC技术器(CC):4比特,含有固定头部后面跟着的CSRC的数据
标记位(M):1比特,该位的解释由配置文档来承担。
载荷类型(PT):7比特,标识了RTP载荷的类型。
序列号(SN):16比特,发送方在每发送完一个RTP包后就将该域的值增加1,可以由该域检测包的丢失及恢复包的序列。序列号的初始值是随机的。
时间戳:32比特,记录了该包中数据的第一个字节的采样时刻。在一次会话开始时,时间戳初始化为一个初始值。即使
在没有信号发送时,时间戳的值也要随时间的不断的增加而增加。时间戳是去除抖动和实现同步不可缺少的。
同步源标识符(SSRC):32比特,同步源就是RTP包源的来源。在同一个RTP会话中不能有两个相同的SSRC值。该标识符是
随机获取的RFC1889推荐了MD5随机算法。
贡献源列表(CSRC List):0-15项,每项32比特,用来标志对一个RTP混合器产生的新包有贡献的所有RTP包的源。由混合器将这些有贡献的SSRC标识符插入表中。SSRC标识符都被列出来,以便接收端能正确指出交谈双方的身份。
RTP需要RTCP为其服务提供保证。
RTCP的主要功能是:服务质量的监视与反馈,媒体间的同步,以及多播组中成员的标志。在RTP会话期间,各参与者周期性的发送
RTCP包。RTCP包中含有以发送的数据包的数量、丢失的数据包的数量等统计信息,因此各参与者可以根据这些信息动态的
改变传输速率,甚至可以改变有效载荷类型。
RTCP也是用UDP来传输的。但是RTCP封装的仅是一些控制信息,因而分组很短,所以可以将多个RTCP包分组封装在
一个UDP包中。RTCP中有如下5组分组
以上5组封装大同小异。比如:SR
发送端报告分组SR用来使发送端以多播方式向所有接收端报告发送情况。SR分组的主要内容有:
相应的RTP流的SSRC,RTP流中最新产生的RTP分组的时间戳和NTP,RTP流包含的分组数,RTP流包含的字节数。
SR包的封装如下。
版本(V):同RTP包头域。
填充(P):同RTP包头域。
接收报告计数器(RC):5比特,该SR包中的接收报告块的数目,可以为零。
包类型(PT):8比特,SR包是200。
长度域(Length):16比特,其中存放的是该SR包以32比特为单位的总长度减一。
同步源(SSRC):SR包发送者的同步源标识符。与对应RTP包中的SSRC一样。
NTP Timestamp(Network time protocol)SR包发送时的绝对时间值。NTP的作用是同步不同的RTP媒体流。
RTP Timestamp:与NTP时间戳对应,与RTP数据包中的RTP时间戳具有相同的单位和随机初始值。
Sender’s packet count:从开始发送包到产生这个SR包这段时间里,发送者发送的RTP数据包的总数. SSRC改变时,这个域清零。
Sender`s octet count:从开始发送包到产生这个SR包这段时间里,发送者发送的净荷数据的总字节数(不包括头部和填充)。发送者改变其SSRC时,这个域要清零。
同步源n的SSRC标识符:该报告块中包含的是从该源接收到的包的统计信息。
丢失率(Fraction Lost):表明从上一个SR或RR包发出以来从同步源n(SSRC_n)来的RTP数据包的丢失率。
累计的包丢失数目:从开始接收到SSRC_n的包到发送SR,从SSRC_n传过来的RTP数据包的丢失总数。
收到的扩展最大序列号:从SSRC_n收到的RTP数据包中最大的序列号。
接收抖动(Interarrival jitter):RTP数据包接受时间的统计方差估。
上次SR时间戳(Last SR,LSR):取最近从SSRC_n收到的SR包中的NTP时间戳的中间32比特。如果目前还没收到SR包,则该域清零。
上次SR以来的延时(Delay since last SR,DLSR):上次从SSRC_n收到SR包到发送本报告的延时。
当应用程序建立一个RTP会话时,应用程序将确定一对目的传输地址。目的传输地址由一个网络地址和一对端口号组成,有两个端口,一个给RTP包,一个给
RTCP包,使得RTP/RTCP能正确的发送。RTP数据发向对应的UD端口,而对应的控制信号RTCP数据发向相邻的奇数UDP端口(偶数的UDP端口+1)。这样构成一个UDP端口对。
RTP的发送过程如下,接收过程相反:
1>RTP协议从上层接收流媒体信息码流(如H.263),封装成RTP数据包;RTCP从上层接收控制信息,封装成RTCP包。
2>RTP将RTP数据包发往UDP端口对中偶数端口,RTCP将RTCP包发往UDP端口的接收端口。
RTP的基础知识差不多就这么多,如果想深入研究RTP协议,推荐一个开源项目:jrtplib