网络摄像机编码标准及传输协议简析

     视频监控系统从第一代模拟系统(VCR)到第二代部分数字化系统(DVR/NVR),再到第三代完全数字化系统(网络摄像机,网络视频服务器),三个阶段的发展演变预示着全数字化视频监控系统不久将成为安防市场的主角。

    近年来,随着网络环境、嵌入式软硬件技术、计算机存储技术和处理技术的成熟,各种先进的视频图像处理技术不断出现,并伴随硬件成本逐年的持续下降,视频监控的广泛应用,及其数字化、网络化、智能化的发展出现突飞猛进的趋势。

    数字化视频监控系统的开放性、集成性和灵活性为视频监控系统的整体性能提升创造了必要条件,同时也为安防产业的增值服务提供了更加广阔的发展空间。

    在数字化视频监控系统里,网络摄像机充当着“内核”的角色。高度集成化的网络摄像机具备音视频的采集,编码、通过网络传输数据,管理PTZ和输入输出设备的功能,因此网络摄像机的功能将直接关系到网络视频监控系统方案的成功实施。

    从网络摄像机工作机制来讲,基本分为三大功能模块:音视频编码、PTZ和I/O设备管理、网络数据传输。

    网络摄像机音视频编码模块是指将采集到的图像和声音进行模数转换,然后对其进行编码,也就是对数字图像和声音进行压缩,以此减小原始图像和声音的比特流, 在保证某种音视频质量的前提下,尽量适应普通网络传输带宽。所以音视频编码采用了很多音频和图像编码技术去解决音视频质量和网络带宽之间的平衡问题。

    编码标准概述

    编码标准

    网络摄像机常用的视频编码标准有Motion-JPEG、H.263、MPEG-2、MPEG-4、H.264和AVS(中国标准)。

    Motion-JPEG是以提供序列JPEG图像的方式来提供视频。网络摄像机就象是数字静态图片照相机,捕捉单幅图像并将其压缩为JPEG格式。网络摄 像机每秒捕捉和压缩30张图像,并以连续图像流的方式通过网络发送到客户端。当帧率达到或超过16fps时,用户就可以浏览到感觉比较实时的画面。

    H.263压缩技术主要面对固定比特率的视频传输应用。但当画面中的物体移动时,仍使用固定比特率,图像的质量就会有所降低。由于H.263最初是为视频会议应用而开发的,因此对于要求更多图像细节的监视系统来讲并不适合。

    MPEG-2从MPEG-1压缩技术扩展而来,帧率被锁定在25fps(PAL)/30fps(NTSC),主要针对高质量数字视频(DVD),数字高清 电视(digital high-definition TV,HDTV),交互式存储媒体(interactive storage media,ISM),数字广播视频(digital broadc ast video,DBV),和有线电视(cable TV,CATV)。网络传输MPEG-2编码的视频流需要较高的带宽,在安防监控行业,很少有网络摄像机采用MPEG-2编码方案。

    MPEG-4从MPEG-2发展而来,MPEG-4编码方案内建很多工具,可用来降低比特率,以满足特定应用或场景对图像质量的需求。而且MPEG-4帧 率没有被锁定25fps(PAL)/30(NTSC)fps。采用MPEG-4编码方案的网络摄像机,往往在低带宽的网络环境下,通过降低帧率来完成视频 传输。MPEG-4引入很多工具来降低比特率,但针对网络视频实时性没有内建优化工具,编解码时间消耗增加,视频流传输往往表现出延迟,抖动现象。

    H.264编码方案,也称为MPEG-4(Part10)或高级视频编码(AVC),是H.263开发小组和MPEG-4开发小组合并后推出了新的下一代 视频压缩标准。该标准只增加了有限的编码复杂度,用于实现极高的数据压缩,该标准在比原先压缩标准的比特率小很多的条件下仍可提供高质量的视频。国内市场 新推出的网络摄像机,很多都采用了H.264编码方案,由于编解码计算复杂度高,能提供实时视频流的网络摄像机很少。很多的网络摄像机生产厂商都看好 H.264编码方案,随着各种优化技术的成熟,H.264编码方案将来可能会成为市场的主流。

    AVS编码方案是中国具备自主知识产权的第二代信源编码标准,编码效率比MPEG-2高2-3倍,与H.264相当,而且技术方案简洁。AVS通过一站式 许可政策,解决MPEG-4/H.264专利许可问题。2006年2月22日,国家标准化管理委员会颁布通知AVS视频部分正式成为国家标准。一些IT厂 商对该编码方案已经开始测试。虽然AVS标准已经包含视频会议与视频监控优化工具,但目前市场上还没有出现采用AVS编码的网络摄像机。由于其目的是绕开 国外高额的专利授权费用,很受到国内音视频设备上游生产厂商的关注。

    以上编码方案各有优缺点,Motion-JPEG编解码简单,可以提供高分辨率图像,也常在客户端实现智能化图像处理,但采用Motion-JPEG编码 方案,进行实时网络传输时占用网络带宽较高。对视频实时性要求较高的安防行业,大规模的网络视频监控系统网络带宽一般难以适应Motion-JPEG编码 方案。MPEG-2编码方案,除了被一些高端网络摄像机采用,普通网络摄像机几乎不采用MPEG-2编码方案,锁定的帧率,较高的比特流很难适用普通安防 行业的基础设施。MPEG-4编码方案传输实时网络视频占用的网络带宽较少,但其编解码复杂性较高,网络延迟,图像抖动问题需要重点考虑。H.264编码 方案,同等质量图像H.264编码产生的比特流比MPEG-4少20-40%,并且内建针对流媒体和无线网络的优化工具,相比MPEG-4其编码复杂度更 高,编解码时间更长,需要网络摄像机编码器提供很强的计算能力,成本较高。市场上目前还没有采用AVS编码方案的网络摄像机,暂时不予讨论。从编码效率比 较,MPEG-4是MPEG-2的1.4倍,AVS和H.264相当,都是MPEG-2两倍以上。

    针对安防行业的网络摄像机主要生产厂家,采用最多的编码方案是MPEG-4和Motion-JPEG,有些产品具有MPEG-4,Motion-JPEG 可切换编码标准,客户可以根据应用现场二者择一。还有同时提供MPEG-4和Motion-JPEG视频流输出的网络摄像机,兼顾实时浏览和高品质视频记 录应用。只采用MPEG-4编码方案的网络摄像机市场占有率较高,能满足普通应用市场需求,软硬件技术成熟,运行稳定,价格容易接受,在大规模的网络视频 监控系统中优势较大。随着H.264相关技术的成熟,最新的网络摄像机采用H.264编码方案的逐渐多起来,但只实现H.264编码方案里最基本的功能, 目前只有很少的网络摄像机才能提供4CIF(D1)实时视频,而且价格较高,很多H.264网络摄像机大多数是CIF分辨率或非实时视频,还不能满足安防 系统的要求。

    增值功能

    网络摄像机普遍具备视频动态侦测(VMD)功能,通过分析图像数据和一系列图像的不同,来确定现场发生的行为。这一功能既可内置在网络摄像机中,也可在应用软件中提供。网络摄像机针对图像处理的智能功能在此不做分析。

    常见的音频编码标准包括,G.711(PCM)以64kbit/s的速度提供高质音频;G.726(ADPCM)以32或24kbit/s的速度提供音 频;MP3以比特率约为100 kbit/s提供高质音频。网络摄像机通过这些音频编码标准,提供全双工音频对讲功能。

    网络视频监控系统的“核心”设备网络摄像机,不仅要通过网络传输高质量的音视频,并且要管理外部安防数字化设备。

    网络摄像机的PTZ和I/O设备管理模块,很容易实现网络摄像机远程控制,外部事件捕获、报警设备启动、事件触发视频记录等等这些智能化管理。网络摄像机 的输入和输出端口可以连接到外部探测设备,如门铃、探测器(烟雾、活动、声音、温度和温度传感器) 、灯(包括红外灯) 和报警继电器。使用摄像机的内置逻辑功能,可通过网络从远程PC或自动地进行管理。I/O触发事件可用于去除不必要的视频传输,也就是说,如果连接到网络 摄像机的传感器没有被触发,视频就不会通过网络发送。由于这些优点,这样网络摄像机就可以将这些外部设备归类为不同的触发事件,后端管理平台可以根据不同 的事件组合,定制出更加自动化的安防监控系统。由于PTZ设备的控制命令被网络传输到任何地点,使用户对于PTZ摄像机远程操作更加轻松,方便。由于网络 摄像机和后端管理软件可以独立解析不同厂家的PTZ设备协议,可以使不同协议的PTZ设备互相操作,保护了客户已有投资。市面上网络摄像机在这方面的功能 都很完善,主要的差别是支持I/O端口的数量,I/O事件响应的灵敏度。

    传输协议概述

    传输协议

    网络摄像机提供很多的基于IP网络的传输协议,以尽可能地保证音视频数据,PTZ控制数据网络传输质量。实时视频流经过IP网络传输,通过多种协议组合,适应各种复杂的网络传输环境。

    RTP(Realtime Transport Protocol),实时传输协议,其专门针对实时流媒体而设计, RTP的基本功能是将几个实时数据流复用到一个UDP分组流中,这个UDP流可以被发送给一台主机(单播模式),也可以被传送给多台目标主机(多播模 式)。因为RTP仅仅封装成常规的UDP,理论上路由器不会对分组有任何特殊对待,但现在高级的路由设备都有针对RTP协议优化选项。RTP协议的时间戳 机制,不仅减少了抖动的影响,而且也允许多个数据流相互之间的同步,这样可以很方便地基于I/O事件对视频图像进行字幕添加,网络摄像机往往将音视频编码 数据封装成RTP分组。

    RTCP(Realtime Transport Control Protocol)实时传输控制协议,其是RTP的姊妹协议,它处理反馈、同步和用户界面等,但是不传输任何数据。它的主要功能是用来向源端提供有关延 迟、抖动、带宽、拥塞和其它网络特性的反馈信息,编码进程可以充分利用这些信息。因此当网络状况较好时,可以提高数据速率(从而达到更好的质量),而当网 络状况不好时,它可以减少数据速率。通过连续的反馈信息,编码算法可以持续地作相应的调整,从而在当前条件下尽可能地提供最佳的质量。

    RTSP(Real Time Streaming Protocol)实时流协议,RTSP协议利用推式服务器(push server)方法,让音视频浏览端,发出一个请求,网络摄像机只是不停地向浏览端推送封装成RTP分组的音视频编码数据,网络摄像机可以用很小的系统开 销实现流媒体传输。

    HTTP(HyperText Transfer Protocol)超文本传输协议,网络摄像机通过HTTP协议提供Web访问功能,很方便地将音视频数据经过复杂网络传输,但实时音视频支持很不理想。

    UDP(U ser Datagram Protocol)数据报协议,是最基本的网络数据传输协议,利用IP协议提供网络无连接服务,常用来封装实时性强的网络音视频数据,即使网络传输过程中发生分组丢失现象,在客户端也不会影响音视频浏览。

    TCP(Transmission Control Protocol)传输控制协议,利用IP协议提供面向连接网络服务,为在不可靠的互联网络上提供一个可靠的端到端字节流而设计。TCP协议往往要在服务 端和客户端经过多次“握手”才能建立连接,因此利用TCP传输实时性较强的音视频流开销较大,如果网络不稳定,音视频抖动的现象明显。利用其可靠性常用来 传输网络摄像机管理命令,如PTZ,I/O设备控制命令。

    传输协议组合

    网络摄像机往往应用RTSP、RTP、RTCP、HTTP、UDP、TCP协议的不同组合来传输实时性较强的音视频流。常见的协议组合如下。

    RTP+RTSP协议组合,这种协议组合(RTP可以用TCP、UDP协议封装,RTSP用TCP协议封装),在正常网络环境里,可以保证客户端浏览实时音视频,厂商往往推荐网络摄像机采用这种协议组合。一些网络设备也常常支持RTP+RTSP多播模式。

    RTP/RTSP协议组合,RTP分组封装成RTSP分组,有些网络防火墙只让RTSP协议分组通过。但网络摄像机又要以RTP协议提供实时音视频。这种组合方式在没有办法的情况下增加了网络负载和客户端管理系统的复杂度。

    RTP/RTSP/HTTP协议组合,在RTP/RTSP的数据基础上增加了HTTP封装,这种协议组合主要是为了适应网络防火墙只允许使用HTTP协议的网络环境。虽然网络负载加大,但网络摄像机可以适应更复杂的互联网环境。

    UDP(TCP)协议,一些网络摄像机为了适应国内网络带宽状况不佳的状况,没有利用RTP+RTSP应用层协议封装音视频数据,对音视频流只采用UDP 或TCP传输层协议封装。这样音视频流就可以利用很小的网络带宽传输流媒体。这种协议组合也可以提供类似RTP+RTSP高级功能,但对网络路由设备基于 RTP+RTSP组合优化特性不能利用。

    UDP(TCP)/HTTP协议组合,将音视频流数据封装成HTTP数据分组,然后用UDP(TCP)协议传输到客户端。这种协议方式可适应复杂的互联网环境,可以穿透大多数网络防火墙。

    各种传输层协议组合保证了音视频和PTZ数据实时传输的可靠性,但网络摄像机内置的处理器计算能力限制,导致并发访问的用户数量有限。这样往往不能满足并 发访问要求较高的应用环境,网络摄像机往往利用具备多播功能的网络传输设备,响应更多的并发访问要求。有些网络摄像机客户端软件功能强大,利用数据转发机 制,充当可以响应更多并发访问用户的“虚拟网络摄像机”,这种方式适应于也适应PTZ网络摄像机。对大规模数字化视频监控网络建设有重要意义。

    还有的网络摄像机提供一些FTP(文件传输协议)、SMTP(邮件传输协议)、DDNS(动态域名解析)协议,以增强网络摄像机在互联网环境应用。笔者观 点,这些网络协议对安防监控系统没有太多的帮助,反而要引入好多外部FTP、SMTP、DNS服务器去配合网络摄像机,这样对整个数字安防监控系统的管理 引入了新的复杂性,增加了不稳定性,可能要花更多的精力去管理非主要业务。有的网络摄像机也提供一些高级网络管理协议,如ICMP、SNMP、IGMP、 ARP协议,帮助用户去管理网络。

    应用现状

    随着有线和无线网络带宽成倍的增加,网络视频传输的带宽成本将越来越小,大规模网络视频监控系统建设已成为可能。网络摄像机通过以太网接口将采集的音视频 数据;I/O、PTZ控制数据经过IP网络传输到远程管理系统。网络摄像机的网络数据传输模块,所具备的功能决定了网络摄像机适用的网络类型、网络音视频 延迟和抖动的处理能力、是否具备穿透防火墙以适应复杂的互联网环境。

    以太网供电技术

    新的室内网络摄像机采用以太网供电技术,减少了网络摄像机外部连接线缆。以太网供电(Power over Ethernet,PoE)是一种将供电集成到标准局域网设备中的技术。PoE技术遵循于IEEE 802.3af标准,并且在不降低网络数据通讯性能、缩小网络范围的基础上对网络设备进行供电。这一标准可在交换机端提供15.4W的电源,摄像机端为最 大12.9W的电源。类似PTZ摄像机和快球的室外摄像机,它们的功率通常会超过上述的值,因而PoE功能显得不太适合。一些厂商也提供了非标准的产品来 满足此类应用的需求,但需要注意的是,因为这些产品是非标准的,在不同品牌的产品间也就没有了互操作性。

    无线网络技术

    如今,尽管大多数建筑中都已经部署了有线网络,但有时候对客户来讲,无线网络解决方案在功能性和节约成本方面仍然具有很强的吸引力。例如,当网络布线工作 必须要对内部建筑产生破坏才能完成时、或者在一些需要定期地改变摄像机位置,又不想每次重新布线的场所(例如零售商店),无线网络技术将变得非常有用。在 另外一种常见应用场景中,无线网络技术能够方便地将两座建筑物或场所连接起来,而不需要昂贵和复杂的地面施工。

    无线通信技术主要分为两大类:无线局域网(Wireless LAN,WLAN)是指跨越距离较短,通常位于室内的网络。无线局域网络标准已经非常完善,不同厂家生产的无线局域网设备也能够很好的协同工作;无线网桥 (Wireless bridges)当需要通过高速链路连接不同的建筑物或场所时,则必须建立一条能够进行远距离高速传输的点对点链路。微波和激光是实现这种功能的两种常用 技术。

    无线局域网802.11x系列标准,802.11g标准是网络摄像机支持最普遍的无线网络标准,在室外环境下,它能够提供最大约24 Mbps实际吞吐量,最大有效距离为100米,该标准使用2.4 GHz波段,理论带宽可以达到54 Mbps。

    网络摄像机提供的无线接入功能,由于无线网络通信本质方面的原因,在无线网络所覆盖的范围内,任何拥有一台无线设备的人都可以连接到网络中并使用共享设 备,因此无线网络必须提供良好的安全机制。无线网桥用来连接地域空间跨度比较大和多个无线局域网络,采用微波技术的设备较多,我们应该着重考虑一下,如果 在这样的环境里,网络摄像机是否支持移动IP。

    安全性

    网络摄像机的安全性很值得关注,在访问网络摄像机时,一般都提供多级用户管理机制和IP过滤机制,不同级别的用户(IP地址)有不同的访问权限,这种机制很好地满足了分布式网络监控系统的安全高效管理要求。

    音视频流通过加密处理,可以有效地防止在公共网路传输过程中被窃听。一些网络摄像机在视频编码时采取了有限的加密措施,但增加了网络传输负载、客户端解码 的复杂性和网络摄像机成本。而且政府部门对这种网络摄像机的加密标准未必采纳。安防监控行业是否可以考虑将视频流的加密功能转移到其它辅助系统来完成,减 少系统核心设备网络摄像机的工作负担,增强系统稳定性。

    结语

    随着网络摄像机快速的普及应用,安防行业将迎来数字化革命,围绕着核心设备网络摄像机,将会出现具有更多的高新技术的产品,我个人观点倾向于市场主流的音 视频编码方案、具备很强的PTZ或输入输出设备管理能力、网络传输机制简单有效的网络摄像机,用这样的网络摄像机去建设稳定可靠的数字化安防监控系统,使 人们从繁重的安防劳动中解放出来。

你可能感兴趣的:(音视频编解码,嵌入式)