【摘要】
AVS+是我国自主创新的视频编码技术,可解决广播电视行业面临的频道资源问题。为消除卫星、有线、地面数字电视及互联网电视和IPTV等领域视频编解码过度到AVS+标准的应用障碍,我们开发了高密度AVS+实时转码设备,本文介绍了在该设备实现过程中的主要技术、问题和解决办法,包括高密度模块化设计、软硬件协同、视频转码和音频直通技术。
1 引言
2012年7月10日,国家广播电影电视总局正式颁布了《广播电视先进音视频编解码 第1部分:视频》行业标准,即GY/T257.1-2012,简称 AVS+,AVS+在 AVS1-P2(即 GB/T 20090.2—2006)的基础上,增加了若干关键技术,编码效率得到了显著地提高,更适合广播电视应用。近年来,我国高清电视频道数量逐步增多,3D 电视频道已经开播,无论是卫星、有线还是地面数字电视系统,随着开播频道的增多,传输带宽日趋紧张。AVS+是我国自主创新的视频编码技术,具有更高的编码效率,与同类国际标准 H.264/AVC 编码效率相当,用 AVS+标准作为广播电视的视频编码,可解决广播电视行业面临的频道资源问题。
为配合国家政策导向和市场需求,消除卫星、有线、地面数字电视及互联网电视和IPTV等领域视频编解码过度到AVS+的应用障碍,伟乐科技开发了高密度AVS+转码设备,在1U标准机箱内实现了10路高清AVS+视频转码为H.264,同时实现了音频转码或直通。本文将介绍在该设备研发、实现过程中的几种主要技术,包括模块化设计技术、软硬件协同技术、视频转码技术和音频直通技术。
2 实现主要技术介绍
2.1 高密度模块化设计技术
伟乐科技DMP设备整体结构如图 1所示,在1U标准机箱内固定装配了二个涡轮风扇,一个主板模块,可选最多6个子模块,所有子模块与主模块之间采用统一通用的高速自定义接口,子板模块可以插入任何一个插槽。这样,用户可以根据自身实际的输入和输出需求,选择满足要求的子板模块即可快速搭建一套高密度、大容量音视频处理系统。该设备目前配套有50多款子板模块,全面解决接收、编转码、解码、加扰、调制、转调和复用等应用需求。
图 1 DMP:高密度高清AVS+转码
为了实现高密度(最大10路)高清AVS+节目转码为H.264的业务需求,AVS+转码设备由DMP主板、IPASI子板和5块AVS+转码子板组合而成。其中主板负责整机控制、子板模块接口、流复用和网管等功能;IPASI子板提供的TSIP(RJ45或SFP)和ASI接口用于信号输入/输出;AVS+转码子板输入为2路AVS+、MPEG2或 H.264 格式的节目码流,视频转码输出为H.264格式,音频转码为MPEG1 Layer-I/II标准格式或直通(透传)输出。
图 2 高清AVS+转码子板模块
图 2所示之AVS+转码子板中的FPGA软件负责接收、解析主板发来的各种参数和上报子板状态,同时把有关转码参数设置到解码和编码芯片;解码芯片软件能够自适应识别输入码流的编码格式(AVS+、H.264、MPEG2等),完成需转码高标清节目的解码、播放和DV信号输出(BT.1120);编码芯片则完成DV输入信号按用户设置参数的重新编码输出给FPGA,由逻辑电路处理后再返回主板。
2.2 软硬件协同技术
由于设备支持的子板模块数目多、节目通路多,系统的复杂程度也随之增加。软件和硬件设计需要协同考虑,才能使系统的性能最优。相对来说,软件在处理协议层方面,具备自身优势,而对于实时性和大宽带并发处理要求的场合,则难以胜任。而数字逻辑电路,在实时处理与高带宽并发处理场合,具备天然优势,但对于复杂的协议处理,通常由于开发工作量较大使得开发周期长,性价比较低。
图 3为本设备主模块内部软硬件设计框图,对于TS流的处理,需要保证TS流处理的效率和实时性,全部由数字逻辑电路实现。对于源节目表的解析、复用后节目表的重构、复用后去向的配置、日志告警的显示、用户交互接口以及网管管理部分,由于涉及协议层面的处理,由软件实现。
具体软硬件主要工作配合:主板模块数字逻辑电路接收子板模块的并行TS流,缓存后进行复用处理。复用后,根据软件配置的节目表过滤条件,将信源的节目表上报给软件;软件得到所有信源的节目表后,通过解析节目表,就可以通过网管将源节目信息显示给用户。软件还会根据用户配置的节目去向,得到去向查找表并构造各输出通道的最新的节目表,再将这些表配置到数字逻辑器件提供的内部存储器中。这样,数字逻辑电路将软件重新构造表复用到TS流中,即可保证复用后各输出通道都有正确的节目表。同时,通过查找去向表,即可将TS流正确地分发给各个子模块。
另外,对于系统产生的日志和告警,软件很容易呈现给用户。同时,系统的配置管理,采用Internet方式,涉及到TCP/IP层协议的处理。这些协议处理,如果用数字逻辑电路来实现,工作量和实现难度将非常巨大,而软件则通常有专门的协议栈底层支持,只需要简单配置即可实现。
通过上述的软硬件分工协调配合,使AVS+转码系统达到最优的性价比。
图 3 主模块内部软硬件协同处理
2.3 视频转码技术
视频转码是指将某一视频格式转换为另一视频格式的过程,最简单的实现方式是基于像素域的级联式体系结构:先将视频暂时解码,然后重新编码成需要的格式和数据,即像素域转码。像素域转码能够实时任意进行视频转码(编码标准或码率、帧率及分辨率等),是应用的需要和处理器性能快速发展的结果,现在已经得到了广泛的使用。
图 4 AVS+转码原理框图
由于目前市场上支持AVS+解码的专用芯片并不多,我们选用了国内知名的X思带有ARM Cortex A9 双核、内置NEON的专用芯片,用于AVS+(支持到 Level6.0)的视频解码,芯片的最高支持1080p@60fps解码以及完善的图形和显示处理能力。
为了达到专业级的应用和可靠性要求,我们根据厂家提供的参考电路,重新进行了器件、降额等可靠性设计工作,使全部解码部分器件的使用应力低于其额定应力;为了降低芯片工作温度,通过配置软件对内核和DDR进行了降频处理,热设计提高了电路的长时间工作稳定性。
根据MPEG2(ISO13818)和相关标准,正常解码器同步算法如下:
(1) 从输入码流的包头中解出时间信息PCR送入到系统时间时钟(STC)恢复电路;
(2) STC恢复电路在接收到每一个新的PCR时,进行本地系统时间时钟校准;
(3) 解复用器从输入码流的PES包头中解出显示时间标签PTS和解码时间标签DTS,并送入到基本流解码器中;
(4) 基本流解码器在接收到新的PTS/DTS存入对应的FIFO中进行管理;
(5) 对于没有DTS/PTS的显示单元,需要对其时间标签进行插值,并送入到FIFO中;
(6) 每一显示单元开始解码前,用其对应的DTS与STC进行比较,当STC与DTS相等时开始解码;
(7) 每一显示单元开始显示前,用其对应的PTS与STC进行比较,当STC与PTS相等时开始显示。
经过测试、分析解码软件底层驱动以及芯片设计人员确认,X思的这款解码芯片设计上不具备上述的STC恢复电路,导致解码时钟不能跟踪编码源端时钟,这对本文2.4节讲的音频直通功能产生了严重影响,使设置为固定延时的直通音频有可能在长时间解码过程中逐步超前转码后的视频,表现为严重的唇音同步问题。为此,我们通过略微加快视频解码速度,确保视频解码缓存处于非增长的稳定状态,解决了直通音频的唇音同步问题。
编码部分我们选用了XX通的高集成度、低功耗专业级H.264编码芯片,该芯片的最大特点是内部集成了编码所需的存储器(512Mb FCRAM),不需要外部DDR,电路实现体积小;芯片最高支持1080p@60fps编码,这时的功耗仅0.7W;FPGA通过串口即可完成芯片配置、参数设置和状态上报等控制及连接。这3个特点保证了我们的子板模块和整机的高密度设计。对于研发、测试过程中出现的长时间编码中断等输出不稳定情况,XX通提供了带有TBC校正功能的微码,解决了解、编码时钟信号匹配或稳定性造成的问题。
由于解码芯片支持多路图形和视频输入的硬件叠加,5层OSD等功能,我们的AVS+转码子板模块可以在将来实现参考文献[4]中提到的在视频流中嵌入图标、水印等广义视频转码的功能。
2.4 音频直通技术
用户要求转码视频流中带有的Dolby音频能够不做任何处理直通(透传)输出。直通的音频不经过解码、再编码,因此会比视频快,导致最终输出的音视频出现不同步问题。这就需要根据视频解码+编码总时延,把原来的Dolby音频数据在FPGA内部缓存(FIFO),滞后一段时间后再输出。
由于节目源和编码参数不同,需要滞后的时长也不相同,缺省设置的延时时间设计成可以通过软件界面修改。延时后的直通音频PID带有PTS时间戳,以这个时间戳为基准,通过逻辑电路修改视频转码输出的TS PCR和视、音频PID数据的PTS/DTS,然后经过主板复用输出,即可达到直通音频和转码视音频同步的目的。
3 结论
本文总结了高密度AVS+实时转码设备的研究和实现过程,并详细介绍了其中的主要技术原理、问题和解决方法,并已成功应用到该转码设备中。上市产品符合参考文献[1]中的转码器产品技术特点、基于 AVS+的端到端系统解决方案2和技术应用指导意见,并在国内部分省级广电网络应用中证明设备运行稳定、可靠。为伟乐科技公司高密度AVS+实时转码和其它设备在卫星、有线、地面数字电视及互联网电视和IPTV等领域的大规模推广奠定了坚实的基础。