国标号GB/T 20090.2-2006 AVS视频批准

标准工作简况与进展
  AVS是我国具备自主知识产权的第二代信源编码标准。顾名思义,“信源”是信息的“源头”,信源编码技术解决的重点问题是数字音视频海量数据(即初始数据、信源)的编码压缩问题,故也称数字音视频编解码技术。显而易见,它是其后数字信息传输、存储、播放等环节的前提,因此是数字音视频产业的共性基础标准。
  国际上音视频编解码标准主要两大系列:ISO/IEC JTC1制定的MPEG系列标准;ITU针对多媒体通信制定的H.26x系列视频编码标准和G.7系列音频编码标准。1994年由MPEG和ITU合作制定的MPEG-2是第一代音视频编解码标准的代表,也是目前国际上最为通行的音视频标准。
  经过十年多演变,音视频编码技术本身和产业应用背景都发生了明显变化,后起之秀辈出。目前音视频产业可以选择的信源编码标准有四个:MPEG-2、MPEG-4、MPEG-4 AVC(简称AVC,也称JVT、H.264)、AVS。从制订者分,前三个标准是由MPEG专家组完成的,第四个是我国自主制定的。从发展阶段分,MPEG-2是第一代信源标准,其余三个为第二代标准。从主要技术指标——编码效率比较:MPEG-4是MPEG-2的1.4倍,AVS和AVC相当,都是MPEG-2两倍以上。
  可以推测,由于技术陈旧需要更新及收费较高等原因,MPEG-2即将退出历史舞台。MPEG-4出台的新专利许可政策被认为过于苛刻令人无法接受,导致被众多运营商围攻,陷入无法推广产业化的泥沼而无力自拔,前途未卜。而AVS是基于我国创新技术和部分公开技术的自主标准,编码效率比MPEG-2高2-3倍,与AVC相当,而且技术方案简洁,芯片实现复杂度低,达到了第二代标准的最高水平;而且,AVS通过简洁的一站式许可政策,解决了AVC专利许可问题死结,是开放式制订的国家、国际标准,易于推广;此外,AVC仅是一个视频编码标准,而AVS是一套包含系统、视频、音频、媒体版权管理在内的完整标准体系,为数字音视频产业提供更全面的解决方案。综上所述,AVS可称第二代信源标准的上选。
  AVS标准是《信息技术 先进音视频编码》系列标准的简称,AVS标准包括系统、视频、音频、数字版权管理等四个主要技术标准和一致性测试等支撑标准。在2003年12月18-19日举行第7次会议上,工作组完成了AVS标准的第一部分(系统)和第二部分(视频)的草案最终稿(FCD),和报批稿配套的验证软件也已完成。2004年12月29日,全国信息技术标准化技术委员会组织评审并通过了AVS标准视频草案。2005年1月,AVS工作组将草案报送信息产业部。3月30日,信产部初审认可,标准草案视频部分进入公示期。2004年度第一季度(第8次全体会议)正式开始“数字版权管理与保护”标准的制定,目前已近尾声。2005年初(第12次全体会议)完成了第三部分(音频)草案。
  2005年4月30日,AVS标准视频部分通过公示,在标准道路上迈出决定性一步。2006年2月22日,国家标准化管理委员会颁布通知:《信息技术 先进音视频编码》第二部分视频于2006年3月1日起开始实施。AVS视频部分正式成为国家标准,成为震动业内外的一件大事,国家和各部委领导纷纷发来贺信和题词,对AVS的工作给予了高度评价,并鼓励工作组再接再厉,再创辉煌。接下来,标准其他部分将继续开展工作,陆续进入标准报批和审核程序。


AVS与国际标准MPEG的比较

  一、技术对比

AVS视频与MPEG标准都采用混合编码框架(见图1),包括变换、量化、熵编码、帧内预测、帧间预测、环路滤波等技术模块,这是当前主流的技术路线。AVS的主要创新在于提出了一批具体的优化技术,在较低的复杂度下实现了与国际标准相当的技术性能,但并未使用国际标准背后的大量复杂的专利。AVS-视频当中具有特征性的核心技术包括:8x8整数变换、量化、帧内预测、1/4精度像素插值、特殊的帧间预测运动补偿、二维熵编码、去块效应环内滤波等。

图 1 典型视频编码框架




AVS视频编码器框图如下图所示。




图 2 AVS视频编码器框图


  AVS视频标准定义了I帧、P帧和B帧三种不同类型的图像,I帧中的宏块只进行帧内预测,P帧和B帧的宏块则需要进行帧内预测或帧间预测,图中S0是预测模式选择开关。预测残差进行8×8整数变换(ICT)和量化,然后对量化系数进行zig-zag扫描(隔行编码块使用另一种扫描方式),得到一维排列的量化系数,最后对量化系数进行熵编码。AVS视频标准的变换和量化只需要加减法和移位操作,用16位精度即可完成。

  AVS视频标准使用环路滤波器对重建图像滤波,一方面可以消除方块效应,改善重建图像的主观质量;另一方面能够提高编码效率。滤波强度可以自适应调整。

  AVS标准支持多种视频业务,考虑到不同业务之间的互操作性,AVS标准定义了档次(profile)和级别(level)。档次是AVS定义的语法、语义及算法的子集;级别是在某一档次下对语法元素和语法元素参数值的限定集合。为了满足高清晰度/标准清晰度数字电视广播、数字存储媒体等业务的需要,AVS视频标准定义了基准档次(Jizhun profile)和4个级别(4.0、4.2、6.0和6.2),支持的最大图像分辨率从720×576到1920×1080,最大比特率从10 Mbit/s到30 Mbit/s。



  DCT(Discrete Cosine Transform):离散余弦变换

  VLC(Variable Length Coding):变长编码

  CAVLC(Context-based Adaptive Variable Length Coding):基于上下文的自适应变长码

  CABAC(Context-based Adaptive Binary Arithmetic Coding):基于上下文的自适应二进制算术编码

  FMO(Flexible Macroblock Ordering):灵活的宏块排序

  ASO(Arbitrary Slice Ordering):任意条带排列

  二、主观评价和客观测试

  压缩效果的评价标准有主观评价和客观评价两种,各有优缺点。主观评判是聘请专门的评价人员来比较压缩之后再恢复的视听效果和原始效果的差异,通常是在专门的视听环境中按照一定的规则进行主观评分。客观评判则是通过一种具体的算法来统计多媒体数据压缩结果的损失,例如信噪比SNR(即信号与噪声之比的对数)。主观评判和客观评判有时相差很大,因此衡量一个算法的好坏就需要在这二者之间找到一个平衡点。对一套标准的评价,通常开发过程中采用客观评价的方法,但最终要得到主观评价的确认。

  1.MPEG-4 AVC视频标准主观测试

  2002年10-12月,MPEG 组织了专题组对AVC (ISO/IEC 14496-10 | ITU-T Rec. H.264) 与MPEG-4 Visual (ISO/IEC 14496-2)和MPEG-2 Video (ISO/IEC 13818-2)标准进行了测试。测试在FUB/ISCTI (意大利)、NIST (美国)和TUM (德国)进行,测试结果表明AVC的编码性能有显著提高。

本次测试标准清晰度(SD)和高清晰度(HD)采用的测试条件(视频序列和码率)
如下表:





  图像质量主观评价试验依据ITU-R BT.500-11 《Methodology for the subjective assessment of the quality of television pictures(电视图像质量主观评价方法)》(下面可以看到AVS的两次主观测试同样采用的是这个测试标准)。测试结果如下表:



  由表可以看出,12个可比项中有8个的N大于等于1.5,有3个大于等于2,有一个等于4。



  由表可以看出,AVC与优化的MPEG-2高清编码器比,9个可比项中有7个的N大于等于1.7,有3个大于等于2,有一个等于3.3。



 由表可以看出,AVC与MPEG-2参考软件比,9个可比项中有8个的N大于等于1.7,有4个大于等于2。

  总体上讲,AVC与MPEG-2对比,85个比对中66对MPEG-2的码率要达到1.5倍才能与AVC达到同样质量,其中51对MPEG-2码率要达到AVC的2倍才能达到AVC的质量。换句话说,在60%的情况下,AVC的编码效率能够达到MPEG-2的两倍。

  鉴于AVC的编码效率能够达到MPEG-2的2倍,我国有关测试机构在测试AVS时,通常把AVS视频的码率也设在MPEG-2典型码率的二分之一或更低,也就是测试AVS编码效率是MPEG-2的2倍或更高的情况下的AVS视频的编码质量是否能够广播要求。

  2.AVS主观测试―― 国家广播电视产品质量监督检验中心数字电视用户端产品测试实验室

  2004年11月15日至12月26日,依据数字音视频编解码技术标准工作组的委托,国家广播电视产品质量监督检验中心数字电视用户端产品测试实验室对工作组送检的AVS视频编/解码方案组织了图像质量主观评价试验。通过对委托方提供的AVS软编/解码器的主观评价试验,评价AVS视频压缩方案的性能。

  图像质量主观评价试验依据ITU-R BT.500-11 《Methodology for the subjective assessment of the quality of television pictures(电视图像质量主观评价方法)》和ITU-R BT.710-2《Subjective assessment of image quality in high-definition television(高清晰度电视图像质量的主观评价)》,采用双刺激连续质量标度(DSCQS)法评价AVS视频编/解码系统处理后的图像质量相对于未经压缩的原始图像质量的差别。

  本次视频图像质量主观评价的目的是通过比较经AVS编/解码系统处理过的图像质量与原始素材图像质量的差别来评价AVS视频编/解码方案的总体性能,评价素材的选择内容应广泛且严酷度适当。所选择的测试序列应能反应图像的亮度再现、彩色再现、静态空间分辨率、动态空间分辨率、运动再现、视在深度效果、临场感、闪烁性能和熟悉的色调的再现等特性。希望通过所选择的节目能够充分、准确地反映被评价的视频编/解码方案的性能。测试序列包括8个高清晰度节目和8个标准清晰度节目,每段节目时间长度为10s~20s。

  高清晰度图像测试序列的被评价对象与原始素材的平均得分差在1.6和6.0之间,总平均分差为3.6,说明评价人员认为被评价对象的图像质量与原始素材的图像质量差别很小。

  统计结果表明, AVS视频编/解码方案在图像格式为1920×1080P/25Hz、压缩码率为6Mbps时,被评价对象的图像质量与原始素材图像质量的差别很小,不易察觉。

  8个标准清晰度图像测试序列的被评价对象与原始素材的平均得分差在1.1 和10.5之间,总平均分差为6.4。除序列2 外,其他7 个测试序列的标准偏差均在6.4 至8.6 之间,说明评价人员对这些测试序列打分的离散度较小。

  试验结果表明AVS 视频编/解码方案在图像格式为720×576I/50Hz、压缩码率为2.5Mbps 时,可察觉经编/解码处理后的被评价对象与原始素材图像质量的差别,但差别小。

  本次测试表明,AVS视频码率不到MPEG-2典型码率二分之一(标清)和三分之一(高清)的情况下,质量损失很小,可以达到广播要求。

  3.AVS主观测试――国家广电总局广播电视规划院

  2005年04月至9月,国家广电总局广播电视规划院受AVS工作组挂靠单位中国科学院计算技术研究所委托,对经过AVS参考软件编解码后的标准清晰度和高清晰度视频进行主观评价,评价其对源图像的质量损伤程度,完成了《AVS视频压缩质量主观评价》测试报告(附件)。

  本次测试的依据蔥x]愕缧幸当曜糋Y/T 134-1998《数字电视图像质量主观评价方法》和ITU-R BT.500-11、ITU-R BT.1210-3《Test Materials to be used in Subjective Assessment(用于主观评价的测试材料)》标准。标清测试采用6个国际标准图像序列,高清采用6个国家标准图像序列。

  测试结果汇总如下:



  考虑到目前使用MPEG-2标准实施高清电视广播时,一般使用20Mbps的码率,使用MPEG-2标准实施标清电视广播时,一般使用5-6Mbps的码率,对照本次测试结果可以得知,AVS码率为现行MPEG-2标准的一半时,无论是标准清晰度还是高清晰度,编码质量都达到优秀。码率不到其三分之一时,也达到良好到优秀。因此相比于MPEG-2视频编码效率高2~3倍的前提下,AVS视频质量已完全达到了大范围应用所需的“良好”要求。对比MPEG标准组织对MPEG-4 AVC/H.264的测试报告,AVS在编码效率上与其处于同等技术水平。

  4.AVS与MPEG标准的客观测试

对视频编码标准进行客观评价的常用方法是峰值信噪比PSNR。表9、表10分别给出了AVS与MPEG-2标准以及AVS与MPEG-4 AVC/H.264标准main profile的客观编码性能。结果为相同码率条件下峰值信噪比PSNR的增益。可以看出,AVS相对于MPEG-2标准编码效率平均提高2.56dB,相比于H.264标准编码效率略低,平均有0.11dB的损失。



  下面是另一组视频序列的AVS和H.264的性能比较实验结果。实验使用的AVS视频编码器是RM 5.0a,H.264编码器是JM 6.1e。实验序列包括720p和1080i序列。编码参数见表4。表11-12给出了AVS视频标准相对H.264在PSNR上的增益。图5到图6给出了PSNR曲线。









  从上面的数据可以看出,在逐行编码方面,AVS视频标准的性能与H.264基本一致;在隔行编码方面,由于AVS视频标准目前只支持图像级帧/场自适应编码,平均有0.5dB的性能差距。

  三、复杂度对比

  表13对AVS与H.264的计算实现复杂性进行扼要对比,大致估算,AVS解码复杂度相当于H.264的30%,AVS编码复杂度相当于H.264的70%。



  四、小结

  AVS视频标准(GB/T 20090.2)是基于我国自主创新技术和国际公开技术所构建的标准,主要面向高清晰度和高质量数字电视广播、网络电视、数字存储媒体和其他相关应用,具有以下特点:(1)性能高,编码效率是MPEG-2的2倍以上,与H.264的编码效率处于同一水平;(2)复杂度低,算法复杂度比H.264明显低,软硬件实现成本都低于H.264;(3)我国掌握主要知识产权,专利授权模式简单,费用低。基于此,我们认为AVS标准是能够支撑国家数字音视频产业发展的重要标准。

参考文献

[1] 信息技术 先进音视频编码 第2部分:视频. AVS N1165, 2005
[2] 黄铁军,高文. AVS标准制定背景与知识产权状况. 电视技术. 2005年第7期.P4-7
[3] Liang Fan, Siwei Ma, Feng Wu. Overview of AVS Video Standard. Proc. 2004 IEEE Intl. Conf.
Multimedia & Expo., 2004: 423-426
[4] 梁凡. AVS视频标准的技术特点. 电视技术. 2005年第7期
[5] ISO/IEC JTC1/SC29/WG11 (MPEG). N6231 Report of The Formal Verification Tests on AVC (ISO/IEC 14496-10 | ITU-T Rec. H.264). December 2003, Waikoloa
[6] 国家广播电视产品质量监督检验中心. AVS视频编/解码方案图像质量主观评价试验报告. 2004年12

[7] 国家广播电影电视总局广播电视规划院. AVS视频压缩质量主观评价(AVS参考软件5.2版)测试
报告. 2005年9月


你可能感兴趣的:(音视频-编解码-通信协议)