H.264 和 MPEG-4 基础

H.264 和 MPEG-4 的关系:

  • H.264 /AVC ( Advanced Video Coding )标准,是 MPEG-4 的第 10 部分。
  • MPEG-4的初衷是将DVD质量的图像码流从每秒6兆降低到1.5兆,将高清电视的码流从每秒几十兆降低到6~8兆。要实现这样的编码压缩水平,就要用到一种叫AVC(Advanced Video CODEC)的技术。国际电联(ITU)将这项技术命名为H.264标准,MPEG 把这项技术放到MPEG-4标准里的第10章(Part 10)。这就是MPEG-4和H.264的关系。
  • H.264/AVC是由ISO/IEC与ITU-T组成的联合视频组(JVT)制定的新一代视频压缩编码标准,于2003年5月完成制订。相对于先前的标准,H.264/AVC无论在压缩效率、还是在网络适应性方面都有明显的提高,因此,业界普遍预测其将在未来的视频应用中替代现有的视频压缩标准。
    但是,H.264/AVC标准由于对视频源的限制,仅支持娱乐级视频质量。为了进一步扩大其应用范围,使其适应高保真视频压缩的应用,JVT于2004年7月对H.264/AVC做了重要的补充扩展,称为FRExt(Fidelity Range Extensions)。
    H.264/AVC标准第一版支持的源图像为每象素8b,且采样方式仅限于4∶2∶0;而新近扩展的FRExt部分则扩大了标准的应用范围,如专业级的视频应用、高分辨率/高保真的视频压缩等。FRExt对H.264/AVC的改善主要在:(1)进一步引入一些先进的编码工具,提高了压缩效率;(2)视频源的每个样值均可超过8b,最高可达12b;(3)增加了4∶2∶2与4∶4∶4的采样格式;(4)更高的比特率,更高的图像分辨率;(5)可达到图像高保真的要求,支持无损压缩;(6)支持RGB格式的压缩,同时避免了色度空间转换的舍入误差。
  • MPEG-4 Visual (MPEG-4 Part 2)与H.264 (MPEG-4 Part 10)均为新一代多媒体通讯压缩与解压缩国际标准。其中MPEG-4目前作为消费性电子核心技术正处于市场导入期。如目前利润最高的高端Smart Phone多带有动态影音摄影的功能,其压缩标准主流即为MPEG-4 Visual。此外3G(第三代行动电话)手机所支持的影音功能亦多包含MPEG-4 Visual编解码功能。多媒体播放器的顶端产品(注:iPod属中阶产品)目前非PMP (Portable Media Player)莫属,单价高达2K~6K¥的系统均需包含MPEG-4 Visual的播放功能。下一代的PMP将进一步结合数字相机与摄影机的功能达到全功能实时多媒体摄、录、放与传输的需求。当然MPEG-4 Visual还是扮演核心与关键技术角色。H.264整合ISO/IEC与ITU-T两大标准阵营,制定MPEG-4 Visual的下一代影音压缩标准。目的在进一步提高自然影像的压缩率,且在通讯环境变化时亦能确保一定的影音品质,是下一代数字电视的编解码标准。H.264为达成上述目的,采用多项创新技术(亦使H.264与MPEG-1/-2/-4 Visual不兼容),故软硬件设计上与MPEG-4 Visual炯异。而重要的是H.264将应用在3G行动通讯之上。故H.264为下一代3C产品的杀手级核心技术。
  • 通常所说H.264和MPEG4的比较是指H.264和MPEG-4 Part 2 Advanced Simple Profile (ASP)的比较而言

分辨率和实时性术语:

  • 完全实时:PAL=25F/S、NTSC=30F/S
  • 基本实时(准实时):PAL:8~15F/S  NTSC:10~17F/S
  • 非实时:PAL<8F/S  NTSC<10F/S
  •  
  • CIF (352 x 240  NTSC, 352 x 288  PAL)
  • QCIF=CIF*1/4=176*120 NTSC,176*144 PAL
  • FD1(D1)=4*CIF=704*480 NTSC,704*576 PAL
  • HD1(Half-D1)=D1*1/2=704*240 NTSC,704*288 PAL
  • D1为480i格式,和NTSC模拟电视清晰度相同
  • D2为480P格式,和逐行扫描DVD规格相同,DVD的分辨率为480P,也就是720x480(NTSC)720X576(PAL)
  • D3为1080i格式,分辨率为1920×1080 i/60Hz
  • D4为 720p格式,分辨率为1280×720 p/60Hz
  • D5为1080p格式,分辨率为1920×1080逐行扫描,专业格式

专利费问题:

  • 在专利许可政策上,H.264 也吸取了MPEG2 及MPEG4 part2 的经验和教训,推出了较之前标准更低和操作性更强的许可政策。例如,AVC 许可政策每台产品0.20 美元的收费,与MPEG-2 每个终端收费4-6美元(2002 年前)和2.5 美元(2002 年之后)相比,降价幅度超过一个数量级。而其相比于MPEG4 part2,除了取消了按编解码时间收费(2 美分/小时)以外,也降低了对于内容的收费,从而受到了更多机构、企业和运营商的欢迎。

 基础知识:

  • H.264 标准压缩系统由视频编码层( VCL )和网络提取层( Network Abstraction Layer , NAL )两部分组成。 VCL 中包括 VCL 编码器与 VCL 解码器,主要功能是视频数据压缩编码和解码,它包括运动补偿、变换编码、熵编码等压缩单元。 NAL 则用于为 VCL 提供一个与网络无关的统一接口,它负责对视频数据进行封装打包后使其在网络中传送,它采用统一的数据格式,包括单个字节的包头信息、多个字节的视频数据与组帧、逻辑信道信令、定时信息、序列结束信号等。包头中包含存储标志和类型标志。存储标志用于指示当前数据不属于被参考的帧。类型标志用于指示图像数据的类型。VCL 可以传输按当前的网络情况调整的编码参数。
  • H.264 和 H.261 、 H.263 一样,也是采用 DCT 变换编码加 DPCM 的差分编码,即混合编码结构。同时,
  • H.264 在混合编码的框架下引入了新的编码方式,提高了编码效率,更贴近实际应用。
  • H.264 没有繁琐的选项,而是力求简洁的 “ 回归基本 ” ,它具有比 H.263++ 更好的压缩性能,又具有适应多种信道的能力。
  • H.264 的应用目标广泛,可满足各种不同速率、不同场合的视频应用,具有较好的抗误码和抗丢包的处理能力。
  • H.264 的基本系统无需使用版权,具有开放的性质,能很好地适应 IP 和无线网络的使用,这对目前因特网传输多媒体信息、移动网中传输宽带信息等都具有重要意义。
  • 新的快速运动估值算法 UMHexagonS (中国专利)是一种运算量相对于 H.264 中原有的快速全搜索算法可节约 90 %以上的新算法,全名叫 “ 非对称十字型多层次六边形格点搜索算法 ” ( Unsymmetrical-Cross Muti-Hexagon Search ) ” ,这是一种整像素运动估值算法。由于它在高码率大运动图像序列编码时,在保持较好率失真性能的条件下,运算量十分低,已被 H.264 标准正式采纳。

参考资料:

  • 视频压缩技术MPEG-4、H.264和WMV
  • H.264 专利费用分析
  • H.264:视频压缩编码的新发展
  • 基于Blackfin533的H.264编码
  • 中国电子技术标准化研究所(信息产业部电子工业标准化研究所,简称CESI)
  • h264 专题
  • 中华视频网: 视频编码技术
  • http://www.chiariglione.org/mpeg/

你可能感兴趣的:(学习笔记)