Mpeg-4编解码技术意义

现在,我们又迎来了一次媒体革命,它就是mpeg-4, 它以其出色的媒体性能,图形质量接近dvd,声音品质接近cd,同时又有更高的压缩比而迅速火爆起来,在多媒体领域掀起狂澜。那么,到底什么是mpeg呢?


    我们知道,多媒体信息主要包括图像、声音和文本三大类,其中视频、音频等信号的信息量是非常大的。对于音频处理来说,传输数字图像所需的带宽远高于前者,例如,ntsc图像以大约640×480的分辨率,24bits像素,每秒30帧的质量传输时,其数据率达28mb字节/秒或221mb位/秒。而且以这个速率保存的15秒的未压缩视频图像将占用420mb字节的内存空间,显然这样的要求对台式计算机来说是难以接受的。所以,视频图像的压缩编码方法mpeg就应运而生了。


    mpeg本是动态图像专家组(moving pictures experts group)的英文缩写,这个专家组始建于1988年,专门负责为cd建立视频和音频标准,其成员均为视频、音频及系统领域的技术专家。由于iso/iec1172压缩编码标准是由此小组提出并制定mpeg由此扬名世界。对于今天我们所泛指的mpeg-x版本,是指一组由itu(international telecommunications union)和iso(international standards organization)制定发布的视频、音频、数据的压缩标准。mpeg-4就是mpeg的第4个版本,mpeg的缔造者们原先打算开发4个版本:mpeg-1~mpeg-4,以适用于不同带宽和数字影像质量的要求。后由于mpeg-3被放弃,所以现存只有3个版本的mpeg:mpeg-1,mpeg-2,mpeg-4.


    总体来说,mpeg在三方面优于其他压缩/解压缩方案。首先,由于在一开始它就是做为一个国际化的标准来研究制定,所以,mpeg具有很好的兼容性。其次,mpeg能够比其他算法提供更好的压缩比,最高可达200:1.更重要的是,mpeg在提供高压缩比的同时,对数据的损失很小。mpeg在发展过程中经历了以下过程:


    mpeg-1 制定于1992年,为工业级标准而设计,可适用于不同带宽的设备,如cd-rom、video-cd、cd-i.它可针对sif标准分辨率(对于ntsc制为352×240;对于pal制为352×288)的图像进行压缩,传输速率为1.5mbits/s,最高可达4-5mbits/s,每秒播放30帧,具有cd(指激光唱盘)音质,质量级别基本与vhs相当。


    mpeg-2 制定于1994年,设计目标是高级工业标准的图像质量以及更高的传输率。mpeg-2所能提供的传输率在3-15mbits/sec间,其在ntsc制式下的分辨率可达720×486,mpeg-2能够提供广播级的视像和cd级的音质。mpeg-2的音频编码可提供左右中及两个环绕声道,以及一个加重低音声道,和多达7个伴音声道(dvd可有8种语言配音的原因)。除了做为dvd的指定标准外,mpeg-2还可用于为广播,有线电视网,电缆网络以及卫星直播 (direct broadcast satellite) 提供广播级的数字视频。


    mpeg-4 就在mpeg-1、mpeg-2进入广泛的实际应用之时,mpeg小组又于1998年发布了mpeg-4标准的草稿。该标准对压缩算法进行了改进:mpeg-1和mpeg-2的压缩率大概在20到30倍之间。市面上常见的vcd光碟片大概是每片650 mb 的资料量,存放74分钟的影片。相当于vhs录影带的画质。而dvd一片4.7gb的资料量。可以存放超过两小时的影片。mpeg-1和mpeg-2的压缩率用在储存媒体上是足够了。但是运用在网络传输上还是太低,尤其是无线通讯方面。于是mpeg-4在订定标准时,为了达到更好的压缩效果,采用了许多新的技术与观念。mpeg-4里是采用了物件的观念。压缩之前先将影片中各个主要物件区分开来。例如电视新闻播报的场景中,主播是一个物件,播报台、背后的布景、主播旁边的3d玩偶也分别是一个物件。主播的声音也是一个物件。在影片进行中,主播会有轻微的移动。播报台是固定不动的。而布景则有时候会播放新闻影片。将各个物件分隔开来有什么好处呢?那就是可以针对不同的物件特性采取不同的压缩编码技巧,以得到最好的压缩效果。例如播报台只要传送一次资料,以后不再传送,以节省资料量。3d玩偶则用3d动画适用的演算法。主播和新闻影片采用mpeg-2的格式。声音则采用mp3的格式。将这些不同的资料整合后结合起来一起传送。解码器收到资料后,先将各个不同格式的资料分开。依照各自的格式解码。再根据时间和空间的关系,将各个物件加以组合。就可以得到原来的影片了。为了达到以上的压缩观念,mpeg-4引进了许多新的压缩技术来应用于各种不同的物件。对于声音部份,可以分成自然音、语音和合成音。针对不同发声原理采用不同演算法。可以根据对音质的要求,而得到2kbits/s到64kbits/s之间的资料量。在影像方面,则可细分为自然物体、2d影像、3d影像、人脸、背景等不同特性物件。根据不同影像特性可以有5kbits/s到10mbits/s 的资料量。mpeg-4的压缩率可以超过100倍,而仍然保有极佳的音质和画质。可以用最少的数据获得最佳的图像质量,因此满足了低码率应用的需求;另外,mpeg-4还把提高多媒体系统的交互性和灵活性作为一项重要的目标,因此它更适合于交互式av服务以及远程监控。为了满足各种应用的需求,mpeg-4标准实际上相当庞大,它具有广泛的适应性和可扩展性。


    就其应用前景而言,mpeg-4未来将在多个应用领域大显身手,如internet/intranet上的多媒体流服务、视频点播、可视游戏、低码率的移动多媒体通信(视频手机等)、交互式多媒体应用、实时多媒体监控、数字电视与演播电视、虚拟会议等等。


    mpeg-4可以达到两个目标: 低比特率下的多媒体通信和多工业的多媒体通信的综合

你可能感兴趣的:(Mpeg-4编解码技术意义)