MPEG的全名为Moving Pictures Experts Group/Motion Pictures Experts Group,中文译名是动态图像专家组。
MPEG-1是1993年8月正式通过的技术标准,其全称为“适用于约1.5Mbit/s以下数字存储媒体的运动图像及伴音的编码”。
MPEG-2是1994年11月发布的“活动图像及其伴音通用编码”标准,该标准可以应用于(5.048Mbit/s~20Mbit/s)的各种速率和各种分辨率的应用场合之中。如多媒体计算机、多媒体数据库、多媒体通信、常规数字电视、高清晰度电视以及交互式电视等。
MPEG-4是1999年1月公布了该标准的V1.0版本,同年12月公布了V5.0版本。该标准主要应用于超低速系统之中,例如多媒体Internet、视频会议和视频电视等个人通信、交互式视频游戏和多媒体邮件、基于网络的数据业务、光盘等交互式存储媒体、远程视频监视及无线多媒体通信。特别是它能够满足基于内容的访问和检索的多媒体应用,并且其编码系统是开放的,可随时加入新的有效算法模块。
MPEG-1标准的特点:
1.在图像和声音的质量上,高于可视电话和会议电视的声像质量,至少应达到家用录像机的声像质量;
5.压缩后的码率应能存储在CD-ROM等数字存储介质中;
3.压缩后的码率应与计算机网络的基本传输码率相适配,即为1.2~1.5Mbit/s;
5.能适应多种通信网络的传输。
MPEG-1标准是由三个部分构成,第一部分是系统部分,编号为11172-1。它描述了几种伴音和图像压缩数据的复用以及加入同步信号后的整个系统。第二部分为视频部分,主要规定了图像压缩编码方法,编号为11172-2。第三部分为音频部分,主要规定了数字伴音压缩编码,编号为11172-3。可见MPEG-1标准的基本任务就是将视频与其伴音统一起来进行数据压缩,使其码率可以压缩到1.5Mbit/s左右,同时具有可接收的视频效果和保持视音频的同步关系。
MPEG-1视频压缩算法采用两种基本技术: 一是基于块的运动补偿预测, 以缩减时间冗余; 二是基于DCT的变换编码, 以缩减空间冗余。运动补偿预测技术采用纯预测编码和插值预测编码两种编码方法。剩余信号(预测误差)在缩减空间冗余时被进一步压缩。 与运动有关的信息包含在16×16块中, 与空间信息一起进行DCT变换。为获得最大限度的编码效率, 使用可变长熵编码器来压缩运动信息。
MPEG-1将图像编码帧分成三类:
·I帧(Introcoded frame, 内帧): 它采用与JPEG相类似的编码方法进行编码, 并且在编码时不必参照其它的帧, 其压缩比是比较低的。 I帧可作为随机访问点以及其它图像编码帧的参照帧。
·P帧(Predictively coded frame, 预测帧): 它需要利用前面的I帧或P帧信息进行编码和解码, 同时又是后续P帧的参照帧。 它利用了瞬时冗余特性, 可获得较高的压缩比。然而只有对所参照的I帧和P帧完成解码后才能访问P帧。
·B帧(Bidirectionally predictively codedframe, 双向预测帧): 它需要利用前面和后面的I帧、 P帧信息进行编码和解码, 但它本身不可作为参照帧。由于B帧使用了双向运动补偿预测技术, 故它的压缩比是最高的。
MPEG-2标准
·压缩比更高
向下兼容现存的MPEG-1和H.261标准。
支持不同分辨率格式之间的兼容
·支持隔行/逐行扫描的视频信号
利用运动矢量进行预测的情况更加多样
音频信息处理功能更强
·定义了可伸缩的、 层次化的编码算法, 使普通TV和HDTV系统可以使用相同的数据流。
具有可传输机制,包含了各种有力的数据移动机制
MPEG-2标准主要由三部分组成: MPEG-2视频、 MPEG-2音频、MPEG-2系统。
MPEG-2音频标准用于支持低数码率多通道音频信号的编码,
MPEG-2的视频标准是在MPEG-1的基础上进行了重大的改进和扩充,主要体现在以下几方面:
1.设置了“按帧编码”和“按场编码”两种模式
MPEG-1标准中支持逐行扫描,但在MPEG-2标准中考虑到电视信号隔行扫描的特性,专门设置了“按场编码”模式,同时对运动补偿算法和DCT方式进行了扩充,细分为“按帧运动补偿”和“按场运动补偿”,从而显著地提高了压缩编码的效率。
2、DCT两种:帧DCT和场DCT
3、运动估计4种:场预测、帧预测、双基预测和16*8的运动补偿
4、两者压缩编码方式均采用运动检测补偿、DCT、量化 Huffman编码、游程编码
MPEG-4标准
1)MPEG-4与MPEG-1、MPEG-2标准的根本区别
①MPEG-4是基于内容的压缩编码方法
它首先根据内容将图像分割成不同的视频对象VO,例如在会议电视系统中常见的视频图像是以讲话的人为前景,此外还有背景,因而在视频对象的划分中经常将人作为前景视频对象,而将其余部分视为背景视频对象。其中前景视频对象中包含了重要的边界和轮廓信息,因此在编码过程中应尽可能地保留这部分信息,而对人们不太关心的背景视频对象,则可以采用大比例的压缩策略,甚至可以不传输,仅在接收端用其他背景代替。
②引入视频对象VO(Viedo Object)和视频对象平面VOP(Video Object Plane)概念
在MPEG-4中是根据人眼感兴趣的一些特征,如纹理、运动、形状等,对视频图像进行分割,如图像的背景、画面上的对象(对象1、对象2,……),然后将各对象从场景中截取出来,每个对象所截取的图像区域不同,它们各自的形状也不同。通常将这些区域称为视频对象平面VOP
H.261
H.261是“p×64kb/s视频编解码器”标准, 其中p的取值范围在1~30之间, 代表ISDN的B通道数量, 各个通道的数码率为64 kb/s。 由于H.261主要是为可视电话和电视会议制定的, 因此, 标准中所建议的视频编码算法应具有实时处理能力, 延时应控制到最小程度。当p=1或2时,由于数码率较低, 仅能用于桌面上进行面对面直观通信。 而当p≥6时,由于提高了数码率, 能够传输较复杂的图像, 图像质量也得到改善, 因此更适合电视会议。
H.261 为了便于与国际上三种不同制式(PAL NTSC SECAM)模拟才是电视信号互联,建议规定采用CIF(通用中间格式)和QCIF格式(1/4CIF)作为视频输入格式.
当p=1或2时,在桌面可视电话应用中常选用QCIF。如果在10帧/秒速率下使用, 即使选用QCIF也要将数码率减少47.5倍才能使用64 kb/s通道来传送信号, 这是很难实现的。当p≥6时,可以使用CIF, 因为它有很多可用于对图像编码的信息。由于CIF的分辨率高, 更适合于电视会议方面的应用。
H.263标准是一种甚低码率通信的视频编码方案。所谓甚低码率视频编码技术是指压缩编码后的码率低于64kbit/s的各种压缩编码方案.它是以H.261为基础,其编码原理和数据结构都与H.261相似, 但是H.263不仅可以支持CIF和QCIF标准数据格式,而且还可以支持更多原始图像数据格式,如sub-QCIF、4CIF和16CIF等;为了提高压缩比,利用半精度像素的预测值,此外,还提供了4种有效的编码模式
(2)四种有效的压缩编码方法
①无约束运动矢量算法
运动矢量允许指向图像以外,当某一运动矢量所指的参数像素位于编码图像之外时,就用边缘的图像值代替这个不存在的像素。
②基于语法的算术编码
变长编码中,某个符号的编码是使用基于语法的特定码表而编成一个码字。这个码表主要存储VLC(变长编码)的游长和电平值。
③高级预测模式
采用复杂的运动估计,通常采用16*16像素的宏块为单位运动估计。H.263中,可能一个宏块使用一个运动矢量,也可能将宏块的4个子块每个各使用一个运动矢量,具体由编码器控制。
④PB帧模式
由两帧构成,一个PB帧包含一个由前面的解得的P帧图象预测得出的P帧和一个由前一个P帧和当前解码的P帧共同预测得出的B帧。