本章着重介绍有关MPEG-4 Visual标准的细节。
编码工具集合的子集(比如支持交织等)。
视频元素(比如一个矩形视频帧,或者一个任意形状的区域,静止的图像)。
视频对象类型的集合。
每个Profile都会有多个Level,不同的Level对机器性能的要求各不相同,因此适用于不同的应用和环境。
视频的一帧是一个VOP(Video Object Plane),多个VOP组成一个VO。VOP可以是矩形的也可以是任意形状的。
Simple Profile中的特性。
即通常所说的I帧,该帧的编码不依赖于其他帧,即Intra mode。
即通常所说的P帧,该帧的编码依赖于之前编码了的I帧或P帧。P帧中的宏块可以用帧内编码(出现一块新的找不到很好匹配的区域),或者帧间编码(利用运动补偿,估计)。
这里介绍了一些提升编码效率的工具
缩小宏块大小,增加运动向量个数,达到更精确的匹配
在帧边缘位置的宏块,如果物体从边缘位置进入屏幕范围,极有可能搜索不到比较好的匹配,但是如果将边缘位置按照像素值“外推(extrapolate)”,那么匹配准确度会明显提升。
因为相邻宏块的内容变化可能并不显著(马尔科夫特性),因此宏块的DC和AC系数可以根据相邻宏块进行预测。
这里介绍了一些提升传输效率的工具
Packet
又称之为Slice
,在Packet的头部可以增加一个Sync
标签,辅助解码器同步,防止错误的传递。
将数据分成两部分传递,第一部分保存每个宏块的编码模式和每个帧内编码宏块的DC系数或者帧间编码宏块的运动向量。而帧间编码宏块的AC系数和DC系数存储在第二部分,这样即使第二部分数据出现了错误,依靠第一部分的数据依然可以恢复出来。
即Reversible Variable Length Codes,使得解码器可以正反两个方向解码,以此减小错误所影响的范围。
Advanced Simple Profile中的特性。
即B帧,双向预测帧。
四分之一像素为单位的运动向量,提升精度。
边长的量化步长,低频区域步长小,高频区域步长大,这样能够更高效地压缩。
支持全局的运动向量共享。
对交织的支持。
Advanced Real Time Simple Profile中的特性。
new prediction
,即支持选择更早的VOP进行预测,当出现错误时,利用之前较早的未出现错误的VOP预测,可以防止错误的传递。
当画面中出现较复杂的场景变化时,往往会意味着码率的瞬时提高,此时可以通过降低分辨率的方式来减小码率。