H.264 视频编码器 变换编码分析

H.264 视频编码器 变换编码分析

一. 变换编码分为两部分:变换,量化,以及在之后的重建环路中对应的反量化和反变换。
接下来对各部分进行分析
二. 变换

根据残差数据的类型不同,H264 High Profile中会使用到4种不同的变换:

  1. 采用 Intra4x4 预测模式和 Intra16x16 预测模式得到的亮度分量预测残差,使用4x4离散余弦变换(DCT);
  2. 采用 Intra8x8 预测模式得到的亮度分量预测残差使用8x8离散余弦变换(DCT);
  3. 采用 Inter 预测模式得到的亮度分量预测残差,如果预测模式块大小,小于等于8x8,则使用4x4离散余弦变换,否则编码器要在4x4和8x8离散余弦变换之间进行选择。
  4. 色度分量的预测残差全部使用4x4离散余弦变换。
  5. 其中,4x4哈达玛变换用于 Intra16x16 预测残差直流分量的二次变换;2x2哈达玛变换用于色度分量直流系数的二次变换
三. 原始数学原理:DCT变换原理

DCT变换是一种正交变换,因为具有良好的去相关性和压缩效果,并且有快速算法可以实现,因此在图像编码中被广泛使用。

但是由于变换矩阵C的变换系数中存在无理数,在编解码的计算过程中计算结果会带来误差,反变换和变换之前的结果会不一样带来误差。

在H. 264编码标准中,进行了整数变换的操作,并且可以不使用乘法操作,其中的一部分变换计算合并到量化过程中去。

四. H.264中的整数余弦变换

整数余弦变换的对象:

  1. 4x4子宏块的亮度分量
  2. 4x4子宏块的色度分量
1.变换

也就是说,4x4的残差亮度书看剧和2x2的残差色度数据需要进行二维变换,使得高频分量大多数为零,从而达到和DCT变换相似的数据压缩效果。
H.264 视频编码器 变换编码分析_第1张图片
其中,Ef 矩阵中a=1/2,b=√(2/5).
这里的 圈乘 运算符表示对同一位置的两个矩阵元素做一次的乘法操作。这一部分运算被合并到量化和反量化中,确保了整数余弦变换和DCT变换有相似的压缩效果。因此在编码器的标准中,变换过程只包括括号内的操作:
在这里插入图片描述

2.反变换

在H.264标准中,反变换矩阵Cinv 并不是变换矩阵Cf的逆矩阵,而是进一步做了整数化处理。因此需要其他运算来保证反变换的正确性。在H264标准中这部分也同样被合并到量化,反量化的过程中完成,这样保证在反变换的过程中同样只使用加法和移位操作。

反变换矩阵Cinv如下:
H.264 视频编码器 变换编码分析_第2张图片

3. 分层的二维整数余弦变换:直流分量增加hardmard变换

首先,对于4x4子宏块的残差做二维整数余弦变换
其次,对8x8色度块的直流分量和帧内预测的16x16宏块中的16个子宏块的直流分量进行hardmard变换。如下图所示:
H.264 视频编码器 变换编码分析_第3张图片
这时由于在8x8的色度块和帧内预测模式的16x16亮度快中,每个子宏块的直流分量之间还有很强的相关性。对于这些子宏块的支流分量还要进行Hardmard变换来提高数据的压缩效率。

8x8色度块和帧内预测16x16亮度快的直流分量的hradmard变换矩阵分别为:
H.264 视频编码器 变换编码分析_第4张图片
Hardmard逆变换矩阵和变换矩阵相同。

4. 针对高清晰视频领域的应用,提出对亮度快使用更大尺寸的整数余弦变换:8x8变换块

相对于4x4数据块的整数比那还,新的建议增加了8x8数据块使用整数余弦变换。与此对应,新的建议中,预测模式和量化部分也做了部分修改。

8x8数据块的整数余弦变换:
首先可以提高数据压缩的性能,因为在实际中8x8数据块的数据相关性比4x4的数据块相关性要高,因此压缩性能要更好,可以减少大约10%的比特率。
其次,8x8数据块的整数余弦变换有利于图像中的频率分量,可以提高图像显示细节。

你可能感兴趣的:(视频编码)