H.264视频隐写中可用于隐藏的场地(预测过程)

H.264视频隐写中可用于隐藏的场地(预测过程)

H.264是一种混合视频编码标准,它包含几个关键的过程,包括预测、转换(即DCT)、量化、熵编码,如下图所示。
H.264视频隐写中可用于隐藏的场地(预测过程)_第1张图片
多年来,各种信息隐藏方法被提出并在每个过程中使用各种组件(称为场地)实现。本质上,信息隐藏可以在编码过程之前进行,也就是说,传统的方法(抗压缩的鲁棒性)可以直接应用到每一帧。然而,由于压缩不可避免地会造成信息丢失,导致对嵌入信息的提取不准确,因此研究人员没有采用这种方法。相反,直接操纵H.264压缩视频的实体来实现信息隐藏更有前景。回顾H.264中上述进程的功能,并详细介绍与每个进程相关的代表性信息隐藏方法。
A. 预测过程
一些研究人员在基于矢量量化的图像压缩中对块预测过程进行了操作,以嵌入信息。对专用块采用不同的编码方法,如截断编码,边匹配矢量量化。在压缩视频域中,通过利用与预测过程相关的模式、块大小、实体等采取类似的方法。

1. 帧内预测:

如果一个宏块采用帧内编码模式,利用14种预测模式中的一种进行预测(44块有九种,1616块有4种,以及跳跃模式)同时参考先前编码和重构的块,它们本身可以是使用intra- prediction模式预测宏块。利用模式选择进行信息隐藏,映射规则通常被用于提高有效负载,而不会造成较大的比特率开销[。这些方法将选定的I4种宏块预测模式(即intra 4×4)分为两组,第一组表示“0”,另一组表示“1”。预测过程被迫采用属于表示要嵌入的信息的组中的最佳模式。通过引用诸如pre intra 4×4 pred模式之类的标志,可以很容易地对嵌入的消息进行解码。Kim等也利用帧内预测模式(结合系数)实现盲(即提取过程不参考原始帧)和半盲水印。Xu等人提出了一种类似的方法,即基于混沌序列选择性地选择宏块,并操纵最可能的预测模式来嵌入信息。
Yang等人使用矩阵编码将I-frame中的信息隐藏限制为4×4块。选择4×4块是因为它们包含大量的非零DCT系数,与16×16块的情况相比,修改它们的预测模式(为了隐藏信息)很少导致可见的视觉修改。两位信息通过三个块进行矩阵编码。对多个测试序列的实验结果表明,该方法能够实现实时盲提取。

2.帧间预测:

为了提高间隔预测模式下的编码效率,H.264标准采用了7种不同的块大小(分别为16×16、16×8、8×16, 8×8, 8×4, 4×8和4×4),并为每个块大小调用运动估计算法选择产生最小位数的块类型。Kapotas等[66]提出强制编码器根据要嵌入的信息选择特定的块类型。在这种技术中,每个块类型被赋值为两个比特。然后,将信息分成段(即每个段长度为2位),每个段使用块大小进行编码,如图11所示。然后使用强制块大小估计这些宏块的运动。种技术对视频的视觉质量影响不大。嵌入容量较高,且与主机视频大小成正比。
H.264视频隐写中可用于隐藏的场地(预测过程)_第2张图片

3. 运动矢量位移:

信息隐藏可以通过使用运动矢量属性来实现,包括相位角、水平和垂直幅度。Jordan等人[67]提出了这种用于视频水印的技术。然后,Zhang等和Dai等[69]提出了Jordan等人技术的增强版本,将信息隐藏限制在特定类型的帧间。特别地,考虑了由大幅值和小相位角运动向量组成的帧。Su等[70]对这三种方法进行了研究提出了一种隐写分析方法。同样的,Guo等[71]提出了一种将秘密信息嵌入到两个P帧之间的运动向量中的方法。特别地,运动向量的水平和垂直偏移(即奇或偶)被修改以嵌入信息。实验结果表明,该技术能够满足流交换应用的实时性要求。
后来Xu等[72]考虑利用i帧的DCT系数和p帧的运动矢量大小来嵌入信息,以获得更高的有效载荷。Aly[73]扩展了Xu等人的算法,提出了一种不同的信息隐藏方法,旨在实现最小的预测误差和比特流大小开销。Aly的技术不是使用幅度和相位角,而是利用由相关运动矢量位移引起的预测误差来确定其是否适合信息隐藏。特别地,将预测误差与自适应阈值进行比较。这种技术使视频失真小,抑制了比特流大小的增长。最近,Cao等[74]设计了一种基于运动向量的自适应可逆数据嵌入技术。Cao等人实现了校正技术来恢复 由于嵌入使得宏块之间运动向量的修改。Deng等对Su等和Cao等提出的方法进行了比较,提出了一种提高检测精度的改进技术[75]。

4. 运动矢量搜索范围:

H.264标准采用了基于层次的运动估计,以支持一定范围的块大小和四分之一像素精度,以实现高压缩效率 。对于每个宏块,运动估计过程首先在整数像素级搜索最优宏块,然后在最佳整数像素位置周围进行亚像素级搜索,最后在选定的亚像素位置周围继续在四分之一像素级搜索,找到最优匹配点。根据映射规则,可以通过调制运动估计过程中的搜索点来嵌入信息。特别地,该技术利用两个不重叠的搜索点集(即M和N)来嵌入信息。一个可能的排列如图12所示,其中w为要嵌入的位。
H.264视频隐写中可用于隐藏的场地(预测过程)_第3张图片
文中标记的参考文献见:An Overview of Information Hiding in H.264/AVC Compressed Video
--------------------------------------------------------------------------------------------2021年10月30日学习笔记

你可能感兴趣的:(音视频)