块匹配的运动估计算法

一、运动估计定义

这里指的是基于块的运动估计,基本思想是将图像序列的每一帧分成许多互不重叠的块,并认为块内所有像素的位移量都相同,然后对每个宏块到参考帧某一给定特定搜索范围内根据一定的块匹配准则找出与当前块最相似的块,即匹配块,匹配块与当前块的相对位移即为运动矢量。

二、分类

运动估计计算法可分为两大类,即基于非参数运动模型的运动估计和基于参数模型的运动估计。非参数运动估计需要显式的边界条件才能获取物体的运动信息,比如光流场方程和随机场法。参数模型运动估计假设每一个图像块都做刚体运动,并且可以用一组参数来描述。
用参数描述运动可以大大减少运动信息编码码字的开销。而块匹配法是模型运动直接估计最常用的方法。

三、实现

从运动估计的定义中我们可以捕获到3点信息:
1.图像序列基于块的分割
2.需要一个匹配准则
3.如何去搜索最相似的块

在块匹配法中, 图像按光栅扫描顺序被分成多个互不重叠的像素块 。这些块大小往往固定。 对每一个像素块在参考帧一定范围内搜索最优匹配块 ,得到的相对偏移矢量即为该像素块的运动向量。上述基本思想的前提是块内所有像素只进行相同的平移运动。虽然实际上块内各点运动可能并不一致,也不一定只进行平移运动 :但当所选像素块较小时,上述假设可以近似成立,该假设的优点是简化了块匹配法计算复杂度。

通常视频序列存在比较强的时域相关性,所以运动向量场存在较强的空域相关性。 目前主
流的视频压缩编码标准中 ,运动向量普遍采用预测差分编码技术 。

四、关键
块匹配运动估计算法的性能取决于:块尺寸的大小,匹配准则以及搜索策略

块不可太大也不可太小,最好支持可变块大小,匹配准则涉及到是否采用RDO,多参考帧运动估计,分像素运动估计。快速搜索算法有:预测搜索,多层多分辨率以及减少搜索点法。

你可能感兴趣的:(H264,编码器,h.264,hevc)