Mean-shift Blob Tracking through Scale Space 阅读笔记

这篇文章主要解决的是visual tracking中mean-shift方法无法估计尺度变化的问题,作者采用Lindeberg的尺度空间理论 来解决这个问题。

其原理就是:基于可导的尺度空间滤波器的局部最大值来进行尺度选择。

基于appearance 的tracking中,像素值w(a)表示的是改点属于object的概率,一般foreground  blob具有高的权重,而background具有低的weigt。

mean-shift算法想要结合样本权重w(a)和Kernel weights K(a)。

这篇文章的核心就是处理mean-shift的核的尺寸,它直接决定了windows的尺寸。作者提出了scale space blob的概念。作者认为Lindeberg提供了一个很好的方法来选择一个合适的scale描述一幅图像中的特征。于是一种多尺度的图像描述子被提了出来,利用变方差的高斯滤波器来构造尺度空间表达,前两维是空间的维数,第三位是空间的尺度。在着了作者采用的是不同尺度的DoG filter。这是由于DoG的描述子的幅值对于尺度具有不变性。

具体的思想就是我们设计一种机制能够调节mean-shift 的kernel的size和blob的尺度。 首先定义3D的shadow kernel H,多个尺度的DoG滤波器形成了尺度空间滤波器组,然后与权重图做卷积。如下所示:

Mean-shift Blob Tracking through Scale Space 阅读笔记_第1张图片

定义核尺度集合:

,b=1.1,n=2,shadow kernel

H(s) = 1 - (s/n)^2

最后,3D 的尺度空间是从单个样本权重w(x)生成的:


作者考虑两个mean-shift 的过程,第一个是关于spatial 的,第二个是关于scale的。

算法流程如下:

1. 输入是权重图w(a),以及blob的现有尺度空间位置的估计(x_0,sigma_0)。

2.将sigma_0固定,利用下面公式计算偏移量:

3.固定x_0,利用下面的公式计算尺度的变化:

设置新的sigma_0 = b^s*sigma_0;




   
   
   

你可能感兴趣的:(shift,Visual,mean,Tracking,尺度)