MeanShift算法(一)

参考论文:D. Comaniciu and P. Meer, “Mean shift: A robust approach toward feature space analysis,” IEEE T. PAMI, vol. 24, no. 5, pp. 603-619, May 2002

MeanShift 可以翻译为“均值漂移”,它在聚类、图像平滑、图像分割和跟踪方面得到了比较广泛的应用。MeanShift 这个概念最早是由Fukunaga等人于1975年在一篇关于概率密度梯度函数的估计(The Estimation of the Gradient of a Density Function, with Applications in Pattern Recognition)中提出来的。其最初含义正如其名:就是偏移的均值向量。在这里MeanShift是一个名词,它指代的是一个向量。但随着Mean Shift理论的发展,MeanShift的含义也发生了变化。如果我们说MeanShift算法,一般是指一个迭代的步骤,即先算出当前点的偏移均值,移动该点到其偏移均值,然后以此为新的起始点继续移动,直到满足一定的条件结束。

在很长一段时间内,MeanShift算法都没有得到足够的重视,直到1995年另一篇重要论文的发表。该论文的作者Yizong Cheng定义了一族核函数,使得随着样本与被偏移点的距离不同,其偏移量对均值偏移向量的贡献也不同。其次,他还设定了一个权重系数,使得不同样本点的重要性不一样,这大大扩展了MeanShift的应用范围。此外,还有研究人员将非刚体的跟踪问题近似为一个MeanShift的最优化问题,使得跟踪可以实时进行。目前,利用MeanShift进行跟踪已经相当成熟。MeanShift算法其实是一种核密度估计算法,它将每个点移动到密度函数的局部极大值点处

下面介绍MeanShift算法的理论:

给定d维空间Rd的n个样本点,i=1,…,n.则核密度估计函数可以表示为:

核函数K(x)满足如下关系:

归一化:

对称性:

权重的指数衰减:

    ?????条件:

其中上式c为常数。对于有限数量的data,实际应用中K(x)有两种获取的形式:

    

第一种形式,在各个维度上都使用相同的函数k(x),第二种形式表示只使用了向量的长度。因为||*||表示欧式距离。在Rd表示的d维空间中,参数h是样本数量n的函数,应当满足,从而保证估计的渐进无偏性。为了确保估计的均方一致性,h需要满足条件:。为了确保全局一致性,h需要满足条件.

其中,当核函数采用Epanechnikov核时,均方误差最小。Epanechnikov核表示为:

其中为d维单位球体体积。另外一个也被用到的核函数为高斯核:

定义核函数的轮廓(profile,也可翻译为剖面函数)函数k(x)满足k:[0,)->R,即

其中为归一化常数,保证K(x)积分为1,且严格为正。由此带入最初的核密度估计函数,可将核密度估计函数重写为:

下面介绍Kernel DensityGradient Estimation:

定义一个轮廓函数(profile),并且构造出g(x)的核函数:

参考文献中说K(x)was called the shadow of G(x),这里不太理解这个shadow的意思?同样也说Epanechnikov kernel is the shadow of the uniform kernel??

根据核函数的可微性,密度梯度估计恒等于核密度估计的梯度,可以得到:

将g(x)带入上式得到:

MeanShift算法(一)_第1张图片

假设大于0。可以得到关于核函数G在点x的表达式如下,可理解为以G为核函数对概率密度函数f(x)的估计:


则mean shift向量可表示为:

以核函数作为权重,x作为窗口的中心。

上面的式子表明,在点x处,基于核函数G(x)的mean shift向量与基于核函数K(x)的密度梯度估计仅相差一个常数的比例系数。而梯度是指密度变化最大的方向,所以mean shift向量也是指向密度增大最大的方向。

反复进行以下步骤就是MeanShift算法的过程:

1)计算mean shift向量

2)根据,移动核(窗口);

3)若,则结束循环,否则继续迭代。

最终核函数的中心点收敛到数据空间中密度最大的点,它的密度梯度估计为0。mean shift向量也总是指向密度增大最大的方向,这可由上式的分子项来保证。而分母项则表示每次迭代核函数移动的步长。在不包含兴趣特征的区域内,步长较长;在感兴趣的区域内,步长较短。即MeanShift算法是一个变步长的梯度上升算法,或称为自适应梯度上升算法。

小结:

根据mean shift向量,定义半径为h的高维球区域S­h,并满足一下关系的y点的集合:

k表示在这n个点xi中,有k个点落入h区域中。

我们可以看到(xi - x)是样本点xi相对于点x的偏移向量。mean shift向量就是对落入区h中的k个样本点相对于点x的偏移向量求和然后再平均。从直观上看,如果样本点xi从一个概率密度函数f(x)中采样得到,由于非零的概率密度梯度指向概率密度增加最大的方向。因此从平均上来说,区域内的样本点更多的落在沿着概率密度梯度的方向。因此,对应的mean shift向量应该指向概率密度梯度的方向。如下图所示:

MeanShift算法(一)_第2张图片


大圆圈所圈定的范围就是h,小圆圈代表落入h区域内的样本点黑点就是meanshift的基准点箭头表示样本点相对于基准点x的偏移向量很明显的我们可以看出平均的偏移向量会指向样本分布最多的区域也就是概率密度函数的梯度方向。把每个偏移向量相加就可以得到meanshift向量,再以meanshift向量的终点,即质心画球,移动,重复此过程即可收敛到概率密度最大的方向。即最稠密,密集的地方。




你可能感兴趣的:(Image,Processing)