Mean Shift向量:偏移的均值向量。定义如下:对于给定 d 维空间Rd中的 n 个样本点xi,i=1,2,…,n在 x d点的Mean Shift向量的基本形式定义为:
直观上来看,这 k 个样本点在x处的偏移向量即为:对落入 Sh 区域中的 k 个样本点相对于点x的偏移向量求和然后取平均值;
几何解释为:如果样本点 xi 服从一个概率密度函数为 f(x) 的分布,由于非零的概率密度函数的梯度指向概率密度增加最大的方向,因此从平均上来说, Sh 区域内的样本点更多的落在沿着概率密度梯度的方向。因此,Mean Shift向量 Mh(x) 应该指向概率密度梯度的方向。如图(图片来源)所示:
Mean Shift算法:指一个迭代的步骤,即先算出当前点的偏移均值,移动该点到其偏移均值,然后以此为新的起始点,继续移动,直到满足一定的条件结束。
结合上图,算法实施过程为:原点是选定的初始迭代点,将蓝色圆(其半径记为h)内所有向量相加,相加的结果如黄色向量所示,其终点指向上图所示的红色点,则下一次迭代以该红色点为圆心,h为半径画圆,然后求这个圆内以圆心为起点所有向量的和。如此迭代下去,圆的中心点为收敛于一个固定的点,也就是概率密度最大的地方。所以 均值漂移算法本质上是一种基于梯度的优化算法。
上述过程即为最初的Mean Shift算法,只不过后来引入 核函数 泛化了该算法。先略过核函数的理论知识,探究OpenCV中meanShift函数的用法,其函数原型如下:
int meanShift(InputArray probImage, Rect& window, TermCriteria criteria)
probImage : Back projection of the object histogram. See calcBackProject() for details.
window : Initial search window.
criteria : Stop criteria for the iterative search algorithm.
在上面Mean Shift向量的计算过程中我们并没有考虑距离因素,即只要两个采样点在均值向量方向上的投影相等,则它们对Mean Shift向量计算的贡献就一样。所以Mean Shift中引入kernel的初衷是:随着样本与被偏移点的距离不同,其偏移量对Mean Shift向量的贡献也不同。
一直以为Mean Shift涉及到的kernel就是平常DL中的kernel,但看到其定义我不确定还是不是我所认识的kernel了,直接贴wiki上的定义:
Let X be the n-dimensional Euclidean space Rn, A function K: X→R is said to be a kernel if there exists a profile, k:[0,∞]→R , such that K(x)=k(∥x∥2) and
(1)k is non-negative.
(2)k is nonincreasing: k(a)≥k(b) if a<b .
(3)k is piecewise continuous and ∫∞0k(r)dr<∞
Flat kernel:
Gaussian kernel:
此外,在拓展Mean Shift算法的过程中,对每个样本点设定一个权重系数,使得不同的样本点对计算Mean Shift向量的重要性不一样。引入核函数和样本点加权的Mean Shift算法具有如下形式:
实际应用中,带宽矩阵 H 常被限制为对角阵,特别地,最为常见的带宽矩阵为H=h2I。则Mean Shift向量的计算公式为:
特别地,当 w(xi)=1 , 核函数采用flat kernel时,上式退化为最开始的Mean Shift向量计算公式。
值得说明的是,Mean Shift在统计学中属于无参密度估计的范畴,事实证明Mean Shift向量 Mh(x) 是归一化了的概率密度梯度。这部分有时间再单独总结吧。
Mean Shift算法:
(1)计算 mh(x)=∑n1G(xi−xh)w(xi)xi∑n1G(xi−xh)w(xi) ;
(2)将 mh(x) 赋给 x ;
虽然Mean Shift的理论知识大概总结完了,但还是觉得有点囫囵吞枣【汗】,为了加深理解,还是从OpenCV中扒meanshift API的源码吧。
#include "precomp.hpp"
// Name: cvMeanShift
// Purpose: MeanShift algorithm
// Context:
// Parameters:
// imgProb - 2D object probability distribution
// windowIn - CvRect of CAMSHIFT Window intial size
// numIters - If CAMSHIFT iterates this many times, stop
// windowOut - Location, height and width of converged CAMSHIFT window
// len - If != NULL, return equivalent len
// width - If != NULL, return equivalent width
// Returns:
// Number of iterations CAMSHIFT took to converge
// Notes:
cvMeanShift( const void* imgProb, CvRect windowIn,
CvTermCriteria criteria, CvConnectedComp* comp )
CvMoments moments;
int i = 0, eps;
CvMat stub, *mat = (CvMat*)imgProb;
CvMat cur_win;
CvRect cur_rect = windowIn;
if( comp )
comp->rect = windowIn;
moments.m00 = moments.m10 = moments.m01 = 0;
mat = cvGetMat( mat, &stub );
if( CV_MAT_CN( mat->type ) > 1 )
CV_Error( CV_BadNumChannels, cvUnsupportedFormat );
if( windowIn.height <= 0 || windowIn.width <= 0 )
CV_Error( CV_StsBadArg, "Input window has non-positive sizes" );
windowIn = cv::Rect(windowIn) & cv::Rect(0, 0, mat->cols, mat->rows);
criteria = cvCheckTermCriteria( criteria, 1., 100 );
eps = cvRound( criteria.epsilon * criteria.epsilon );
for( i = 0; i < criteria.max_iter; i++ )
int dx, dy, nx, ny;
double inv_m00;
cur_rect = cv::Rect(cur_rect) & cv::Rect(0, 0, mat->cols, mat->rows);
if( cv::Rect(cur_rect) == cv::Rect() )
cur_rect.x = mat->cols/2;
cur_rect.y = mat->rows/2;
cur_rect.width = MAX(cur_rect.width, 1);
cur_rect.height = MAX(cur_rect.height, 1);
cvGetSubRect( mat, &cur_win, cur_rect );
cvMoments( &cur_win, &moments );
/* Calculating center of mass */
if( fabs(moments.m00) < DBL_EPSILON )
inv_m00 = moments.inv_sqrt_m00*moments.inv_sqrt_m00;
dx = cvRound( moments.m10 * inv_m00 - windowIn.width*0.5 );
dy = cvRound( moments.m01 * inv_m00 - windowIn.height*0.5 );
nx = cur_rect.x + dx;
ny = cur_rect.y + dy;
if( nx < 0 )
nx = 0;
else if( nx + cur_rect.width > mat->cols )
nx = mat->cols - cur_rect.width;
if( ny < 0 )
ny = 0;
else if( ny + cur_rect.height > mat->rows )
ny = mat->rows - cur_rect.height;
dx = nx - cur_rect.x;
dy = ny - cur_rect.y;
cur_rect.x = nx;
cur_rect.y = ny;
/* Check for coverage centers mass & window */
if( dx*dx + dy*dy < eps )
if( comp )
comp->rect = cur_rect;
comp->area = (float)moments.m00;
return i;
int cv::meanShift( InputArray _probImage, Rect& window, TermCriteria criteria )
CvConnectedComp comp;
Mat probImage = _probImage.getMat();
CvMat c_probImage = probImage;
int iters = cvMeanShift(&c_probImage, window, (CvTermCriteria)criteria, &comp );
window = comp.rect;
return iters;
最后,在理解源码的过程中参考了一下这篇博客,发现博主关于Mean Shift算法的总结甚是明了,在此引用之: