sift 简述理解

尺度不变性
首先假想两张图片进行匹配,然后图A(1280*720),图B(640*480),两张图片都用不同的尺度得到高斯金字塔,继而得到DOG金字塔,然后图A总会进行降采样的时候得到与图B某个降采样得到的图差不多,然后都可以找到相同的特征点。他们总会在某个尺度下得到一定数量的特征,然后超过就匹配,这就是跟图像的尺度没关系了,因为两张图总会得到某个尺度下能匹配到特征。即一张图像可以得到所有尺度下的图片,然后进行寻找特征点,然后另一张图片也是。比如图A经过高斯滤波后有10组不同尺度图,每组3张图片,图B有10组,每组3张图片。然后图A的第一组图片中第一张依次与图B中第一组第一张进行比较,然后第二张第三张,如果没匹配就与第二组第一张进行比较,依次类推。

旋转不变性
因为有一个主方向,把坐标旋转到主方向,这就保证了不管要识别的图片是怎么旋转,如果是相同的特征点,总会旋转相同的角度,即主方向是相同的。

描述子
找到以特征点为中心的4*4区域,每个区域又有一个正方形的区域,这个正方形有n*n个像素,计算其每个像素的梯度幅值和幅角,并根据没个像素对中心特征点的贡献,即距离进行高斯加权。然后把这4*4的区域进行旋转,旋转的角度即为主方向的大小。然后以4*4为底,幅角为高,建立一个三维坐标,幅角的间隔为360/8=45度,这样就相当于8层4*4。接着4*4的每个子区域,比如子区域A,A有8个方向(0,45,90。。。360),然后计算A区域中像素的梯度幅角在0-45度上的幅值之和,接着计算像素的梯度幅角在45-90度方向上的幅值之和,这样A区域的8个方向都有对应的幅值,然后有16个A这样的子区域,每个A的位置是不一样的,所以有16*8=128维,这就是描述子,最后还要归一化。
 

 

 

参考:

https://blog.csdn.net/u014485485/article/details/78681086

https://blog.csdn.net/zddblog/article/details/7521424

https://www.cnblogs.com/shine-lee/p/10037463.html

你可能感兴趣的:(图像处理)