1.2 SIFT特征检测的步骤
其中,是高斯核函数:
称为尺度空间因子,它是高斯正态分布的标准差,反映了图像被模糊的程度,其值越大图像越模糊,对应的尺度也就越大。代表着图像的高斯尺度空间。
设kk为相邻两个高斯尺度空间的比例因子,则DoG的定义:
高斯金字塔有多组,每组又有多层。一组中的多个层之间的尺度是不一样的(也就是使用的高斯参数σ是不同的),相邻两层之间的尺度相差一个比例因子k。如果每组有S层,则。上一组图像的最底层图像是由下一组中尺度为2σ的图像进行因子为2的降采样得到的(高斯金字塔先从底层建立)。高斯金字塔构建完成后,将相邻的高斯金字塔相减就得到了DoG金字塔。
高斯金字塔的组数一般是
其中o为所在的组,s为所在的层,为初始的尺度,S为每组的层数。算法实现中,就是首先将原图像的长和宽各扩展一倍。S=3,从这里可以得知同一组内相邻层的图像尺度关系:
设S=3,也就是每组有3层,则,也就是有高斯金字塔每组有(S−1)3层图像,DoG金字塔每组有(S−1)3层图像,DoG金字塔每组有(S-2)2层图像。在DoG金字塔的第一组有两层尺度分别是σ,kσ,第二组有两层的尺度分别是2σ,2kσ,由于只有两项是无法比较取得极值的(只有左右两边都有值才能有极值)。
由于无法比较取得极值,那么我们就需要继续对每组的图像进行高斯模糊,使得尺度形成,这样就可以选择中间的三项。对应的下一组由上一组降采样得到的三项是,其首项,刚好与上一组的最后一项的尺度连续起来。
通过比较检测得到的DoG的局部极值点实在离散的空间搜索得到的,由于离散空间是对连续空间采样得到的结果,因此在离散空间找到的极值点不一定是真正意义上的极值点,因此要设法将不满足条件的点剔除掉。可以通过尺度空间DoG函数进行曲线拟合寻找极值点,这一步的本质是去掉DoG局部曲率非常不对称的点。
要剔除掉的不符合要求的点主要有两种:
1.剔除低对比度的特征点
候选特征点x,其偏移量定义为,其对比度为H(x),其绝对值∣H(x)∣,对H(x)应用泰勒展开式:
由于x是H(x)的极值点,所以对上式求导并令其为0,得到
然后再把求得的代入到H(x)的泰勒展开式中:
设对比度的阈值为T,若,则该特征点保留,否则剔除掉。
2.剔除不稳定的边缘响应点
在边缘梯度的方向上主曲率值比较大,而沿着边缘方向则主曲率值较小。候选特征点的DoG函数H(x)的主曲率与3×3的Hessian矩阵HH的特征值成正比。
其中,是候选点邻域对应位置的差分求得的。为了避免求具体的值,可以使用H特征值得比例。设为H的最大特征值,为H的最小特征值。可以得到:
其中,为矩阵H的迹,为矩阵H的行列式。设表示最大特征值和最小特征值的比值,则:
上式的结果与两个特征值的比例有关,和具体的大小无关,当两个特征值想等时其值最小,并且随着γγ的增大而增大。因此为了检测主曲率是否在某个阈值下,只需检测:
如果上式成立,则剔除该特征点,否则保留。
=========================================================================
经过上面的步骤已经找到了在不同尺度下都存在的特征点,为了实现图像旋转不变性,需要给特征点的方向进行赋值。利用特征点邻域像素的梯度分布特性来确定其方向参数,再利用图像的梯度直方图求取关键点局部结构的稳定方向。找到了特征点,也就可以得到该特征点的尺度,也就可以得到特征点所在的尺度图像.
计算以特征点为中心、以3×1.5为半径的区域图像的幅角和幅值,每个点的梯度的模以及方向可以通过以下公式求得:
计算得到梯度方向后,就要使用直方图统计特征点邻域内像素对应的梯度方向和幅值。梯度方向的直方图的横轴是梯度方向的角度(梯度方向的范围是0到360度,直方图每36度一个柱共10个柱,或者每45度一个柱共8个柱),纵轴是梯度方向对应梯度赋值的累加。
为了到更精确的方向,通常还可以对离散的梯度直方图进行插值拟合。具体而言,关键点的方向可以由和主峰值最近的三个柱值通过抛物线插值得到。在梯度直方图中,当存在一个相当于主峰值80%能量的柱值时,则可以将这个方向认为是该特征点辅助方向,一个特征值可以检测到多个方向。
得到特征点的主方向后,对于每个特征点可以得到三个信息,即位置、尺度和方向。由此可以确定一个SIFT特征区域,一个SIFT特征区域由三个值表示,中心表示特征点位置,半径表示关键点的尺度,箭头表示主方向。具有多个方向的关键点可以被复制成多份,然后将方向值分别赋给复制后的特征点,一个特征点就产生了多个坐标、尺度相等,但是方向不同的特征点。
=========================================================================
通过以上的步骤已经找到了SIFT特征点位置、尺度和方向信息,下面就需要使用一组向量来描述关键点也就是生成特征点描述子,这个描述符不只包含特征点,也含有特征点周围对其有贡献的像素点。描述子应具有较高的独立性,以保证匹配率。
特征描述符的生成大致有三个步骤:
为了保证特征矢量的旋转不变性,要以特征点为中心,在附近邻域内将坐标轴旋转θθ(特征点的主方向)角度,即将坐标轴旋转为特征点的主方向。旋转后邻域内像素的新坐标为:
旋转后以主方向为中心取 8×8的窗口。下图所示,左图的中央为当前关键点的位置,每个小格代表为关键点邻域所在尺度空间的一个像素,求取每个像素的梯度幅值与梯度方向,箭头方向代表该像素的梯度方向,长度代表梯度幅值,然后利用高斯窗口对其进行加权运算。最后在每个4×4的小块上绘制8个方向的梯度直方图,计算每个梯度方向的累加值,即可形成一个种子点,如右图所示。每个特征点由4个种子点组成,每个种子点有8个方向的向量信息。这种邻域方向性信息联合增强了算法的抗噪声能力,同时对于含有定位误差的特征匹配也提供了比较理性的容错性。
与求主方向不同,此时每个种子区域的梯度直方图在0-360之间划分为8个方向区间,每个区间为45度,即每个种子点有8个方向的梯度强度信息。对每个关键点使用4×4共16个种子点来描述,这样一个关键点就可以产生128维的SIFT特征向量。
=========================================================================
代码实现:
#include"stdafx.h"
#include
#include
#include "math.h"
#include
#include
#include
using namespace cv;
using namespace std;
//using namespace cv::features2d;
int main(int argc, char** argv) {
Mat src = imread("F:/photo/i.jpg", IMREAD_GRAYSCALE);
if (src.empty()) {
printf("could not load image...\n");
return -1;
}
namedWindow("input image", WINDOW_AUTOSIZE);
imshow("input image", src);
int numFeatures = 400;
Ptr detector = SIFT::create(numFeatures);
vector keypoints;
detector->detect(src, keypoints, Mat());
printf("Total KeyPoints : %d\n", keypoints.size());
Mat keypoint_img;
drawKeypoints(src, keypoints, keypoint_img, Scalar::all(-1), DrawMatchesFlags::DEFAULT);
namedWindow("SIFT KeyPoints", WINDOW_AUTOSIZE);
imshow("SIFT KeyPoints", keypoint_img);
waitKey(0);
return 0;
}
效果实现: