说到尺度空间理论最早可以追溯到1962年的T.Iijima最先提出,学术界开始关注尺度空间技术主要在1986年IEEE PAMI上同时刊出的4篇关于尺度空间理论的文章奠定了发展基础。现实世界中物体只有具备一定的尺度才能够倍人眼所察觉,计算机视觉学术研究就是在不断的尝试与突破来模拟人眼的观察方法。因此,尺度空间就是试图在图像领域中模拟人眼观察物体的概念与方法。例如:观察一颗树,关键在于我们想要观察是树叶子还是整棵树:如果是一整棵树(相当于大尺度情况下观察),那么就应该去除图像的细节部分。如果是树叶(小尺度情况下观察),那么就该观察局部细节特征。
构建尺度空间的过程中,其实是在不断的去除细节过程同时不能够引进新的错误细节特征。想想尺度空间金字塔进行高斯滤波时候,原始图像保存最多的细节特征,经过高斯滤波后细节特征逐渐减少来模拟大尺度情况下的特征表示。那么,什么是尺度空间?能否给尺度空间技术有个数学上定义或者判断准则呢?示例参考于:
尺度空间多为多尺度技术的分支和作为金字塔概念的延伸与发展,一般尺度的概念可以有以下几种表示:
1 以图像分辨率作为评判准则(图像在多分辨率情况下展示的物体)。
2 人眼观察图像轮廓大小的标准。
3 观察物体距离的远近作为判断标准。
4 滤波卷积核参数作为判断标准。
现实情况下物体距离观察者所处位置的远近而呈现出不同的表达,如人眼观察物体在不同的尺度下感受不同,距离较远时观察到的是主要轮廓区域,近距离下观察到更多的细节信息。大尺度参数情况下,高频信息丢失严重,主要显示大致轮廓信息,高频段细节被称作图像中显著的特征。高频信息在视觉领域易于发现与辨识,能够运用于进行特征提取、目标识别等任务。这就是不同尺度下所带来的效应。计算机视觉中的多尺度技术想要表达的基本思想是大尺度情况下图像模糊轮廓形状是小尺度情况下图像轮廓形状的采样。
尺度空间能够很好的模拟人眼观察事物的情况,因此在计算机视觉领域中得到很好的应用。构建尺度空间方法主要分为两类:线性尺度空间与非线性尺度空间。其实线性与非线性尺度空间的主要区别在于滤波核函数的不同。线性尺度空间主要核函数是高斯核函数:其计算简单,高效。同时高斯核函数是唯一的尺度不变核函数尺度不变性论文。但是,高斯函数主要的缺点在于无法有效的分辩均匀区域与边缘区域,都是相同的滤波尺度,导致丢失大量局部细节。所以,针对高斯滤波的缺陷,非线性尺度空间理论被提出与应用。非线性滤波核函数当下主要有:双边滤波、非线性扩散滤波等。非线性滤波函数主要解决高斯滤波无法有效分辨均匀与边缘的判决,因此非线性滤波核函数能够保留更多的(高频)边缘信息同时滤波均匀区域。当然,非线性滤波核函数计算复杂度也随之提升。
说到SIFT算法在构建尺度空间过程可以归纳为:不同大小的高斯核函数对图像进行卷积滤波同时在层级变换之间进行下采样来构建金字塔模式下的尺度空间。SIFT算法在构建尺度空间时候采取高斯核函数进行滤波,主要原因有两个:1 高斯核函数是唯一的尺度不变核函数。2 DoG核函数可以近似为LoG函数,这样可以使特征提取更加简单。同时,David. Lowe作者在论文中提出将原始图像进行2倍上采样后滤波能够保留更多的信息便于后续特征提取与匹配。其实尺度空间图像生成就是当前图像与不同尺度核参数 σ σ 进行卷积运算后产生的图像。
那么下面就以图像方式表述一下尺度空间构建过程:
每组内(单纯X方向)相邻尺度关系为:
不同滤波核函数构建尺度空间图像后如何进行尺度空间评价?虽然高斯核是唯一的线性尺度不变核函数。但是,采取其它滤波核函数构建后的尺度空间(例如:Box Filter、双边滤波、非线性扩散滤波等等)图像如何进行评价,哪种滤波核函数更好滤除噪声,哪种更能够保持尺度最大程度的不变性等等。文章Is SIFT Scale Invariant?通过数学推导和实验来论证SIFT算法的尺度不变性:主要从1 图像初始尺度已知情况下表明其完全尺度不变性,即使图像初始尺度估计偏差较大也可以通过多尺度方式来减少误差; 2 高斯模糊下对比香农抽样和DFT抽样方法实际有效性。具体推导公式参见论文。其实个人见解评价尺度空间的好坏主要可从以下几个方面:均匀区域变化越大越好,边缘区域变化越小越好。大尺度情况下插值后图像信息损失量越小越好。不要破坏局部区域的像素间关系,期待构建过程中按照等比例过程中进行变化。个人见解,如有错误还请批评指正!
Github: https://github.com/SmallMunich/sift_scale_visualstudio2015/tree/master
http://www.cs.ubc.ca/~lowe/pubs.html
http://www.diva-portal.org/smash/get/diva2:457189/FULLTEXT01
http://www.cmap.polytechnique.fr/~yu/publications/IPI_SIFT_scale_invariance.pdf
https://wenku.baidu.com/view/ef3de2f07c1cfad6195fa7d9.html