关于尺度空间的理解

        通常会听到尺度变化等这类词语,看到的也总是一堆的数学公式,有时候真的不知道这到底有啥用,有啥意义,没有弄懂这些意义,当然就更不可能的理解,不可能去掌握应用它了,现在我才理解,小波变化其实也是一种尺度变化。今天我看到一篇南航数学系写的关于尺度空间解释的文章,感觉很通俗易懂,我们不从数学上来推倒什么是尺度空间,只是从生活常识方面来解释尺度空间的意义,意义懂了,数学方面自然就好理解了。

         好。首先我们提出一个问题,请看下面的图片,让我们我们人为的判断下所显示的左右图片中哪个的角尖锐?接下来我们慢慢的分析,在这其中我们会发现很有意思的事情。

关于尺度空间的理解_第1张图片


分析:
图1(a)中,显然右边的角更尖锐,这是因为同左边的角相比其角度值较小。
图1(b)中,也是右边的角更尖锐,这是因为同左边的角相比其曲率值较大。
图1(c)中的第三组角,问题的答案则要困难得多。左边的角一方面具有较小的角度值(因此更尖锐),另一方面又具有较小的曲率值(因此更圆钝)。右边的角情形刚好相反,一方面因为具有较大的角度值更圆钝,另一方面又因为具有较大的曲率值显得更尖锐。事实上,本问题对于第一组角和第二组角来说是纯粹的数学问题,依据数学上的基本概念(即角度、曲率) 便可以做出判断。而第三组中两个角之间的比较已经不再是纯粹的数学问题,在数学上没有明确的答案。有意思吧。确切地说,这是一个尺度空间中的视觉问题,其答案取决于问题所在的“尺度”而不是某个数学指标。这里,“尺度”可以被直观地理解为观察窗口的大小。
图1(c)中,我们观察两个角的窗口大小都是12*16。在图1(d)中,调整了观察窗口,其大小变成120*160(假设所比较的两个角都具有无限长的边)。

在这个较大的尺度下,问题的答案变得非常明朗:左边的角更加尖锐。
在图1(e)中,观察窗口的大小变更为6*8。
在这个较小的尺度下,问题的答案发生了有趣的变化:此时右边的角更加尖锐。


此例子的结果阐述了“尺度”对于解决视觉问题的重要性,即一个视觉问题的答案往往会依赖于其所在的尺度。在生活中这样的例子也比比皆是,比如要观察一棵树,所选择的尺度应该是“米”级;如果观察树上的树叶,所选择的尺度则应该是“厘米”级。一般来说,摄像设备所能呈现的画面分辨率是固定的。要以同样的分辨率分别观察树和树叶,我们需要调整摄像设备的摄像位置。因此,视觉问题中的“尺度”概念也可以被形象地理解为摄像设备与被观察物体之间的距离:较远的距离对应较大的尺度,较近的距离对应较小的尺度。

接下来我们看看第二个例子吧,看看图二中显示的图片那些事角点?

关于尺度空间的理解_第2张图片

图2(a)呈现了一片雪花的形状轮廓,要求我们找出该形状上的角点。在很多计算机视觉任务中,角点都有着重要的作用。数学上,角点一般是指大曲率点或曲率无穷大点。
在图2(b)中,雪花形状上所有曲率无穷大点都被确认为角点,一共有192个,如圆圈所标记。这个答案在数学上无疑是正确的、完美的令人惊奇的,但它对于完成一个视觉任务(比如理解和分析这个形状)来说并没有多大的意义。如果我们仅选择图2(c)中所标记出的48个点作为角点,感觉上要更好点。作为图2(b)中所标记的192个角点中的一部分,这48个角点在理解和分析雪花形状的结构时要比其余的角点具有更高的重要性。实际上,按照这一思路,我们不难发现在这48个角点中又有12个角点其重要性还要更高一些,如图2(d)中所标记。

 
同例1 一样,本例中问题的答案依赖于问题所在的尺度。当我们非常靠近雪花形状观察它时(即在较小的尺度下),能够看清楚所有的细节,却不容易感知其整体轮廓,从而倾向于不加区分地选取图2(b)中所标记的192 个点作为角点。反过来,当我们从一个很远的距离观察雪花形状时(即在较大的尺度下),虽然轮廓的细节已经模糊不清,但却能够一眼看出其整体结构,从而倾向于选取图2(d) 中所标记的12 个点作为角点。此外,图2(c) 中所标记的角点对于理解雪花形状也很有帮助。事实上,如果我们不是保守地将自己固定在某个尺度下来观察物体,便能够获得充足的视觉信息。比如说图2(b)-2(d) 所呈现的三组角点已经很好地向我们展示了雪花形状的三个结构层次。这一效果是其中的任意一组角点都无法实现的。


现实生活中视觉问题的复杂性也往往需要我们做到这一点:当我们去参观某处文化遗迹时,远远地就已经开始观察建筑物的外形,然后较近距离时开始注意到门窗、台阶、梁柱的建筑风格,最后会凑上前去细看门窗上的图案、石碑上的碑文等。当一部机器人也能够自主地做到这一点时,说明它已经具备了更高的人工智能。我们对尺度空间技术的研究也正是朝着这个方向努力。概括地说,“尺度空间”的概念就是在多个尺度下观察目标,然后加以综合的分析和理解。
这里用的是图像来解释尺度,当然,对于抽象的信号,理解还是一样的,不过到时候我们看的工具不是我们人眼或者是摄像机从外表区分了,这时候我们用的工具也可能是时域的分析法,也可能是频率域的傅里叶变化等分析法,它是我们进一步发现我们感兴趣事物的工具。最后贴点数学公式吧,不然不完美:

线性尺度空间技术:

其实现途径是将一维信号(如曲线的曲率函数)或二维信号(如图象)与高斯函数

g(x,t)=1/(sqrt(t*pi))*exp(-x^2/(4t))

作卷积运算。以一维信号f(x)为例,

f(x,t)=f(x)*g(x,t)=integration(f(u)g(x-u)du) 

其中t被当做尺度参数,其中尺度参数值t由小到大逐渐增加。在演化过程中,信号上的特征被提取并加以分析, 形成信号的尺度空间。


你可能感兴趣的:(机器学习)