知己知彼,百战不殆。了解人类的视觉感知,有助于我们学习数字图像处理。本小节中眼睛中图像的形成,让我联想到照相机成像,人眼的亮度适应和辨别让我想到手机屏幕的自动调节亮度。由于这部分知识属于横向扩展,在此就不摘录相关专有名词,读者可直接跳过学习。
之所以要了解光和电磁波普是因为原理上,如果可以开发出一种传感器来检测由一种电磁波谱发射的能量,那么我们就可以在该波段上对感兴趣的事件成像。
这个小节,主要介绍的是获取图像的几种方法。
单个成像传感器、条带传感器、阵列传感器将能量转换为数字图像的原理为:通过将输入电能和对特殊类型检测能源敏感的传感器材料相结合,把输入能源变成电压。输出电压波形是传感器的响应,通过把传感器响应数字化,从每一个传感器得到一个数字量。
单个传感器通过运动产生二维图像
圆环形方式安装的条带传感器可以得到三维图像。
在数字摄像机中 大量电磁波和一些超声波传感装置常以阵列行式排列。
f(x, y) = i(x, y) r(x, y) 其中f(x, y)用来表示图像,i(x, y)表示入射到被观察场景的光源照射总量,r(x,y) 表示场景中物体反射的光照总量。且 0 < i(x,y) < ∞ , 0 < r(x, y) < 1
为了产生一幅数字图像,我们需要把连续的感知数据转换为数字形式。在这种转换过程中包括了取样和量化两个操作。
一幅图像f,它的x和y坐标及幅度可能都是连续的。为将他转换为数字形式,必须在坐标轴上进行取样操作。对坐标值进行数字化称为取样,对幅值数字化称为量化。
通常使用矩阵来表示数字图像。
空间分辨率是图像中可辨别的最小细节的度量。
灰度分辨率是指灰度级中可分辨的最小变化。
内插是在放大、收缩、旋转和几何校正等任务中广泛应用的基本工具。内插是用已知数据来估计未知位置的数值的处理。有最近邻内插法、双线性内插和三线性内插。
(x + 1, y), (x - 1, y) , (x, y + 1), (x, y - 1)
对角像素 (x-1, y-1),(x-1, y+1), (x+1, y+1), (x+1, y-1)
8领域 (x,y)周围的八个像素点
邻接:仅考虑像素间的空间关系
连接:空间上邻接且像素灰度值相似
连通性:像素之间具有通路,且通路上的所有像素灰度值满足相似准则
对于像素p,q和z,分别具有坐标(x,y), (s,t), (u,v), 如果:
a. D(p,q) >= 0 [D(p,q)=0, 当且仅当p=q]
b. D(p,q) = D(q,p)
c. D(p,z) <= D(p,q) + D(q,z)
则D是距离函数或度量
【欧氏距离、城市距离又称D4距离、棋盘距离又称D8距离】
包含一幅或多幅图像的阵列操作是以逐像素为基础执行的。
线性操作是对像素点使用线性方程,非线性操作是对像素使用非线性方程像对数幂次方。
对像素点进行加减乘除操作达到对图像的锐化,去噪等效果
用几何表示图像,可以分析图像之间的关系 包含不包含,求并集,补集等
逻辑运算 || && !
空间操作直接在给定图像的像素上执行。我们把空间操作分为三大类:
(1) 单向素操作 对像素进行线性或非线性的操作
(2)领域操作 对像素的领域像素进行操作
(3)几何空间变换 几何变换改进图像中像素间的空间关系。由坐标的空间交换和灰度内插两个 基本操作
多光谱图像处理是使用向量和矩阵操作的典型领域。
图像变换涉及到傅里叶变换
在开发图像算法中,概率的概念起着核心角色的作用。