图像形成并被人类感知的基本原理,并根据数字图像处理时所用的一些要素来了解人类视觉的物理限制
光感受器 | 数量 | 分布位置 | 特性 |
---|---|---|---|
锥状体 | 600~700万个 | 主要分布在视网膜中央凹 | 对颜色高度敏感;每个锥状体连接自身的神经末梢,肌肉控制眼球转动,使部分区域图像落在中央凹,分辨细节;锥状体视觉被称为明/亮视觉 |
杆状体 | 7500~1500万个 | 分布面积大 | 捕获视野中的整个图像;没有色觉,对低光照敏感;杆状体视觉被称为暗/微光视觉 |
普通照相机:镜头的焦距固定,通过改变镜头和成像平面之间的距离来实现不同距离的焦距
人眼:晶状体与成像区域(视网膜)之间的距离是固定的,通过改变晶状体的形状得到正确聚焦的焦距
视网膜图像主要聚焦在中央凹区域,光感受器的相对激励作用产生感知,把辐射能量转换为最终由大脑解码的电脉冲
主观亮度:人类视觉系统感知的亮度
低照明级别,视觉由杆状体执行
高照明级别,视觉由锥状体执行
感知亮度不是实际灰度的简单函数
1.视觉系统往往会在不同灰度区域的边界处出现"下冲"或"上冲"现象,如马赫带现象
2.一个区域的感知亮度并不只是取决于其灰度,如同时对比现象
波长(λ)和频率(v)的关系
λ = c v \lambda = \frac{c}{v} λ=vc
c = 2.998*10^8 m/s 是光速
电磁波谱各分量的能量为
E = h v E=hv E=hv
电磁波可视为以波长λ传播的正弦波,或视为没有质量的粒子流,每个粒子像波浪一样行进并以光速运动,每个无质量的粒子都是具有一定能量的粒子,频率越高,能量越高。
可见光谱
感知物体的颜色由物体反射的光的性质决定,例如,绿色物体主要反射波长范围为500~570nm的光,并吸收其他波长的大部分能量
单色光:没有颜色的光,唯一属性是亮度,单色光从黑到白的数值范围通常称为灰度级,单色图像通常称为灰度图像
大多图像的产生:“照射”源和形成图像的“场景”元素对光能的反射或吸收
在某些应用中,反射的能量或透射的能量被聚焦到一个光转换器上,光转换器把能量转换成可见光
组合输入电能和传感器对正被检测能量的响应,将入射能量转换成电压。输出电压波形是传感器的响应,将传感器响应数字化,得到一个数字量
要使用单个传感器生成二维图像,传感器和成像区域之间必须要有x方向和y方向的相对位移。
以二维阵列形式排列各个感测元件
CCD(电荷耦合器件)阵列:可制造成具有较宽范围的传感特性,并能封装成具有更多单元的稳定阵列
f(x,y)来表示图像,在某一空间坐标处的f的值是一个标量,与物理源辐射的能量成正比,f(x,y)一定是非负的和有限的
0 ≤ f ( x , y ) < ∞ 0\le f(x,y)<\infty 0≤f(x,y)<∞
同时
f ( x , y ) = i ( x , y ) r ( x , y ) f(x,y)=i(x,y)r(x,y) f(x,y)=i(x,y)r(x,y)
0 ≤ i ( x , y ) < ∞ 0\le i(x,y)<\infty 0≤i(x,y)<∞
0 ≤ r ( x , y ) < 1 0\le r(x,y)<1 0≤r(x,y)<1
i(x,y)入射分量,取决于照射源
r(x,y)反射分量,取决于被成像物体的特性,限制在0(全吸收)1(全反射)之间
在投射成像的情况下,r(x,y)是透射分量
将一幅连续图像f转换为数字形式
取样(采样):对函数坐标值数字化
量化:对函数幅度值进行数字化
1.三维图像表示
2.可视灰度矩阵表示
3.二维数值阵列表示:矩阵中的每一个单元称为图像单元、图像元素或像素
MxN的数字图像的中心,M/N除以2后四舍五入最接近的整数得到
离散灰度级数L通常取2的整数次幂
L = 2 k L=2^k L=2k
动态范围:灰度跨越的值域
存储数字图像所需的比特数b:
b = M N k b=MNk b=MNk
当一幅图像具有2^k个可能的灰度级时,我们称该图像是一幅k比特图像
如256级图像称为一幅8比特图像
线性索引:由一个一维的非负整数串组成
分为行扫描和列扫描
空间分辨率:图像中最小可辨别细节的测度
如何定量的说明空间分辨率:使用单位距离的线对数和单位距离的点数(像素数)
点数/英寸(dpi):单位距离内可分辨的最大线对数,是印刷和出版业中常用的图像分辨率的测度
空间分辨率的测度必须针对空间单位声明才有意义,如果未声明图像包含的空间维数,那么说一幅图像的分辨率是没有意义的
灰度分辨率:灰度级中可分辨的最小变化,灰度级数通常是2的整数次幂,最常用的数是8比特;灰度分辨率通常是指量化灰度时所用的比特数(如8bit)
空间和灰度分辨率之间可能存在的关系
三类图像的等偏爱曲线
等偏爱曲线上的点对应于等主观质量的图像,越接近右上角喜爱程度越高
内插:用已知数据来估计未知位置的值的过程
例:如何将大小为500x500像素的一幅图像放大到750x750像素?
最近邻内插:创建一个750x750的假想网格,网格的像素间隔完全于原图像的像素间隔相同,然后收缩网格,使其完全于原图像重叠,收缩后的像素间隔要小于原图像,我们再下伏原图像中找到最接近的像素,并把该像素的灰度赋给750x750网格中的新像素
缺点:会产生人为失真
双线性内插:使用4个最近邻灰度计算给定位置的灰度
v ( x , y ) = a x + b y + c x y + d v(x,y)=ax+by+cxy+d v(x,y)=ax+by+cxy+d
4个系数可由4个最近邻点写出的4个未知方程求出
双三次内插:包括16个最近邻点
v ( x , y ) = ∑ i = 0 3 ∑ j = 0 3 a i j x i y j v(x,y)=\sum_{i=0}^{3} \sum_{j=0}^{3}a_{ij}x^iy^j v(x,y)=i=0∑3j=0∑3aijxiyj
4邻域(N_4( p )):(x+1,y), (x-1,y), (x,y+1), (x,y-1)
4对角相邻像素(N_D( p )):(x+1,y+1), (x+1,y-1), (x-1,y+1), (x-1,y-1)
8邻域:两者之和
V是用于定义邻接的灰度值集合
三种类型的邻接
混合邻接示意图
欧几里得距离
D e ( p , q ) = [ ( x − u ) 2 + ( y − v ) 2 ] 1 2 D_e(p,q)=[(x-u)^2+(y-v)^2]^\frac{1}{2} De(p,q)=[(x−u)2+(y−v)2]21
城市街区距离
D 4 ( p , q ) = ∣ x − u ∣ + ∣ y − v ∣ D_4(p,q)=|x-u|+|y-v| D4(p,q)=∣x−u∣+∣y−v∣
棋盘距离
D 8 ( p , q ) = m a x ( ∣ x − u ∣ , ∣ y − v ∣ ) D_8(p,q)=max(|x-u|,|y-v|) D8(p,q)=max(∣x−u∣,∣y−v∣)
线性运算
H [ f ( x , y ) ] = g ( x , y ) H[f(x,y)]=g(x,y) H[f(x,y)]=g(x,y)
H [ a f 1 ( x , y ) + b f 2 ( x , y ) ] = a H [ f 1 ( x , y ) ] + b H [ f 2 ( x , y ) ] = a g 1 ( x , y ) + b g 2 ( x , y ) H[af_1(x,y)+bf_2(x,y)]=aH[f_1(x,y)]+bH[f_2(x,y)]=ag_1(x,y)+bg_2(x,y) H[af1(x,y)+bf2(x,y)]=aH[f1(x,y)]+bH[f2(x,y)]=ag1(x,y)+bg2(x,y)
如求和算子Σ
非线性运算
非线性算子如最大值算子
使用图像相减比较图像
使用图像相乘/相除校正阴影和模板
单像素运算
s = T ( z ) s=T(z) s=T(z)
邻域运算
g ( x , y ) = 1 m n ∑ ( r , c ) ∈ S x y f ( r , c ) g(x,y)=\frac{1}{mn}\sum_{(r,c)\in S_{xy}}f(r,c) g(x,y)=mn1(r,c)∈Sxy∑f(r,c)
可进行局部平均
几何空间变换
改变图像中像素的空间排列,通常称为橡皮膜变换,类似于再一块橡皮膜上打印图像,然后根据预定义的一组规则来拉伸或收缩橡皮膜
由两种基本运算组成
(1)坐标的空间变换
(2)灰度内插
仿射变换
可以用该矩阵来表示所有4个仿射变换:缩放变换,平移变换,旋转变换,剪切变换
图像旋转和灰度内插
图像配准