一幅图可以定义为一个二位函数f(x,y),其中x和y是空间(平面)坐标,而在任何一对空间坐标(x,y)处的幅值f称为图像在该点的强度和灰度。当x,y和幅度值f是有限的离散数值时,我们称该图像为数字图像。数字图像处理是指借助于数字计算机来处理数字图像。注意,数字图像是由有限数量的元素组成的,每个元素都有一个特定的位置和幅度。这些元素被称为图画元素、图像元素或像素。
用f(x,y)的二维函数来表示图像。
f(x,y)=i(x,y)r(x,y)
i(x,y):入射分量,入射到被观察场景的光源照射总量
r(x,y):反射分量,场景中物体所反射的光照总量
0 0 f(x0,y0)表示图像在(x0,y0)处的强度,值在【Lmin,Lmax】之间。区间【Lmin,Lmax】称为灰度级,实际情况中令该区间为【0,L-1】,0为黑色,L-1为白色。 将一幅图片进行数字化,对坐标和幅值进行取样操作,对坐标值进行数字化称为取样,对幅值数字化称为量化。 对于一幅M×N(M和N为正整数)大小的图像,出于存储和量化硬件的考虑,灰度级L通常取为2k。假设离散灰度级是等间距的,且它们是区间【0,L-1】内的整数。上限取决于饱和度(超过这个值的灰度级被剪掉的一个最高值),下限取决于噪声(灰度较暗的区域的噪声区域,掩盖了可检测的最低真实灰度级) 存储数字图像所用的比特数b为:b=M×N×k 空间分辨率是图像中可辨别的最小细节的度量。在数量上,空间分辨率可以有很多方法来说明,其中单位距离的线对数和单位距离的点数(像素数)是最通用的度量。广泛使用的图像分辨率的定义是单位距离内可分辨的最大线对数量(譬如每毫米100个线对)。单位距离的点数是印刷和出版业中常用的图像分辨率的度量。 灰度分辨率是指在灰度级中可分辨的最小变化。 内插是在诸如放大、收缩、旋转和几何校正等任务中最广泛应用的基本工具。 最近邻内插法(不常用): 双线性内插法(常用): 4个系数可用由点(x,y)的4个最近邻点写出的未知方程确定。 双三次内插法,包括16个最近邻点: v ( x , y ) = ∑ i = 0 3 ∑ j = 0 3 a i j x i y j v(x,y) = \sum_{i=0}^3\sum_{j=0}^3 a_{ij}x^iy^j v(x,y)=i=0∑3j=0∑3aijxiyj 像素p的4个水平垂直相邻像素:(x+1,y) (x-1,y) (x,y+1) (x,y-1) 称为p的4邻域,用 N 4 ( p ) N_4(p) N4(p)表示 图像处理方法最重要的分类依据之一是,它是非线性还是非线性的。 两个图片进行加减乘除,是对每个像素进行操作。 针对降噪的待噪图像相加 g ‾ ( x , y ) \overline{g}(x,y) g(x,y)= 1 K ∑ i = 1 K g i ( x , y ) \frac{1} {K}\sum_{i=1}^Kg_i(x,y) K1∑i=1Kgi(x,y) 增强差别的图像相减 使用图像相乘和相除来校正阴影 如果h(x,y)已知,那么我们可以使用h(x,y)的反函数乘以感知图像得到f(x,y)。h(x,y)未知,但图像系统可以访问,我们可以通过对具有恒定灰度的目标成像得到一个近似的阴影函数。 大多数图像用8比特显示(即使24比特的彩色图像也是由分立的三个8比特通道组成的)。这样,我们认为图像的灰度值范围为0~255。两幅8比特图像的不同取值范围可以是从最小的-255到最大的255,图像之和取值可能范围在0到510之间,给定一幅图像f,保证图像间算术操作的整个值域落入某个固定比特数的方法如下: f m = f − m i n ( f ) f_m=f-min(f) fm=f−min(f) #该操作生成最小值为0的一幅图像 几何空间变换: 最常用的空间坐标变换之一是仿射变换: 做变换时可考虑最近邻、双线性和双三次内插技术。 图像标配:用于对其两幅或多幅相同场景的图像,对图像几个畸形进行修正 找约束点,这些点是在输入图像和参考图像中其位置恰好已知的相应点。 (v,w)和(x,y)分别为输入图像和参考图像中约束点的坐标,带入4个点求得c1c2…c8图像的量化和取样
当M=N时:b=N²k 。
当一幅图片有2k个灰度级时,实际通常称该图像为一幅“k比特图像”。1.空间和灰度分辨率
2.图像内插
图像重取样方法:收缩和放大(本章讨论)
假想一个放大的网格,使其与原图像有相同的间隔,然后将其收缩,使它准确地与原图像匹配。为了对覆盖的每个点赋以灰度值,我们在原图像中寻找最接近的像素,并把该像素的灰度赋给放大网格中的新像素,完成所有点的灰度赋值后,把图像扩展到原来规定的大小。
用四个最近邻去估计给定位置的灰度。令(x,y)为我们想要赋以灰度值的位置的坐标,并另v(x,y)表示灰度值。 v(x,y)=ax+by+cxy+d
像素间的基本关系
p的4个对角相邻像素的坐标为:(x+1,y+1) (x+1,y-1) (x-1,y+1) (x-1,y-1),用 N D ( p ) N_D(p) ND(p)表示。
这8个点称为p的8邻域。数学图像处理中所用数学工具介绍
线性操作和非线性操作
求最大值的操作是非线性的:{max像素矩阵a}+{像素矩阵b} not equal max{a+b}算术操作
另g(x,y)是无噪声图像f(x,y)被加性噪声n(x,y)污染后的图像,即 g(x,y)=f(x,y)+n(x,y)
随着带噪图像的数量增加,E( g ‾ ( x , y ) \overline{g}(x,y) g(x,y))逼近f(x,y) g(x,y)=f(x,y)-h(x,y)
假设一个成像传感器产生可由f(x,y)表示的完美图像与阴影函数h(x,y)的乘积来建模的图像,即 g(x,y) = f(x,y)h(x,y)
图像相乘的另一种普通应用是模板操作,也称为感兴趣区域(ROI)操作。
f s = K [ f m / m a x ( f m ) f_s = K[f_m/max(f_m) fs=K[fm/max(fm) #生成一幅标定的图像 f s f_s fs,值在[0,K]之间
这种方法可以用于所有的算术操作。
执行除法操作时要求讲一个较小的数加到图像的像素上,以避免除以0的情况。空间操作
(x,y)=T{(v,w)} #(v,w)是原图像中像素的坐标,(x,y)是变换后图像像素的坐标。
[x y 1]=[v w 1]T
T= 1 0 0 0 1 0 0 0 1 \begin{matrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \\ \end{matrix} 100010001
坐标公式 x=v,y=w
T= c x 0 0 0 c y 0 0 0 1 \begin{matrix} c_x & 0 & 0 \\ 0 & c_y & 0 \\ 0 & 0 & 1 \\ \end{matrix} cx000cy0001
坐标公式 x= c x c_x cxv,y= c y c_y cyw
T= c o s Θ s i n Θ 0 − s i n Θ c o s Θ 0 0 0 1 \begin{matrix} cos\Theta & sin\Theta & 0 \\ -sin\Theta & cos\Theta & 0 \\ 0 & 0 & 1 \\ \end{matrix} cosΘ−sinΘ0sinΘcosΘ0001
坐标公式 x=vcos Θ \Theta Θ- wsin Θ \Theta Θ,y=vsin Θ \Theta Θ+wcos Θ \Theta Θ
T=
1 0 0 0 1 0 t x t y 1 \begin{matrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ t_x & t_y & 1 \\ \end{matrix} 10tx01ty001
坐标公式 x=v+ t x t_x tx,y=w+ t y t_y ty
坐标公式 x=v s v s_v sv+w,y=w
坐标公式 x=v,y= s h s_h shv+w
假设在输入图像和参考图像中有一组4个的约束点: x=c1v+c2w+c3vw+c4
y=c5v+c6w+c7vw+c8
变换模型就建立好了