数字图像处理第二章
图像的感知与获取
传感器的作用:光“照射”到传感器上,传感器会将光数字化。
2.使用条带传感器获取图像
本质上是和单个传感器获取图像的方式类似,通过条带传感器的移动获取一幅图像的像素。
3.使用阵列传感器获取图像
光照射到传感器上,经过光学透镜,将观察的场景投射到传感器阵列,产生与每个传感器接收到的总光量成正比的输出。数字和模拟电路扫描这些输出并把它们转换成模拟信号,然后由成像系统的其他部分数字化,输出数字图像。
4.一个简单的成像模型
用形如f(x,y)的二维函数来表示图像。在空间坐标(x, y)处f的值是一个标量,其物理意义由图像源决定,其值与物理源(如电磁波)辐射的能量成正比。因此,f(x,y)一定是非负的,有限的,即
0≤f(x,y)<∞
令单色图像在坐标(x,y)处的亮度(灰度)为f(x,y),则其会有一个取值范围,例如[0,255],称为亮度级(灰度级),0为黑色,最大值为白色,中间值代表由黑色变化到白色的色调。
比如,为灰度图,其灰度有256级[0,255]
图像取样和量化
1.取样和量化的基本概念
一幅连续图像f,我们需要把它转换为数字形式。一幅图像的x坐标和y坐标是连续的,其幅度也是连续的。要将函数数字化,就要对该函数的坐标和幅度进行取样。对坐标值进行数字化称为取样(或采样),对幅度值进数字化称为量化。
取样点越多越密集=像素越高,量化的灰度级数越多色彩显示越精细.
2.数字图像表示
数字图像f(x,y),该图像包含有M行和N列,其中(x,y)是离散坐标。为表达清楚和方便起见,我们对这些离散坐标使用整数值:x=0,1,2,……,M-1和y=0,1, ……,N-1。这样,数字图像在原点位置的值就是f(0,0),第一行中下一个坐标位置的值是f(0,1)。这里,符号(0,1)表示第一行的第二个样本。由图像的坐标张成的实平面部分称为空间域,x和y称为空间变量或空间坐标。
用传统的矩阵形式表示图像:
矩阵中的每个元素称为图像单元、图像元素或像素。矩阵的第一个元素按照惯例应在矩阵的左上角。
图像数字化要求对M值、N值和离散灰度级数L进行判定。出于存储和量化硬件的考虑,灰度级数通常取为2的整数次幂,即
例如灰度级为256级,即2^8,取值为[0,255].
·饱和度是指一个最大值,超过该值的所有灰度值将被裁剪掉(注意整个饱和区域具有恒定的高灰度级,如255)。
·动态范围(Dynamic Range)是图像传感器最重要的参数之一,它决定了图像传感器能接收的最暗的阴影部分到最亮的高光部分的光亮强度分布范围。本书中定义为系统中最大可度量灰度与最小可检测灰度之比。反映了系统所能表示的图像所具有的最低和最高灰度级。
·图像对比度:一幅图像中最高和最低灰度级间的灰度差。
·图像大小的计算:存储数字图像所需的比特数b为
3.线性索引和坐标索引
像素的位置由其二维坐标给出的约定,称为坐标索引或下标索引。在图像处理算法编程中广泛使用的另一种索引是线性索引,它由一个一维的非负整数串组成,这个非负整数串是通过计算到坐标(0, 0)的偏移量得到的。线性索引主要有两种, 一种基于图像的行扫描,另一种基于图像的列扫描。
生成列扫描线性索引的公式:对于任何坐标对(x, y),对应的线性索引值是
给定线性索引值a的坐标索引由如下公式给出:
4.空间分辨率和灰度分辨率
*空间分辨率:空间分辨率是图像中最小可辨别细节的测度。我们可用几种方式来定量地说明空间分辨率,其中单位距离的线对数和单位距离的点数(像素数)是最常用的测度。假设我们用交替出现的黑色和白色垂线构造一幅图形,其中每条垂线的线宽为W单位( W可以小于1)。于是,线对的宽度是2W,单位距离内有W/2个线对。例如,如果一条线的宽度是 0.1mm,那么单位距离( 1mm)内就有5个线对。广泛使用的图像分辨率的定义是单位距离内可分辨的最大线对数(如每毫米100个线对)。点数/单位距离是常用的图像分辨率的测度。在美国,这一测度通常使用点数/英寸( dpi)表示。例如,报纸的印刷分辨率为75dpi,杂志的印刷分辨率为133dpi,广告页的印刷分辨率为175dpi,本书正文的印刷分辨2400dpi。它指在实际设备上
灰度分辨率:灰度分辨率通常是指量化灰度时所用的比特,例如,我们常说一幅灰度被量化为256级的图像,其灰度分辨率为8比特。
灰度分别为16,8,4,2
5.图像内插(将分辨率较低的图像转化为分辨率较高的图像)
最近邻内插:把原图像中最近邻的灰度赋给了每个新位置,最简单, 但会造成严重的直边失真。
双线性内插:用4个最近邻点去估计给定位置的灰度,可给出比最 近邻内插好得多的结果,但随之而来的是计算量的增加。注意:双线性内插不是一种线性内插方法。
双三次内插:用16个最近邻点,复杂度较高,在保持细节方面比双线性内插相对要好。
像素间的基本关系
坐标(x,y)处的像素p有2个水平的相邻像素和2个垂直的相邻像素,它们的坐标是
(x+1,y),(x-1,y),(x,y+1),(x,y-1)
这组像素称为p的4邻域,用N4(p) 表示。
p的4个对角相邻像素的坐标是
(x+1,y+1),(x+1,y-1),(x-1,y+1),(x-1,y-1)
用ND(p)表示。这些相邻像素和4邻域合称为p的8邻域,用N8(p)表示。点p的相邻像素的图像位置集称为p的邻域。如果一个邻域包含 p,那么称该邻域为闭邻域,否则称该邻域为开邻域。
1)邻接
令V是用于定义邻接性的灰度值集合(二值图像中,指值为1的像素邻接,则V={1})
PS:m邻接是为了消除8邻接的二义性而引进的。如下图中矩阵中,右上角1到右下角1,按照8邻接则有两条路,而m邻接仅1条路。
总结:判断两个像素是否邻接的条件:①两个像素位置是否相邻(4、8、m邻接);②两个像素的灰度值是否满足某个特定的相似性准则(在集合V中)。
2)连通
通路:如果从(x0,y0)像素点到(xn,yn)像素点,其中的每个点与前后都是K邻接的(K代表4、8、m),则说这两个像素之间存在一条K通路。若(x0,y0)和(xn,yn)是重合的,那么说这是一条闭合通路。
(K指该通路的各像素邻接类型,而n指该通路的长度。)
连通:对于图像中的某一个像素子集S和S中的任意两个像素p、q,如果p和q之间有一个由S中全部元素构成的通路,则称像素p和q在S中是连通的。
连通分量:对于像素子集S中任意像素p,在S中连通至该像素p的像素集称为S的连通分量。
连通集:若S只有一个连通分量,则S称为连通集。
(什么时候会存在多个连通分量?——根据通路中各像素邻接类型K,对于S中像素p来说,不同类型的通路可能会导致连通至像素p的像素集不同,即导致不同的连通分量。)
区域:若图像子集S是一个连通集,则S称为图像的一个区域。
邻接区域:两个区域联和成一个连通集,则称其为邻接区域。(讨论区域的时候,必须指定区域邻接类型:4or8邻接)
4)边界
一个图像含k个不相交区域,则这k个区域的并集Ru是该图像的前景,Ru的补集是图像的背景。
区域R的内边界:区域R中和其补集像素相邻的一组像素。
区域R的外边界:背景中对应的边界。
3.距离测度
数字图像处理所用的基本数学工具介绍
涉及一幅或多幅图像的对应元素运算是逐个像素执行的,图像可以等效地视为矩阵。事实上,在很多情况下,图像间的运算是用矩阵理论执行的。因此,必须了解对应元素运算与矩阵运算的区别。 除非另作说明,否则本书采用对应元素运算。
对于矩阵:
元素的积:
矩阵的积:
除非另有说明,否则书中均为对应元素运算,比如求幂运算即对每个像素求幂运算;一幅图像除以另一幅图像意味着对应元素相除。
2线性运算与非线性运算
若算子H对于给定的输入图像f(x,y),产生一幅输出图像g(x,y):
算符满足:
则为线性运算。比如求和算子∑是线性算子。
否则为非线性运算。
3.算术运算
应用:利用图像相加(平均)降低噪声、使用图像相减比较图像、使用图像相乘/相除校正阴影和模板。
4.集合运算和逻辑运算
集合运算:
韦恩图
逻辑运算:与、或、非
5.空间运算
(1).单像素运算: 我们对数字图像执行的最简单的运算是,以灰度为基础改变单个 像素的值。注意:正文中使用“负图像”(也称为补图像)表示等同于负片的数字图像,而不是像素的负值.
(2). 邻域运算:令Sxy代表图像f中以 任意一点(x,y)为中心 的一个邻域的坐标集 。邻域处理在输出图像g中的相同坐标处 生成一个相应的像素 ,假设指定的运算是 计算在大小为m×n、中心在(x,y)的矩形邻域中的像素的平均值
(3)几何变换:包括缩放、平移、旋转和剪切变换等仿射变换
6.图像灰度与随机变量
许多地方将图像灰度处理为随机变量。例如,令zi , i=0, 1, 2, ···, L–1表示一幅M×N大小数字图像中所有 可能的灰度值,则在给定图像中灰度级zk出现的概率p(zk)可估计为
已知p(zk)后,就可求出许多重要的图像特性。例如均值(平均)灰度为:
灰度的方差: