冈萨雷斯 数字图像处理各章内容总结总览

为了体验,还如果原文还在的话,还是看原文比较好

教材:RafaelC.Gonzalez, RichardE.Woods, StevenL.Eddins,等. 数字图像处理[M]. 电子工业出版社, 2014.


第一章 绪论

1 数字图像处理的主要内容(基本步骤)是什么?

主要内容:图像获取、图像增强、图像复原、彩色图像处理、(小波变换)、形态学处理、分 割、识别、压缩编码。

基本步骤:

图像获取:利用电磁波不同波段的成像特点进行成像,以及利用其他方式(如声波、电 子、计算机图形学)进行成像。

图像增强:利用增强算法增强原图像中的特定特征,从而更有利于后续的处理工作。

图像复原:根据成像系统建立退化模型,应用退化过程的逆过程对原图像进行复原。

彩色图像处理:将色系的概念引入数字图像处理,使得数字图像处理能够处理生活中的彩色图像。

形态学处理:运用算法对原图像所含有的几何特征(点、线、物体等)进行提取。

图像分割:根据图像自身表达的内容,将组成原图像表达内容的各个元件拆分成相互独立且完整的整体。

图像识别:根据图像自身信息,与现实生活中的物体进行匹配。

压缩编码:对图像的存储大小进行压缩和编码,分为有损压缩和无损压缩,利用图像自身冗余减少存储图像时所用的数据量。

2 根据成像信息源,数字图像处理主要应用有哪些?(电磁波不同波段的成像特点及应用),其它成像方式,如声波、电子显微镜等。

伽马射线成像:核医学和天文观测

X射线成像:医学诊断(血管照相术、计算机轴向断层)、工业和天文学

紫外波段成像:平板印刷术、工业检测、荧光显微镜方法、激光、生物成像和天文观测等

可见光及红外波段成像:光显微镜方法、天文学、遥感、工业和法律实施

微波波段成像:雷达

无线电波段成像:医学(核磁共振成像)、天文学

其它成像方式:声波成像—医学、地震勘测、地质勘探;电子显微镜(电子);合成图像


第二章 数字图像基础

视觉感知要素

1 人眼中两类光感受细胞锥状体细胞、杆状体细胞的主要功能和特点

锥状体:数量在600-700万之间,主要位于视网膜的中间部分,且对颜色高度敏感。

杆状体:7500-15000万之间,分布在视网膜表面。没有彩色感觉,而对低照明度敏感


2 名词解释:马赫带现象

在明暗交界的地方,亮区一侧的抑制作用大于暗区的抑制作用,从而产生暗区更暗,亮区更亮


3 人眼对亮度的适应范围

从暗阈值到强闪光约有 个量级。主观亮度是进入人眼的光强的对数函数,分为暗视觉和亮视觉。视觉系统不能同时在一个范围内工作,需通过改变整个灵敏度来完成这一较大的变动,也就是亮度适应。

问:当在白天进入一个黑暗剧场时,想要看清并找到空座位时眼睛需要适应一段时间,试述发生这种现象的视觉原理
答:视觉不能同时在大范围工作,存在亮度适应现象,1)由于户外与剧场亮度差异很大,因此当人进入一个黑暗的剧场时,无法适应如此大的亮度差异,在剧场中什么也看不见;2)人眼不断调节亮度适应范围,逐渐地将视觉亮度中心调整到剧场的亮度范围,因此又可以看见、分清场景中的物体了


4 解释为什么大口径镜头的照相机成像清晰?假定镜头制作工艺水平相同的情况下

, 为实物粒子波长(光子,电子等), 为成像系统的镜头直径, 为爱里斑所成角。当 变大,则 越小,物体上某一点在成像系统中由于衍射形成的光斑大小就变小,成像就越清晰。同样,实物粒子波长 越小,则成像也越清晰。


5 视觉错觉

眼睛填充了不存在的信息或者错误地感知了物体的几何特点。


图像感知和获取

6 图像的形成模型—用于同态滤波

用形如 的二维函数来表示图像,且 。 可由两个分量来表征:入射分量 和反射分量

其中, ,

反射分量 限制在0(全吸收)和1(全反射)之间。 的性质取决于照射源,而 的性质则取决于成像物体的特性。


图像取样和量化

7 图像数字化包括哪两个过程?数字化参数对数字化图像质量有何影响?

取样和量化。对坐标值进行数字化称为取样,对幅值进行数字化称为量化。数字图像的质量在很大程度上取决于取样和量化中所用的样本数和灰度级。


8 对比度、空间和灰度分辨率

对比度:图像中最高和最低灰度级间的灰度差。

空间分辨率:每单位距离线对数或每单位距离点数(像素 )

灰度分辨率:灰度级中可分辨的最小变化


像素间的一些基本关系

9 4邻域、D邻域、8邻域

4邻域:位于坐标 处的像素 有4个水平和垂直的相邻像素,其坐标为

D邻域: 的四个对角相邻像素,其坐标为

8邻域:4邻域+D邻域


第三章 灰度变换和空间域滤波

1 空间域滤波与频率域滤波的特点分别是什么?常用的滤波器有哪些?

空间域滤波直接在图像像素上进行操作,频率域滤波操作在图像的傅里叶变换上执行,而不针对图像本身。

常用空间滤波器

线性滤波器:低通、中通、高通

非线性滤波器:最小值、中值、最大值


基本灰度变换

2 基本的灰度变换函数:反转、对数或幂次

图像反转:得到灰度级范围为 的一幅图像的反转图像

特点:实现反白

对数变换

特点:扩展低输入,压缩高输入

应用:当原图动态范围太大,超出显示设备的范围时,如直接显示原图可能会使部分细节丢失,此时可采用对数变换,如傅里叶频谱的显示。

幂律(伽马)变换

特点:根据拉伸或者压缩的需要,选择不同的 和 值。

应用:图像获取、打印和显示的各种装置时按幂次规律响应的。用于修正幂次响应现象的过程称为伽马校正。

分段线性变换

(1)对比度拉伸。压缩两端动态范围,扩展中段目标的动态范围。

(2)灰度切分。突出目标轮廓,消除或保留背景细节。


直方图处理

3 什么是灰度直方图?有哪些应用?从灰度直方图能获得图像的哪些信息?

灰度直方图:表示图像中具有某种灰度级的像素的个数

应用:评价成像条件,图像增强处理,图像分割,图像压缩,其他图像处理任务(条件直方图,联合直方图 条件熵,联合熵,互信息,广义熵等,最大熵图像复原,图像配准,目标识别等)

直方图反映图像的总体性质:明暗性质、细节是否清晰、动态范围大小等


4 直方图均衡化的基本步骤

  1. 统计原始图像的直方图,求出
  2. 用累计分布函数 作变换,求变换后的新灰度
  3. 用新灰度代替旧灰度,求出 ,这一步是近似的,同时把灰度相等的或相近的合在一起


5 直方图规定化的基本步骤

  1. 建立 到 的映射


6 局部直方图处理

以图像中每个像素的邻域中的灰度分布为基础设计变换函数。当使用非重叠区域转移时可以减少计算量,但是处理后的图像会出现棋盘效应。


空间滤波

7 利用平滑滤波器对图像进行低通滤波时,能抑制噪声,但同时也模糊了细节,可以采用哪种措施来减小对图像的模糊程度

加权均值滤波或中值滤波

中值滤波:将像素领域内灰度的中值代替该像素的值,对处理脉冲噪声(椒盐噪声)非常有效。


8 图像锐化:一阶微分、二阶微分,一阶微分算子、二阶微分算子

突出图像中的细节、边缘或轮廓。因为边缘和轮廓都位于灰度突变的地方,所以锐化算法的实现是基于微分作用。

一阶微分

一阶微分通常会产生较宽的边缘。对灰度阶梯有较强的响应。

二阶微分

二阶微分对细节有较强的响应,如细线、孤立点、噪声等。对灰度阶梯变化产生双响应。在灰度变化值相似时,对线的响应比对阶梯的响应强,对点的响应比对线的响应强。(点>线>阶梯)

二阶微分增强细节的能力比一阶微分好。

一阶微分算子:Roberts、Sobel、Prewitt算子

二阶微分算子:拉普拉斯算子。拉普拉斯算子具有各向同性,即旋转不变性。


第四章 频率域滤波

傅里叶变换

1 图像二维离散傅里叶变换的公式,并分析傅里叶变换的频率分量与图像空间特征之间的联系

正变换

反变换

图像的频率是表征图像中灰度变化剧烈程度的指标,是灰度在平面空间上的梯度。直流分量 对应一幅图像的平均灰度,低频对应图像中变化缓慢的灰度分量,高频部分对应图像边缘和灰度级突变的部分。


2 用傅里叶变换的性质证明图像频域中心化处理等于 ,为什么要进行中心化处理?

用傅里叶变换的平移特性证明

其中 ,

由傅里叶变换的平移特性可得

因此

原因:一张图像中的能量主要集中在低频区,中心化处理可以将图像的低频分量集中在频谱图中央,便于观察。


频率域滤波

3 写出图像频域滤波的基本步骤

  1. 补零:对 补0,得到 填充后图像 ,避免缠绕;
  2. 中心化变换:用 乘输入图像得 ;
  3. DFT:对(2)中 做离散傅里叶变换,得 ; ;
  4. 滤波:用滤波函数 乘以 ; ;
  5. 得到处理后图像: ;
  6. 从 左上限提取 区域,得到最终结果

4 写出三种频率域平滑(低通)滤波器,并分析各自特点。截止频率对结果的影响。

目的:对图像产生平滑作用。

理想低通滤波器、巴特沃斯低通滤波器、高斯低通滤波器

理想低通滤波器(ILPF):

截断傅里叶变化中所有的高频部分,物理不可实现。单位冲激响应为sinc函数,有模糊振铃现象。

巴特沃斯低通滤波器(BLPF):

在带通和被滤除的频率之间没有明显的截断,有一个平滑的过渡带。1阶巴特沃斯滤波器没有振铃,2阶中振铃通常很微小,阶数增高时振铃现象逐渐成为一个重要的因素。当阶数n充分大时,巴特沃斯滤波器就变成理想低通滤波器。

高斯低通滤波器(GLPF):

当 时,滤波器下降到它最大值的 处

空间高斯滤波器没有振铃现象


5 写出三种频率域高通滤波器,并分析各自特点

理想高通滤波器、巴特沃斯高通滤波器、高斯高通滤波器

理想高通滤波器(IHPF):

将以 为半径的圆周内的所有频率置为0,而毫不衰减通过圆周外的任何频率。物理不可实现。有振铃现象。

巴特沃斯高通滤波器(BHPF):

BHPF比IHPF更平滑,相同设置的BHPF的边缘失真比IHPF小得多。

高斯高通滤波器(GHPF):

; 。GHPF比前两种滤波器更平滑,即使对微小物体和西线用GHPF过滤也是加清晰的。没有振铃现象。


6 用傅里叶变换的性质证明空间锐化滤波器拉普拉斯算子在频域是高通滤波器

乘以 中心化

在空域中,用原始图像减去拉普拉斯算子部分,得到增强图像

频域中,用反变换实现

而 在频域上表现为高通滤波器


7 同态滤波过程、目的是什么?

目的:消除不均匀照度的影响,增强图像细节

依据:物理过程产生的图像,灰度值正比于物理源的辐射能量,而辐射能量有照射分量和反射分量合成。反射分量反映图像内容,随图像细节不同在空间上作快速变化。照射分量在空间上通常具有缓慢变化的性质。照射分量的频谱落在空间低频区域,反射分量的频谱落在空间高频区域。

实现步骤




  1. 压缩 分量变化范围,削弱 ,增强 分量的对比度,提升 ,增强细节,确定 。

效果:压缩动态范围,增强对比度


第五章 图像复原与重建

图像退化/复原模型

图像退化:由于成像系统受各种因素影响,在获取和传输过程中使图像质量降低的现象称为图像退化。主要原因有:成像系统的散焦,成像设备与物体间的相对运动,成像器材的固有缺陷,外界环境(噪声、干扰)。这里只研究由噪声引起的退化。

图像复原:根据图像降质过程的某些先验知识,建立“退化模型”,运用与退化相反的过程(逆过程),将退化图像恢复原来面目。目的是改善图像的质量。

1 写出图像在空间域和频率域的退化数学模型的表达式,并分析造成图像退化的原因

空间域:​

频率域:​

造成图像退化的原因:成像系统的散焦,成像设备与物体间的相对运动,成像器材的固有缺陷,外界环境(噪声、干扰)。


空间域图像复原

2 带噪图像空间域复原的方法:均值滤波(算术、几何、谐波/调和),统计排序滤波

均值滤波器

算术均值滤波器:​

在滤除噪声的同时,会造成图像的模糊

几何均值滤波器:​

几何均值滤波器实现的平滑程度与算术均值滤波器相当,但能保留更多的图像细节,对黑色物体有扩大作用。

谐波均值滤波器:​

谐波均值滤波器对于“盐粒”噪声效果更好,但不适用于“胡椒”噪声,对于高斯噪声有比较好的效果。

逆谐波均值滤波器:​

适用于消除椒盐噪声。
Q>0时,用于消除“胡椒”噪声;
Q<0时,用于消除“盐粒”噪声。
但不能同时消除两种噪声。
Q=0,为算术均值滤波器;
Q=-1,为谐波均值滤波器

统计排序滤波器

中值滤波器: ​

对单极或双极脉冲噪声非常有效。

最大值滤波器:​

用于发现图像中的最亮点,可有效过滤“胡椒”噪声。

最小值滤波器:​

用于发现图像中的最暗点,可有效过滤“盐粒”噪声。

中点滤波器:​

结合了顺序统计和求平均,对于高斯和均匀随机分布噪声有最好的效果。

修正的阿尔法均值滤波器:​

在​邻域内去掉​最高灰度值的​和最低灰度值的​,​代表剩余的​个像素。

当d=0,退变为算术均值滤波器;
当d=mn-1,退变为中值滤波器;
当d取其他值时,适用于包括多种噪声的情况下,例如高斯噪声和椒盐噪声混合的情况。


3 自适应滤波器为何有比较好的处理效果?

以​的矩形窗口​定义的滤波器区域内图像的统计特性为基础,其性能优于迄今为止讨论过的所有滤波器的性能,但增加了算法复杂性。包括:自适应局部降低噪声滤波器,自适应中值滤波器。

自适应局部降低噪声滤波器

预期性能如下,若 ​, ​,保留原灰度值,不做处理;若 ​,​ 中 ​本身权重增加;若 ​, ​,降低局部噪声

自适应局部降低噪声滤波器效果好于算术、几何均值,保留细节更好,付出代价时增加了复杂性。
细节边缘部分,局部方差变大,更多保留g(x,y),灰度变化平坦区域,平滑作用更强。

自适应中值滤波器

主要目的:去除“椒盐”噪声(冲激噪声),平滑其它非冲激噪声,减少物体边界细化或粗化等失真现象。

算法实现:

进程A——找到一个非脉冲的中值

​ , ​,若 ​且 ​, ​,中值不是脉冲,转到进程B,否则增大窗口尺寸。如果窗口尺寸​ ,重复进程A,否则输出 ​。

进程B——判断中心像素是否脉冲

​ , ​,若​ 且 ​, ​,​不是脉冲,输出 ​。否则,或​ 输出​ 。

自适应中值滤波器可以处理具有更大密度的冲激噪声,可以在平滑非冲激噪声时保留细节。
而传统中值滤波器无法做到。


频率域滤波消除周期噪声

4 如何去除图像中的周期噪声?带阻或陷波、最佳陷波

带阻滤波器

理想:​

巴特沃斯: ​

高斯:​

带通滤波器

陷波滤波器

阻止或通过实现定义的中心频率邻域内的频率。是一种特殊的带阻/通滤波器,它的阻/通带范围极小,有着很高的Q因子。以原点对称。

冈萨雷斯 数字图像处理各章内容总结总览_第1张图片 冈萨雷斯 数字图像处理各章内容总结总览_第2张图片

最佳陷波滤波器

提取干扰模式的主频率分量,从被污染的图像中减去该模式的一个可变的加权部分。

估计退化函数

5 在图像复原中,估计退化函数的主要方法有哪些?

图像观察估计

后验判断。对于一幅模糊图像,若没有退化函数的知识,则需从退化图像本身来估计​。

假设系统空间位移不变,可推导出针对整幅图像的​,它必然与​具有相同的形状。

可选择有特征的部分图像进行估计。
选取图像中强信号区域(SNR大,如清晰的点),利用空间不变,得全局h(x,y)。
原景物含有明显的直线,从这些线条的退化图像求h(x,y)。
有明显的界限,已知形状的物体,如:篮球、足球、车牌文字、标志性建筑等。

试验估计

可使用相似的退化图像获取设备,建立理论上近似准确的退化函数估计。利用相同的系统设置,对一个脉冲成像,得到退化函数的冲激响应。

建模估计

运用先验知识建模。根据:大气湍流、光学系统三角、照相机与景物相对运动导致模糊的物理过程(先验知识)来确定​。

大气湍流退化:​

照相机与景物相对运动:​

光学散焦退化:

高斯退化:


6 建模估计当中,由于成像传感器与被摄物体之间存在相对的均匀线性运动,给出图像退化函数​

设T为快门时间,​和​使位移的x分量和y分量,则

​为模糊图像,上式两边作傅里叶变换,得

由 ​得

假定图像只在x方向以给定的速度​做匀速直线运动,可得

若允许y分量随着变化,按​则退化函数变为


由退化函数复原图像

7 由退化函数​复原图像的主要方法:逆滤波、最小均方误差(维纳)滤波、约束最小二乘滤波

逆滤波

原始图像傅里叶变换的估计值

复原后的图像为

最小均方误差滤波(维纳滤波)

寻找一个滤波器,使得复原后的图像和原图像的均方差最小,即

如果噪声为0,维纳滤波器退化为逆滤波。

处理白噪声时, 为常数,可作如下简化处理

约束最小二乘滤波

除需要关于退化系统的传递函数外,还需知道某些噪声的统计特性或噪声与图像的某些相关情况。


8 逆滤波时,为什么图像存在噪声时,不能采用全滤波?试采用逆滤波原理说明,并给出正确的处理方法。

即使知道退化函数,也不能准确复原未退化的图像,因为未知。如果退化函数是零或非常小的值,将导致不稳定解,比值非常大,噪声项将被放大,对复原的结果占主导地位。

解决退化函数为零或非常小的值的问题的一种处理方法为限制滤波的频率,使其接近原点。


第六章 彩色图像处理

伪彩色图像处理

1 什么是伪彩色图像处理?目的是什么?试列举伪彩色处理的主要方法

基于指定规则将灰度值映射成为彩色值。

主要目的是,景物映射成奇异彩色,比本色更引人注目;适应人眼对颜色的灵敏度,提高鉴别能力。可把细节丰富的物体映射成深浅与亮度不一的颜色;遥感多光谱图像转换成假彩色,可以获得更多信息。

主要处理方法:强度映射、通道合成


彩色模型

1 图像的彩色模型解释:RGB、CMYK、HSI的含义及应用

面向硬件的彩色模型

RGB(红、绿、蓝)模型—彩色监视器、彩色视频摄像机

每种颜色出现在红、绿、蓝的原色光谱分量中。

CMY(青、深红、黄)/CMYK(青、深红、黄、黑)模型—彩色打印机

一种减色系统,将从白光中滤出三种原色之后获得的颜色作为表色系的三原色。K为黑色,印刷时可用黑色墨来印刷。

由等量的颜料原色青色、深红色和黄色组合所产生的黑色不纯。为了产生真正的黑色(在打印中起主要作用的颜色),加入了第四种颜色——黑色。

面向应用的彩色模型

HSI(色调、饱和度、亮度)模型—面向一般彩色图像应用

该模型可在彩色图像中从携带的彩色信息(色调和饱和度)中消去强度分量的影响,反映了人类观察彩色的方式,是开发基于彩色描述的图像处理算法的理想工具。

饱和度:色环原点到彩色点的半径长度。

色调:由角度表示,反映了该颜色最接近什么样的光谱波长。


第八章 图像压缩

1 图像压缩中,主要数据冗余是什么?列举常见的图像压缩格式

主要数据冗余:编码冗余、像素间冗余、心理视觉冗余。

  • 编码冗余:信息熵冗余。图像中平均每个像素使用的比特数大于该图像的信息熵。
  • 像素间冗余(空间和时间冗余):大多数像素存在空间连贯性,视频中帧间像素也存在相关性,造成了数据的冗余。
  • 心理视觉冗余:多数图像中包含由一些被人类视觉系统忽略或与用途无关的信息。

常见图像压缩格式

静态图像:二值—CCITT Group3/4、JBIG/JBIG2、TIFF;连续音调—JPEG/JPEG-LS/JPEG-2000、BMP、GIF、PDF、PNG、TIFF

视频:DV、H.261/262/263/264、MPEG-1/2/4/4 AVC、AVS、HDV、M-JPEG、Quick Time、VC-1

基本压缩方法

冈萨雷斯 数字图像处理各章内容总结总览_第3张图片 冈萨雷斯 数字图像处理各章内容总结总览_第4张图片


2 霍夫曼编码,并计算编码效率。压缩率、冗余度、信息熵

步骤:

  1. 将信源符号按概率递增顺序排列
  2. 将两个最小的概率加起来作为新符号的概率
  3. 重复步骤1和2,直到概率和为1
  4. 完成上述步骤后沿路径返回进行编码。寻找从每一信源符号到概率为1处的路径,每层有两个分支,分别为大的概率赋予0和小的概率为1,从而得到每个符号的编码

压缩率: ​。大于1,压缩前比特数除以压缩后平均码长。

冗余度:​

信息熵: ​,​


3 算术编码

原理:根据信源不同符号序列的概率,把​区间划分为互不重叠的子区间,子区间的宽度恰好是各符号序列的概率,这样不同符号序列与各子区间一一对应,因此每个子区间内任意一个实数都可用来表示对应的符号序列,这个数就是该符号序列所对应的码字。显然遗传符号序列发生的概率越大,对应的子区间就越宽,要表达它所用的比特数就减少,因而相应的码字就越短。

算术编码分为静态模型和自适应模型。静态模型信源符号概率分布固定,自适应模型信源符号概率分布的估计随着每次这种上下文出现时的符号而自适应更新,从而更加符合实际的概率分布。不管编码器使用怎样的模型,解码器也必须使用同样的模型。

特点:

  • 较容易地定义自适应模式,即为各个符号设定相同的概率初值,然后根据出现的符号做相应的改变,得到改变值。由于编码和解码使用同样的初始值和改变值,因此概率模型保持一致。自适应模式适用于不进行概率统计的场合。
  • 实现比霍夫曼编码复杂,但当信号源符号的出现概率相近时,算术编码的效率高于霍夫曼编码5%左右。
这种技术不像霍夫曼编码方法那样要求每个符号转换成整数,在理论上达到了香农第一定理的极限。

这里给出例题。假设信源符号为 ,这些符号的概率分别为 ,对输入的序列cadacdb进行算术编码。


4 给出离散余弦变换DCT变换的表达式和基于DCT块编码系统实现的主要步骤,并对每一步作简要说明

离散余弦变换

对于大小为​的子图像​,其离散余弦变换可表示为

若给定 ​,则可以使用离散反变换得到​

其中,​

​ , ​类似

基于DCT块编码系统

编码器执行子图像分解、变换、量化和编码,解码器执行解码、反变换、图像合并。一幅大小为的输入图像首先被分解为大小为的子图像,然后用离散余弦变换变换这些子图以生成个子图像变换阵列,每个阵列的大小为。离散余弦变换的目的时对每幅子图像中的像素进行去相关,或用最少数量的变换系数包含尽可能多的信息。在量化阶段,以一种预定义的方式有选择地消除或更粗略地量化那些携带最少信息的系数,这些系数对重建的子图像质量影响最小。通过对量化后的系数进行编码阶数编码过程。

冈萨雷斯 数字图像处理各章内容总结总览_第5张图片 冈萨雷斯 数字图像处理各章内容总结总览_第6张图片
DCT的信息携带能力比DFT和WHT要强。在计算度上,虽然WHT的计算量最小,但是由于DCT可采用快速算法,因而在信息综合能力和计算复杂度上的综合性能比较好而得到广泛应用。

第九章 形态学图像处理

形态学的基本思想是用具有一定形态的结构元素去度量和提取图像中的对应形状已达到对图像分析和识别的目的。

将数学形态学作为工具从图像中提取表达和描绘区域形状的有用图像分量,如边界、骨架、凸壳等,或用于图像的预处理和后处理,如形态学滤波、细化和修剪等。数学形态学的语言是集合论

形态学图像处理的基本运算有四种:膨胀、腐蚀、开操作和闭操作。

二值形态学基本运算

1 腐蚀和膨胀操作:名词解释或简答、实现,说明主要特点及应用

膨胀

定义:假定​A和B是 ​上的集合,​ A被​B(结构元)膨胀定义为

含义:把结构元B​平移z后得到 ​,若 ​,记下这个z点,所有满足上述条件的z点组成的集合称作​A被B​膨胀的结果。

过程:结构元​B也可以看为卷积掩码,因为膨胀的操作过程和线性卷积过程很类似。用​B的原点和A​上的点逐一对比,如果上有一个点落在​的范围内,则​原点对应的点就为图像。

特点:膨胀的结果会使目标变大。

应用:将裂缝桥接起来,消除小的孔洞。

腐蚀

定义:假定​A和B​是​ 上的集合,A​被B​(结构元)腐蚀定义为

含义:腐蚀结果是由移位元素z组成的集合,以至​B对这些元素移位操作的结果完全包含于A。

过程:把结构元素B​平移z后得到 ​,若​ 包含于A​,记下这个z点,所有满足上述条件的z点组成的集合称作​A被​B腐蚀的结果。

特点:腐蚀缩小或细化了二值图像中的物体。

应用:消除二值图像中的不相关细节。当结构元素小于目标时,则腐蚀掉目标的边界成分;腐蚀可以把小于结构元素的物体(毛刺、小凸起)去除;如果两个物体之间有细小的连通,结构元素足够大时,通过腐蚀运算可以将两个物体分开。

腐蚀和膨胀关于补集和反射操作呈对偶关系。


2 开操作和闭操作:名词解释或简答、实现,说明主要特点及应用

开运算

定义:​

含义:先用结构元B​对A​腐蚀,再对腐蚀结果用同样的结构元进行膨胀操作。

特点:等幂性,即多次开运算结果与一次是一样的

应用:断开狭窄的连接,如去除细胞粘连、字体粘连;消除西小物体,可用于去噪点;使用圆、椭圆等结构元素时,使对象轮廓变光滑;保持大物体尺寸基本不变。

闭运算

定义:​

含义:先用结构元​对​膨胀,再对膨胀结果用同样的结构元进行腐蚀操作,过程与开运算正好相反。

特点:等幂性,即多次闭运算结果与一次是一样的

应用:连接狭窄的间隙,如短线粘连、字体连接;填充物体内细小孔洞,可用于去噪点;填补轮廓线的断裂;保持大物体的尺寸基本不变。

开运算通常对图像轮廓进行平滑,使狭窄的“地峡”形状断开,去掉细的突起(与结构元有关,如圆、椭圆结构元造成平滑结果,而矩形则非)。闭运算也是趋向于平滑图像的轮廓,但与开运算相反,它一般使窄的断开部位和细长的沟融合,填补轮廓上的间隙。


二值形态学图像处理基本操作

边界提取:先用一合适的结构元B对A腐蚀,然后再把A减去腐蚀的结果来获得。​

区域填充:从界内一点P开始,用1去填充整个区域,填充过程为: ​,为条件膨胀。

连接分量提取: ​,取交集的作用是消除中心元素标志为0的膨胀结果。

还有凸壳、细化、粗化、骨架、裁剪等操作,涉及到击中击不中变换这里不再给出具体定义。

冈萨雷斯 数字图像处理各章内容总结总览_第7张图片 冈萨雷斯 数字图像处理各章内容总结总览_第8张图片


灰度级形态学

腐蚀:​

膨胀:​

开运算:​

闭运算:​


第十章 图像分割

图像分割

1 解释图像分割及应用,图像分割是基于灰度的什么特征实现的?

定义:将一幅图像分解为若干互不交叠的、有意义的、具有相似性质的区域或对象。

应用:确定航空照片中的森林、耕地、城市区域等;文字识别、识别和标定细胞。

图像分割基于区域内部灰度值的相似性和区域之间灰度的不连续性。


间断检测

2 一阶、二阶导数对图像的灰度特征是如何响应的?

一阶导数:在恒定灰度区域为零;在灰度台阶或斜坡开始处不为零;沿斜坡灰度点处不为零

二阶导数:在恒定灰度区域为零;在灰度台阶或斜坡开始处不为零;沿斜坡灰度点处为零

一阶导数用于检测一个点是否属于边缘;二阶导数的正负符号可以用于判断边缘像素是在亮的一边还是暗的一边。

点检测

使用如下模板

若 ​,则在模板中心的位置已经检测到一个孤立点,T为非负门限。

线检测

冈萨雷斯 数字图像处理各章内容总结总览_第9张图片 冈萨雷斯 数字图像处理各章内容总结总览_第10张图片

第一个模板对水平方向的线条有很强的响应;第二个模板对+45度方向线有最佳响应。模板系数为0,表明恒定灰度区域响应为0。


边缘模型

在边缘处,灰度和结构等信息发生突变。沿边缘方向灰度变化平缓,垂直边缘方向灰度变化剧烈。这种变化可用微分算子检测,通常用一阶或二阶导数来检测边缘。

3 边缘检测(梯度sobel、Prewitt、Roberts、拉普拉斯算子),给出模板,分析其功能

步骤:滤波、锐化、检测、定位

梯度算子

Roberts算子:计算对角方向相邻两像素之差,也成为四点差分法。

特点:对4点进行差分求得梯度,方法简单;对噪声较敏感,常用于不含噪声的图片边缘点检测。

Prewitt算子:先求平均,再求差分得到梯度。

[公式]

上述Prewitt算子分别用来检测水平、 ​、垂直、 ​四个方向边缘。

效果:去噪+增强边缘

Sobel算子:加权平均后差分,减弱对边缘的模糊程度。

[公式]

上述Sobel算子分别用来检测水平、 ​、垂直、 ​四个方向边缘。

效果:去噪+增强边缘

拉普拉斯算子

求图像的二阶导数。​

常用模板

分别以 ​和 ​旋转各向同性。

特点:一般不直接用拉普拉斯算子检测边缘—对噪声敏感;会产生双边缘;不能检测边缘的方向

作用:边缘检测各向同性;利用它的零交叉的性质进行边缘定位;确定一个像素是在边缘暗的一边还是亮的一边。


4 高级复杂的边缘检测方法:Marr-Hildreth和Canny算子实现步骤、特点和应用,给出主要步骤的数学模型

Marr-Hildreth

高斯拉普拉斯(LOG—Laplacian of Gaussian)

步骤:用高斯函数平滑图像;用拉普拉斯算子进行边缘检测;根据二阶导数算子过零点的性质来确定边缘的位置。

表达式:

这里给出一个 ​大小的LoG算子模板

LoG滤波器的尺寸: ​

特点:

  • 优点—图像中的边缘比梯度边缘细;高斯滤波器平滑,有利于抑制噪声;拉普拉斯算子是各向同性的。
  • 缺点—零阈值时边缘由许多闭合环的零交叉点决定;非零阈值的零交叉点的计算比较复杂。

高斯差(DoG—Difference of Gaussians)

k=1.6时是LoG的近似,两个高斯核的大小决定了两个高斯模糊后的影像间的尺度。用于图像增强时,k=4或5,很好地近似了视网膜上神经节细胞的视野。

Canny边缘检测器

步骤:高斯平滑;计算梯度幅值图像和角度图像;对梯度幅值图像应用非最大抑制(NMS);用双阈值处理和连接分析来检测和连接边缘。

特点:图像中的边缘比梯度边缘细;高斯滤波器平滑,有利于抑制噪声。实现复杂,执行时间长。


5 Hough变换检测直线

将在图像空间中过点​ 的直线 ​表示为参数空间表达式​ 。参数空间ab中相交直线最多的点交点 ​即为图像空间中过点 ​和 ​的直线的斜率和截距。由于垂直直线斜率趋于无穷大,故改用极坐标 ​参数空间​ 。对应不是直线而是正弦曲线。

使用交点累加器,或交点统计直方图,找出相交线段最多的参数空间的点,然后找出该点对应的xy平面对应的直线线段。

Hough变换不仅能检测直线,还可以检测具有解析式的曲线。


阈值处理

6 简述门限(阈值)分割图像的基本思路,自动全局阈值如何选取?

基本思路

根据图像的整体信息(如直方图),或局部信息(共生矩阵等)来选择一个或多个值,从而把该图像分割成目标与背景两类区域或者多个目标与背景的区域。

根据灰度图,绘制直方图,根据直方图,决定阈值,原图灰度高于阈值的置 1,低于阈值的置 0,得到二值图像。

自动全局阈值的选取

  1. 选择一个T的初始估计值;
  2. 用T分割图像,会生成两组像素:​ 由所有 ​的像素组成,而​ 由所有 ​的像素组成;
  3. 计算区域​和​的平均灰度值​ 和​ ;
  4. 计算新的阈值​
  5. 重复步骤2-4,直到迭代中T值之差小于事先定义的参数​

门限处理的分类:

全局门限处理:仅取决于灰度级值

局部门限处理:取决于灰度级值和局部性质

动态(自适应)门限处理:取决于空间坐标x和y

基于Otsu方法的最佳全局阈值处理*

  1. 计算输入图像的归一化直方图,直方图各个分量为​
  2. 计算累积和​
  3. 计算累积均值​
  4. 计算全局灰度均值​
  5. 计算类间方差
  6. 得到Otsu阈值​ ,即令 ​最大的k值。如果最大值不唯一,用相应检测到的各个最大值k的平均得到​
  7. 在​ 处计算,得到可分性度量​


区域分割*

传统区域分割算法有区域生长法区域分裂合并法。空间和时间开销较大。

区域生长

步骤

  1. 根据图像的不同应用选择一个或一组种子
  2. 选择一个相似性准则
  3. 从该种子开始向外扩张,不断将与集合中各个像素连通且满足相似性准则的像素加入集合
  4. 上一过程进行到不再有满足条件的新结点加入集合为止

区域分裂合并

  1. 设整幅图像为初始区域
  2. 对图像的每一个区域R​,计算P®​,如果P®=FALSE​,则把该区域分裂成四个子区域
  3. 重复步骤2直至没有区域可分裂
  4. 对图像中任意两个相邻的 和 ,如果 ,则把这两个区域合并成一个区域
  5. 重复步骤4直至没有相邻区域可合并,算法结束

基于形态学分水岭的分割*

分水岭算法借鉴了形态学理论,将图像看成拓扑地形图,其中灰度值被认为时地形高度值,高灰度值对应着山峰,低灰度值对应着山谷。图像分割就是在灰度图像中找出不同的吸水盆地和分水岭。分水岭算法是一种自适应的多阈值分割算法。

由于梯度图中可能有较多的局部极小点,因此可能会导致过分割。

你可能感兴趣的:(数字图像处理)