(一)数字图像处理基础知识点

自学冈萨雷斯的《数字图像处理》中。


目录

1.什么是数字图像 

2. 光与电磁波

3. 图像的感知和获取

4. 图像的取样与量化

4.1 取样与量化的概念

4.2 数字图像的表示 f(x,y)

4.3 线性索引和坐标索引

4.4 空间分辨率和灰度分辨率

4.5 图像内插

5. 像素间的一些基本关系

5.1 相邻像素

5.2 邻接、连通、区域、边界

5.3 距离测度


1.什么是数字图像 

1.1 一副图像可以定义为一个二位函数f(x,y),任意空间坐标(x,y)处的幅值f是图像在该点的强度(灰度)。当x,y,f为离散量时,该图像为数字图像。

1.2 数字图像由有限数量的元素组成,每个元素都有一个特定的位置与数值,该元素称为像素

2. 光与电磁波

波长:\lambda =c/\nu 

能量:E=h\nu

光是一种电磁辐射,可被人眼感知。

单色光:唯一属性是亮度,灰度级是单色光从黑到白的数值范围。

彩色光:电磁波范围为0.43\mu m(紫色)~0.79\mu m(红色)。其属性有频率、辐射、光通量、亮度。

        ①辐射:从光源流出的总能量,由瓦特(W)度量。

        ②光通量:观察者从光源感知的能量,由流明(lm)度量。

3. 图像的感知和获取

        大多数图像都是由“照射”源和形成图像的“场景”元素对光能的反射或吸收产生的。

4. 图像的取样与量化

        一副图像的坐标(x,y)是连续的,其幅度f(x,y)也是连续的,将图像数字化,即对图像函数 f 的坐标和幅度进行数字化。

4.1 取样与量化的概念

 取样:对图像坐标x,y进行数字化。

 量化:对图像函数幅度值进行数字化。

PS: 数字图像的质量很大程度取决于取样和量化中所用的样本数(M✖N)和离散灰度级(L)。其中M、N值必须取整数,离散灰度级数L通常取2的整数次幂:L=2^{k}

则存储数字图像的比特数b为:b=MNk

4.2 数字图像的表示 f(x,y)

a. f(x,y)函数图:x,y轴表示空间坐标,z轴表示f在(x,y)坐标的值。

b. 灰度矩阵图像:显示器上每个点的灰度与该点处的f值成比例。

c. M✖N数值矩阵

(一)数字图像处理基础知识点_第1张图片

动态范围:灰度跨越的值域,即系统中最大可度量灰度与最小可检测灰度之比。(上限取决于饱和度,下限取决于噪声)

饱和度:指图像中灰度值的最大值,超过该值的灰度值将被裁剪掉。

对比度:一幅图像中最高和最低灰度级间的灰度差。

反差比:图像中最高和最低灰度级的比率。

4.3 线性索引和坐标索引

坐标索引:像素的位置由二维坐标(x,y)组成

线性索引:像素点的位置由一维的非负整数串\alpha组成,该非负整数串由像素点到坐标(0,0)的偏移量计算得到。(包括行扫描和列扫描)

\alpha =My+x

x=\alpha modM

y=(\alpha -x)/M

(一)数字图像处理基础知识点_第2张图片

4.4 空间分辨率和灰度分辨率

空间分辨率:图像中最小可辩别细节的测度,即单位距离的线对数和单位距离的点数(像素数)。

PS:空间分辨率的测度必须针对空间单位来声明。

  • 采样间隔越大,所得图像像素数越少,空间分辨率低,质量差,严重时出现马赛克效应;
  • 采样间隔越小,所得图像像素数越多,空间分辨率高,图像质量好,但数据量大。

灰度分辨率:图像灰度级中可分辨的最小变化。灰度分辨率通常指量化灰度时所用的比特数。

  • 量化等级越多,所得图像层次越丰富,灰度分辨率高,图像质量好,但数据量大;
  • 量化等级越少,图像层次欠丰富,灰度分辨率低,会出现假轮廓现象,图像质量变差,但数据量小.

4.5 图像内插

        内插是用已知数据来估计未知位置的值的过程,常用于图像放大、缩小、旋转和几何校正等任务中。

最近邻内插:将图像最近邻的灰度赋给新位置。

双线性内插:使用4个最近邻的灰度来计算给定位置的灰度。

双三次内插:使用16个最近邻点的灰度计算给定位置的灰度。

        图像放大中,常采用内插法填充原图像像素之间的间隙来增大图像的尺寸,可得到亚像素精度。

5. 像素间的一些基本关系

5.1 相邻像素

4邻域 N_{4}(p):像素p左右水平2个相邻像素和上下垂直的2个相邻像素组成。

N_{D}(p):像素p的4个对角相邻像素组成。

8邻域N_{8}(p):像素p的四角相邻像素和4邻域组成。

PS:包含像素p的邻域为闭邻域,or为开邻域。

5.2 邻接、连通、区域、边界

1)邻接

令V是用于定义邻接性的灰度值集合,(eg:二值图像中,指值为1的像素邻接,则V={1})
(一)数字图像处理基础知识点_第3张图片

PS:m邻接是为了消除8邻接的二义性而引进的。如下图中矩阵中,右上角1到右下角1,按照8邻接则有两条路,而m邻接仅1条路。

(一)数字图像处理基础知识点_第4张图片

总结:判断两个像素是否邻接的条件:①两个像素位置是否相邻(4、8、m邻接);②两个像素的灰度值是否满足某个特定的相似性准则(在集合V中)。

2)连通

通路:如果从(x0,y0)像素点到(xn,yn)像素点,其中的每个点与前后都是K邻接的(K代表4、8、m),则说这两个像素之间存在一条K通路。若(x0,y0)和(xn,yn)是重合的,那么说这是一条闭合通路。

PS:K指该通路的各像素邻接类型,而n指该通路的长度。

连通:对于图像中的某一个像素子集S和S中的任意两个像素p、q,如果p和q之间有一个由S中全部元素构成的通路,则称像素p和q在S中是连通的。

(英文版原文:Two pixels p and q are said to be connected in S if there exists a path between them consisting entirely of pixels in S.)

连通分量:对于像素子集S中任意像素p,在S中连通至该像素p的像素集称为S的连通分量。

连通集:若S只有一个连通分量,则S称为连通集。

PS:什么时候会存在多个连通分量?——根据通路中各像素邻接类型K,对于S中像素p来说,不同类型的通路可能会导致连通至像素p的像素集不同,即导致不同的连通分量。

区域:若图像子集S是一个连通集,则S称为图像的一个区域。

邻接区域:两个区域联和成一个连通集,则称其为邻接区域。(讨论区域的时候,必须指定区域邻接类型:4or8邻接)

例子:

(一)数字图像处理基础知识点_第5张图片

        像素子集S\left \{ (0,1),(0,2),(1,1),(2,2) \right \}存在一个m通路(0,2)\rightarrow (0,1)\rightarrow (1,1)\rightarrow (2,2),因此S中任意两个像素在S中都是连通的。在S中,有且仅有一个像素集\left \{ (0,1),(0,2),(2,2) \right \}连通至像素(1,1),故对于S中的像素(1,1)来说,只有一个连通分量{\color{Blue} {\color{Blue} }}\left \{ (0,1),(0,2),(2,2) \right \}故S是连通集,且S是图像的一个区域

4)边界

一个图像含k个不相交区域,则这k个区域的并集R_{u}是该图像的前景R_{u}的补集是图像的背景

区域R的内边界:区域R中和其补集像素相邻的一组像素。

区域R的外边界:背景中对应的边界。

PS:边界和边缘的区别。一个有限区域的边界形成一个闭合通路,是一个“整体”;边缘是由其导数超过某个预设阈值的像素形成的,是一个“局部”。

eg:

(一)数字图像处理基础知识点_第6张图片

        1指区域的内边界是其本身,其外边界是围绕该区域的闭合通路。

5.3 距离测度

令p点坐标 (x,y) ,q点坐标 (u,v),则

欧几里得(欧式)距离D_{e}:满足 D_{e}(p,q)\leq r 的像素q 形成一个中心在 (x,y)、半径为r的圆盘。

 D_{e}(p,q)=[(x-u)^{2}+(y-\nu )^{2}]^{\frac{1}{2}}

城市街区距离D_{4}:满足D_{4}(p,q)\leq d像素q形成一个中心为(x,y) 的菱形,且D_{4}=1的像素是(x,y)的4邻域。

D_{4}(p,q)=\left | x-u \right |+\left |y- \nu \right |

(一)数字图像处理基础知识点_第7张图片

棋盘距离D_{8}:满足D_{8}(p,q)\leq d像素q形成一个中心为(x,y) 的方形,且D_{8}=1的像素是(x,y)的8邻域。

D_{8}(p,q)=max(\left | x-u \right |,\left |y- \nu \right |)

(一)数字图像处理基础知识点_第8张图片

D_{m}距离:两点之间的最短通路。

 PS:像素p和q之间的D_{4}D_{8}距离和可能存在于这些点之间的任何通路无关,其度量仅涉及像素坐标。然而在m邻接情况下,两点之间的D_{m}距离取决于沿该通路分布的像素值以及相邻像素的值。(因为m邻接下,像素值直接影响通路长度)

你可能感兴趣的:(数字图像处理,图像处理)