数字图像处理第一章

数字图像处理第一章

  • 数字图像处理绪论
    • 1.数字图像处理是什么?
    • 2.数字图像处理的应用领域
    • 3.数字图像处理的基本步骤
  • 数字图像处理基础
    • 1.人眼的视觉特性
    • 2.数字图像表示
    • 3.数字图像中的几个基本概念
      • 空间和灰度分辨率
      • 像素间的基本关系

数字图像处理绪论

1.数字图像处理是什么?

一幅图像我们可把它定义为一个二维函数f(x,y),其中x和y是空间(平面)坐标。任何一对空间坐标(x,y)处的幅值f称为图像在该点处的强度或者灰度。当x,y和灰度值f是有限的离散数值时,我们称该图像为数字图像。数字图像处理是指借助于数字计算机来处理数字图像。

图像处理到计算机视觉这个连续的统一体中我们会考虑三种典型的计算处理,即低级、中级和高级处理。

1.低级处理涉及初级操作,如降低噪声的图像预处理、对比度增强和图像锐化。以输入输出都是图片为特征。
2.中级处理涉及诸多任务,譬如(把一幅图像分为不同的区域或目标)分割,减少这些目标物的描述,以使其更适合计算机处理及对不同目标的分类(识别)。中级图像处理以输入为图像但输出是从这些图像中提取的特征(如边缘、轮廓及各物体的标识等)为特征。
3.高级处理涉及“理解”已识别目标的总体,以及在连续统一体的远端执行与视觉相关的认知功能。

数字图像处理止于何处或其他相关领域(如图像分析与计算机视觉)从何处开始并没有一个统一的分界线。而我们学习的目标就是从数字图像处理开始入门,进入到计算机视觉的领域,最终目标是使用计算机来模拟人的视觉,这个领域本身就是人工智能的一个分支,我们需要计算机在理解接受视觉输入以后采取一系列的反馈动作,从而打造出“机器人的眼”。

2.数字图像处理的应用领域

视觉是人类最高级别的感知,所以图像在人类感知中扮演着最重要的角色,但是人类的感知也仅限于电磁波谱的可见光波段;机器却与人类不同,成像机器几乎可以覆盖从伽马射线到无线电波的整个电磁波谱范围,从而对人类不习惯的许多图像源进行加工,因而数字图像处理涉及很宽泛的各种应用领域。下面就是根据光子能量排列的电磁波谱,我们会逐个展示每一种波长的电磁波的应用实例。

数字图像处理第一章_第1张图片
伽马射线成像
伽马射线成像的主要用途包括核医学和天文观测。在核医学中,这种方法是将放射性同位素注射到人体内,当这种物质衰变时就会放射出伽马射线,然后用伽马射线检测仪收集到的放射线来产生图像。

X射线成像
X射线是最早用于成像的电磁辐射源之一。最熟悉的X射线应用就是大家都做过的医学诊断,但是X射线还被广泛用于工业和其他领域,如天文学。用于医学和工业成像的X射线是由X射线管产生的,X射线管是带有阴极和阳极的真空管。阴极加热释放自由电子,这些电子以很高的速度向阳极流动,当电子撞击一个原子核时,能量被释放并形成X射线辐射,从而可以得到X射线成像。

紫外波段成像
紫外光用于荧光显微方法中,这是显微方法中发展最快的领域之一。紫外光本身并不可见,但当紫外辐射光子与荧光材料内原子中的电子碰撞时,它把电子提高到较高的能级,随后受激电子释放到较低的能级,并以可见光范围内的低能光子形式发光。

可见光及红外波段成像
可见光波段是我们最熟悉,同时红外波段常用于与可见光相结合成像,生活中我们时常可以见到的车牌识别,钞票识别,遥感领域都是可见光波段内,包括我们之后的学习的数字图像大部分都在可见光波段内。

微波波段成像
微波波段成像的典型应用是雷达。成像雷达的独特之处是在任何范围和时间内,不考虑气候、周围光照条件都可收集数据的能力,某些雷达波可以穿透云层,在一定条件下还可以穿透植被、冰层和极干燥的沙漠。

无线电波段成像
无线电波成像主要应用于医学和天文学。在医学中,无线电波用于核磁共振成像(MRI)。该技术是把病人放在电磁场中,并让无线电波短脉冲通过病人的身体,每个脉冲将导致由病人的组织发射的无线电响应脉冲,这些信号发生的位置和强度由计算机确定,从而产生病人的一幅二维剖面图像。

上述的方法都应用于电磁波谱成像,虽然电磁波谱成像一直占有主导地位,但大量的其他成像方式也很重要,比如声波成像、电子显微方法和(由计算机产生的)合成图像,这里就不一一介绍了。

3.数字图像处理的基本步骤

我们接下来会按照从左到右的顺序进行数字图像处理的学习。图中左边都是低级处理,输入输出都为图像,图中右边输出的都为图像属性。
数字图像处理第一章_第2张图片

数字图像处理基础

1.人眼的视觉特性

人对于可见光谱的波长仅在380mm~780mm中,可见光范围内,不同波长的光给人以不同的色彩感觉,不同强度的光及不同强度分布的光刺激人眼,在人脑中将产生不同的光强、颜色、形状等视觉信息,光感受器分为两类:锥状体和杆状体,它们主要位于视网膜中称为中央凹的中间部分,对颜色高度敏感。

人的视网膜中含有三种不同的椎体细胞,三种椎体细胞对光谱的敏感峰值分别在:
430纳米(蓝)540纳米(绿)570纳米(红)

当三种颜色按一定比例同时刺激人眼时,会产生各种颜色感觉。其中有一种比例会使得颜色感觉完全消失,只有亮度感觉。颜色只取决于三个基本的输入量,这也是色觉三基色原理的基础。

2.数字图像表示

令f(s,t)表示一幅具有两个连续变量s和t的连续图像函数,通过取样和量化,我们可以把该函数转换成数字图像。假设我们把这幅连续图像取样为一个二维阵列f(x,y),该阵列包含有M行和N列,其中(x,y)是离散坐标。通常图像在任何坐标(x,y)处的值记为f(x,y),其中x和y都是整数。由一幅图像的坐标张成的实平面部分称为空间域,x和y称为空间变量或空间坐标。

数值阵列通常用于处理和算法开发。以公式形式,我们可将一个M×N的数值阵列表示为
数字图像处理第一章_第3张图片
该式两边以等效的方式定量地表达了一幅数字图像。右边是一个实数矩阵,矩阵中的每个元素称为图像单位、图像元素或像素

这里我们要注意到的是数字图像的原点位于左上角,其中正x轴向下延伸,正y轴向右延伸。这样表示的好处基于:许多图像显示(譬如电视显示屏)扫描都是从左上角开始的,然后依次向下移动一行。更重要的事实是矩阵的第一个元素按照惯例应在阵列的左上角,这种表示方式使用的是我们熟悉的标准右手笛卡尔坐标系统

3.数字图像中的几个基本概念

空间和灰度分辨率

图像数字化过程要求针对M值、N值和离散灰度级数L做出判定。对于M和N,除了必须取正整数外没有其他限制。然而,出于存储和量化硬件的考虑,灰度级数通常取为2的整数次幂,即 L = 2 k L=2^{k} L=2k
由此我们存储数字图像所需的比特数b为 b = M × N × k b=M×N×k b=M×N×k在大多数情况下M=N,由此我们引出空间分辨率和灰度分辨率的概念。

空间分辨率是图像中可辨别的最小细节的度量。在数量上,空间分辨率可以有很多方法来说明,其中单位距离的线对数和单位距离的点数(像素数) 是最通用的度量,实际大多数是跟上式中的M值和N值有关。

灰度分辨率是指在灰度级中可分辨的最小变化,即对上式中的k值进行调整,最通用的数是8比特。

像素间的基本关系

位于坐标(x,y)处的像素p有4个水平和垂直的相邻像素,其坐标是 ( x + 1 , y ) ( x − 1 , y ) ( x , y + 1 ) ( x , y − 1 ) (x+1,y)(x-1,y)(x,y+1)(x,y-1) (x+1,y)(x1,y)(x,y+1)(x,y1)这组像素称为p的4邻域,用N4(p)表示。
同样p的4个对角相邻像素的坐标是 ( x + 1 , y + 1 ) ( x + 1 , y − 1 ) ( x − 1 , y + 1 ) ( x − 1 , y − 1 ) (x+1,y+1)(x+1,y-1)(x-1,y+1)(x-1,y-1) (x+1,y+1)(x+1,y1)(x1,y+1)(x1,y1)用ND(p)来表示。这些点与4个邻域一起称为p为8邻域,用N8(p)表示。

了解了4邻域和8邻域的区别,我们由此可引入邻接性的概念。
令V是用于定义邻接性的灰度值集合。在二值图像中,如果把具有1值的像素归属于邻接像素,则V={1}。

(a)4邻接。如果q在集合N4(p)中,则具有V中数值的两个像素p和q是4邻接的。
(b)8邻接。如果q在集合N8(p)中,则具有V中数值的两个像素p和q是8邻接的。
(c)m邻接(混合邻接)。如果(i)q在N4(p)中,或(ii)q在ND(p)中,且集合N4(p)∩N4(q)中没有来自V中数值的像素,则p和q是m邻接的。m邻接的存在目的就是为了消除二义性的8邻接

你可能感兴趣的:(数字图像处理)