此内容为学习《数字图像处理(第三版)》(冈萨雷斯著,阮秋琦、阮宇智等译)时的笔记。
数字图像处理方法的重要性源于两个主要应用领域:
一幅图像可以定义为一个二维函数 f(x,y) (以后可能发展出三维图像,但本书中指的是二维图像)。(x,y)为平面坐标,幅值 f 称为图像在该点处的强度或灰度。当 x, y 和灰度值 f 是有限的离散数值时,称该图像为数字图像。数字图像是由有限数量的元素组成的,每个元素都有一个特定的位置和幅值。这些元素称为图画元素、图像元素或像素。
人类的感知仅限于电磁波谱的可见光波段;而成像机器几乎可以覆盖从伽马射线到无线电波的整个电磁波谱范围。因而,数字图像处理涉及很宽泛的各种应用领域。
数字图像处理与其他相似研究领域的区别:
从图像处理到计算机视觉的这个连续统一体内并没有明确的界限。但一种分类是在这个过程中考虑三种典型的计算处理,即低级、中级和高级处理。
本书中将数字图像处理界定为其输入和输出都是图像的处理,另外,包含从图像中提取特征的处理,直至包括各个目标的识别。
数字图像的最早应用之一是在报纸业。早在20世纪20年代曾引入巴特兰(Bartlane)电缆图片传输系统,把横跨大西洋传送一幅图片所需的时间从一个多星期减少到了3小时。早期的巴特兰系统可以使用5个不同的灰度级来编码图像。到1929年,这一能力已经增大到了15级。
上述例子虽然涉及数字图像,但并不认为它们就是我们定义的数字图像处理,应为创建这种图像时并未涉及计算。因此,数字图像处理的历史与数字计算机发展密切相关。事实上,数字图像要求非常大的存储和计算能力,因此数字图像处理领域的发展必须依靠数字计算机及数据存储、显示和传输等相关支撑技术的发展。
第一台功能强大到足以执行有意义图像处理任务的大型计算机出现在20世纪60年代初。我们今天称之为数字图像处理的诞生可追溯至这一时期这些机器的使用和空间项目的开发。
在今天的应用中,最主要的图像能源是电磁能谱,其他主要图像能源包括声波、超声波和电子(以用于电子显微镜中的电子束形式)。用于建模和可视化的合成图像由计算机产生。本节简要讨论如何生成各种类别的图像及这些图像适用的领域。
以电磁波谱辐射为基础的图像是我们最熟悉的,特别是X射线和可见光谱波段的图像。
电磁波可定义为以各种波长传播的正弦波,或视为无质量的粒子流,每个粒子以波的形式传播并以光的速度运动。每个无质量的粒子包含一定的能量(或一束能量),每束能量称为一个光子。
如果光谱波段根据光子能量进行分组,则可得到如下图光谱,范围从伽马射线(最高能量)到无线电波(最低能量)。如图所示,加底纹的条带表明电磁波谱的各个波段之间并没有明确的界线,而是由一个波段平滑地过渡到另一个波段。
伽马射线成像的主要用途包括核医学(如正电子放射断层PET)和天文观测。
X射线是最早用于成像的电磁辐射源之一。最熟悉的X射线应用是医学诊断(血管照相术、计算机轴向断层CAT),同时,X射线还被广泛用于工业和其他领域。
紫外“光”的应用包括平板印刷术、工业检测、显微方法、激光、生物成像和天文观测等。
由于电磁波谱可见光波段在所有波段中是我们最熟悉的,所以这一波段的成像应用领域远远超过其他波段的成像应用领域。红外波段常用于与可见光相结合成像。主要应用在光显微方法、天文学、遥感、工业和法律实施等方面。
微波波段成像的典型应用是雷达。成像雷达的独特之处是在任何范围和任何时间内,不考虑气候、周围光照条件都可收集数据的能力。某些雷达波可以穿透云层,在一定条件下还可以穿透植被、冰层和极干燥的沙漠。在许多情况下,雷达是探测地球表面不可接近地区的唯一方法。在雷达图像中,能看到的只是反射到雷达天线的微波能量。
无线电波段成像主要应用于医学和天文学。在医学中,无线电波用于核磁共振成像(MRI)
其他的成像方式还包括声波成像、电子显微方法和(由计算机产生的)合成成像。
声波成像在地质勘探、工业和医学中应用广泛。超声波成像常用于制造业,但这一技术最为熟知的应用是在医学领域,特别是妇产科。在妇产科,医生对未出生的胎儿成像,以确定其发育的健康状况。
把数字图像处理划分为之前定义的两个类别:一类是其输入和输出都是图像;另一类是其输入可能是图像但输出是从这些图像中提取的属性。
图像获取:通常,图像获取阶段包括图像预处理,譬如图像缩放。
图像增强:是对一幅图像进行某种操作,使其结果在特定应用中比原始图像更适合进行处理,因为一开始增强技术就建立在面向问题的基础之上。例如,对增强X射线图像十分有用的方法,对增强电磁波谱中红外波段获取的卫星图像可能就不是最好的方法。不存在增强图像的通用“理论”。
图像复原:也是改进图像外观的一个处理领域。然而,与图像增强不同,图像增强是主观的,而图像复原是客观的;在某种意义上说,复原技术倾向于以图像退化的数学或概率模型为基础。另一方面,增强以什么是好的增强效果这种主观偏爱为基础。
彩色图像处理已成为一个重要的领域,因为互联网上数字图像的使用正在不断增长。
小波:是以不同的分辨率来描述图像的基础。
压缩:指的是减少图像存储量或降低传输图像带宽的处理。
形态学处理:涉及提取图像成分的工具,这些成分在表示和描述形状方面很有用。
分割:分割过程是将一幅图像划分为其组成部分或目标。通常,自动分割是数字图像处理中最困难的任务之一。成功地把目标逐一识别出来是一个艰难的分割过程。另一方面,很弱且不稳定的分割算法几乎总是会导致最终失败。通常,分割越准确,识别越成功。
表示和描述*:几乎总是在分割阶段的输出之后。选择一种表示仅是把原始数据转换为适合计算机进行后续处理的形式的一部分。为了描述数据以使感兴趣的特征更明显,必须确定一种方法。描述又称为特征选择,它涉及提取特征,可得到某些感兴趣的定量信息,或是区分一组目标或其他目标的基础。
识别:使基于目标的描述给该目标赋予标志(譬如“车辆”)的过程。
图像传感器(感知):需要两个不见来获取数字图像。第一个部件是物理设备,该设备对我们希望成像的目标辐射的能量很敏感。第二个部件称为数字化器,数字化器是一种把物理感知装置的输出转换为数字形式的设备。
专用图像处理硬件:通常由数字化器与执行其他原始操作的硬件[如算术逻辑单元(ALU)]组成,算术逻辑单元对整个图像并行执行算术与逻辑运算。该单元执行要求快速数据吞吐的功能(譬如以30帧/秒的速率来数字化和平均视频图像)。
计算机:指通用计算机。
图像处理软件:由执行特定任务的专用模块组成。
大容量存储:大容量存储能力在图像处理应用中是必须的。图像处理应用的数字存储分为三个主要类别: