数字图像处理(冈萨雷斯)学习 第二章 数字图像基础

引言

2.1 人类视觉系统的机理,包括眼中图像的形成及对亮度的适应和鉴别能力。
2.2 讨论光、电磁波谱的其他分量及它们的成像特点
2.3 讨论成像传感器及怎么使用它们产生数字图像
2.4 介绍均匀图像取样及灰度量化的概念。还有数字图像表示、图像中取样数和灰度级变化的影响、空间和灰度分辨率的概念,以及图像内插的原理
2.5 处理像素间的各种基本关系
2.6 介绍本书用到的主要数学工具。该节的第二个目的是帮助您开始积累一些在各种基本图像处理任务中如何运用这些工具的感觉

2.1 视觉感知要素

仅涉及人类视觉的最基本方面

2.1.1 人眼的结构

有三层薄膜包围着眼睛:角膜与巩膜外壳、脉络膜和视网膜
角膜是一种硬而透明的组织,覆盖着眼睛的前表面。
与角膜相连的巩膜是一层包围着眼球其余部分的不透明的膜

2.2 光与电磁波谱

电磁波谱可用波长、频率获能量来描述,波长×频率=光速,电磁波谱各个分量的能量=普朗克常数×波长

2.3 图像感知和获取

我们感兴趣的多数图像都是由“照射”源和形成图像的“场景”元素对光能的反射或吸收而产生的。比我们所熟悉的一个可见光源每天照射普通的三维场景情况更一般。
通过将输入电能和对特殊类型检测能源敏感的传感器材料相结合,把输入能源转化为电压。输出电压波形是传感器的响应,通过把传感器响应数字化,从每一个传感器得到的一个数字量。

2.3.1 使用单个传感器获取图像

2.3.2 使用条带传感器获取图像

2.3.3 使用传感器阵列获取图像

2.3.4 简单的图像形成模型

2.4 图像取样和量化

2.4.1 取样和量化的基本概念

2.4.2 数字图像表示

2.4.3 空间和灰度分辨率

2.4.4 图像内插

内插并用它调整图像的大小,这是基本的图像取样方法
从根本上看,内插是用已知数据来估计未知位置的数值的处理
最邻近内插法,把原图像中最近邻的灰度赋给了每个新位置,但是有产生不希望的人为缺陷的倾向,如某些直边缘的严重失真。
更实用的方法是双线性内插,我们用4个最邻近去估计给定位置的灰度。令(x,y)为我们想要赋以灰度值的位置的坐标,v(x,y)=ax+by+cxy+d
双线性内插给出了比最近邻近内插好得多的结果,但随之而来的是计算量的增加
更复杂的是双三次内插,他包括16个最近紧邻点,是商业图像编辑程序的标准内插方法

2.5 像素间的一些基本关系

2.5.1 相邻像素

位于坐标(x,y)处的像素p有4个水平和垂直的相邻像素,这组像素成为p的4邻域,用 N 4 ( p ) N_4(p) N4(p)表示
也有4个对角相邻像素,用 N D ( p ) N_D(p) ND(p)表示。这些点与4个邻点一起成为p的8邻域,用于 N 8 ( p ) N_8(p) N8(p)表示。

2.5.2 邻接阵、连通性、区域和边界

令V是用于定义邻接性的灰度值集合。
在二值图像中,如果把具有1值的像素归诸于邻接像素,则V = {1}。
在灰度图像中,V一般包含有更多的元素。例如具有可能的灰度值范围为0到255的邻接像素中,集合V可能是这256个值的任何一个子集。

  • 4邻接。如果q在集合 N 4 ( p ) N_4(p) N4(p)中,则具有V中数值的两个像素p和q是4邻接的。
  • 8邻接。如果q在集合 N 8 ( p ) N_8(p) N8(p)中,则具有V中数值的两个像素p和q是8邻接的。
  • m邻接。如何(i)q在 N 4 ( p ) N_4(p) N4(p)中,或(ii)q在 N d ( p ) N_d(p) Nd(p)中,且集合 N 4 ( p ) ∩ N 4 ( q ) N_4(p) \cap N_4(q) N4(p)N4(q)中没有来自V中数值的像素,则具有V中数值的两个像素p和q是m邻接的。

混合邻接是8邻接的改进。混合邻接的引入是为了消除采用8邻接时产生的二义性。
令S是图像中的一个像素子集。如果S的全部像素之间存在一个通路,则可以说两个像素p和q在S中是连通的。对于S中的任何像素p,S中联通到该像素的像素集称为S的连通分量。如果S仅有一个连通分量,则集合S称为连通集。
令R是图像中的一个像素子集。如果R是连通集,则称R为一个区域。两个区域,如果它们联合形成一个连通集,则区域 R i R_i Ri R j R_j Rj称为邻接区域。不邻接的区域称为不连接区域。在谈到区域时,我们考虑的时4邻接和8邻接。为了使我们的定义有意义,必须指定邻接的类型。

假设一幅图像包含有 K K K个不连接的区域,即 R k , k = 1 , 2 , . . . , K R_k, k = 1,2,...,K Rk,k=1,2,...,K,且它们都不接触图像边界(这种假设的目的是在于避免处理特殊情形。这样做不会丧失一般性,因为如果一个或多个区域接触到图像的边界,我们可以简单地使用1像素宽的背景值来填充图像。) 令 R u R_u Ru代表所有 K K K个区域的并集,其所有点为图像的前景,而其补集中的所有点为图像的背景。

区域R的边界是这样的点的集合,这些点与R的补集中的点邻近。换一种方式说,一个区域的边界是该区域中至少有一个背景邻点的像素集合。这里必须指定用于定义邻接的连通性。

前述定义有时称为区域的内边界,以便与其外边界相区分,外边界对应于背景边界。在开发追踪边界的算法时这个区别很重要。这种算法为了保证结果形成一个闭合通路,通常是沿外边界确立的。
如果R恰巧是整幅图像(我们假设这副图像是像素的方形集合),则边界由图像第一行、第一列和最后一行、最后一列的像素集合来定义。这个附加定义是需要的,因为一副图像超过边界范围之外没有邻点。正常情况下,当我们提到一个区域时,指的是一副图像的子集,并且区域边界种任何与图像边缘吻合的像素都作为区域边界的一部分全部包含在其中。

一个有限区域的边界形成一条闭合通路,并且是“整体”概念。边缘是由具有某些超过预先设定的阈值的导数值的像素形成的。这样边缘的概念就是基于在进行灰度级度量时不连续点的"局部“概念。把边缘点连成边缘线段是可能的,并且有时以与边界对应的方法连接线段。边缘和边界吻合的一个例外是二值图像的情况,从二值区域提取边缘与区域边界是一样的,这很直观。

5.5.3 距离度量

距离度量满足非负性,互换性,三角不等式

欧式距离 (圆形)
城市街区距离(菱形)
棋盘距离(正方形)

2.6 数字图像处理所用数字工具的介绍

2.6.1 阵列与矩阵操作

2.6.2 线性操作与非线性操作

线性算子
非线性算子

2.6.3 算术操作

图像间的算术操作是阵列操作,其意思是算术操作在相应的像素对之间进行。
例2.5 针对降噪的带噪图像相加(平均)
例2.6 增强差别的图像相减
例2.7 使用图像相乘和相除来校正阴影

2.6.4 集合和逻辑操作

一个灰度图像的补集是255-灰度图像像素
两个灰度集合的并集是一个由空间相应元素的最大灰度形成的阵列

模糊集合

2.6.5 空间操作

空间操作直接在给定图像的像素上执行。
我们把空间操作分为三大类:单像素操作,邻域操作,几何空间变换
单像素操作
邻域操作
几何空间变换和图像配准
在数字图像处理中,几何变换由两个基本操作组成:
(1)坐标的空间变换 (2)灰度内插,即对空间变换后的像素赋灰度值
例2.9 图像旋转与灰度内插
用仿射变换说明图像旋转。
图像配准是数字图像处理的一种重要应用。
主要方法之一是使用约束点,这些点是在输入图像和参考图像中其位置恰好已知的相应点.这些点是在输入图像和参考图像中其位置恰好已知的相应点.
估计变换函数问题是建模问题之一
例2.10 图像配准

2.6.6 向量与矩阵操作

2.6.7 图像变换

通过变换输入图像来表达图像处理任务,在变换域执行指定的任务,之后再用反变换返回到空间域会更好.该过程从空间域到变换域,然后返回到空间域.
例2.11 变换域图像处理

2.6.8 概率方法

你可能感兴趣的:(数字图像处理(冈萨雷斯),计算机视觉,图像处理,人工智能)