数字图像处理基本概念
P3 图形采用矢量结果,而图像采用栅格结构
P3 根据图像的产生方法分为3类:可见图像、物理图像、数学图像
P3 可见图像:指视觉系统可以直接看见的图像。
P4 物理图像:反映物体的电磁波辐射能,包括可见光和不可见光
P4 数学图像: 由连续函数或离散函数生成的抽象图像,其中离散函数生成的图像就是计算机可以处理的数字图像
P4 图像是其所表示物体的信息的直接描述和概括表示
P5 数字图像是指一个被采样和量化后的二维强度函数(该二维函数可以由光学方法产生),采用等距离矩形网格采样,对幅度进行等间隔量化。也可以说,一幅数字图像是一个被均与采样和均匀量化(即离散处理)的二维数值矩阵。
P5 数字图像运算的分类:全局运算,点运算,局部运算
P5 相关概念:噪声、对比度、采样密度、放大率、数字化
P5 噪声:一般指加性的或乘性的非图像本源信息
P6 数字化:是将一幅图像从其原来的形式转换为数字形式的处理过程。逆过程是显示。数字化步骤:扫描、采样、量化。
P6 扫描:是按照一定的先后顺序对一幅图像进行遍历的过程
P6 采样:是指遍历的过程中,在图像的每个像素位置上测量其灰度值,即亮度值
P6 量化:将采样得到的灰度值通过模数转换器等器件转换为离散的整数值
P6 扫描、采样、量化这三个步骤组成了数字图像化的主要过程
P6 获取数字图像是三种方法:传统可见图像经过数字化处理转换、各种光电转换设备转换得到、二维离散数学函数生成。
P6 最终得到的数字图像在数学上是一个二维矩阵
P7 数字图像在计算机中采用二维矩阵表示和存储
P7 像素是构成图像的最小基本单位,图像的每一像素都具有独立的属性,其中最基本的属性包括像元位置和灰度值两个属性
P8 静态图像按特性分来:矢量图、位图(栅格图像)
P8 位图根据颜色和灰度值划分成4种类型:二值图像、灰度图像、索引图像、真彩色RGB图像
会计算RGB所图像大小
P10 颜色模型RGB、HSI、CMYK、YUV
P10 RGB模型 从物理光学角度描述颜色 加色模型 R红色 G绿色 B蓝色
P11 HSI模型 根据视觉的主观感觉描述颜色 H色调 S饱和度 I亮度
在HSI彩色空间中,I表示强度,它决定了像素的整体亮度,而不考虑色彩,而表征相思引彩色信息的两个参数是色度和饱和度
色度H表面颜色的种类,而颜色是由波长决定的
饱和度S是表示颜色的深浅浓淡程度的物理量。
强度I是人眼所能感觉到的表示颜色明暗程度的物理量
P12 CMYK 表色系统 减色模型 C青色 M品红色 Y黄色 K黑色 一般在彩色印刷领域使用
P13 YUV 表示电视彩色坐标系统 PAL制电视将RGB三原色信号改成YUV新航,其中Y信号表示亮度,UV表示色差信号
P29 采样与量化:对模拟图像在空间(x,y)方向上以及亮度函数f(x,y)都进行离散化处理,通常把这一过程称为采样与量化。
采样:图像在空间 (x,y)上的离散化称为采样
采样分类 :均匀采样、非均匀采样,均匀采样等间距采样
P30 量化:量化过程就是以离散的灰度值信息代替连续的模拟量灰度信息的过程,该过程是一对多的映射过程
线性量化:....等间距
同样灰度级下,图像质量会因采样点数的减少,效果逐渐变差,当采样点数过少时,图像可能无法分辨
若采样数不变,则当灰度级数量减少到一定程度时,图像质量也将产生一定的不利影响
非线性量化: ....不等间隔
P53 卷积运算在信号处理和图像处理学科中通常称为滤波
P67 直方图:直方图是统计学中的常用工具之一,在数字图像处理中的灰度直方图是灰度级的函数,它描述了图像中具有该灰度的 个数其横坐标是灰度级,纵坐标是该灰度级出现的频率(像素的个数)
任一灰度级D的面积函数就是大于等于该灰度值 像素个数
直方图的性质:直方图是一幅图像各像素灰度值出现次数或频数的统计结果、图像与直方图之间是一种多对一的映射关系、子直方图的和等于原图像直方图
P68 直方图的作用:判断一幅图像是否合理地利用了全部被允许的灰度级范围
P69 直方图与图像的关系:直方图是面积函数关于灰度级的导数的负值
P71 三类运算:单幅图像→单幅图像、多幅图像→单幅图像、单幅或多幅图像→数字/符号等
广义图像:所有以二维信息形式输出的信息统称为广义图像,标号图像也属于广义图像的范畴
第一类运算功能是数字图像处理中最基本的功能
根据输入图像到输出图像处理运算的数学特征分类:点运算、代数运算、几何运算
点运算可以改变图像数据所占据的灰度值范围
线性点运算
非线性点运算
点运算的应用:对比度增强、光度学标定、显示标定、轮廓线、剪裁
P75 代数运算 加、减、乘、除
图像相加运算的重要应用之一时对同一场景的多幅图像求平均值的运算,它可以被用于相除或降低加性随机噪声,并具有良好的效果
图像相减运算可用于消除一幅图像中所不需要的加性图案。
减法运算还可用于检测同一场景的两幅图像之间的变化。
除法运算还可以对产生对颜色和多光谱图像分析十分重要的比率图像
P75 加法运算通常用于平均值降噪等多种场合
P78 图像相减常用于检测变化及运动的物体,图像相减运算又称为图像差分运算
差影法:所谓差影法,实际上就是图像的减法运算(又称减影技术),是指将同一景物在不同时间拍摄的图像或同一景物在不同波段的图像相减
P81:几何运算
几何变换可改变像素点所在的几何位置,以及图像中的各物体之间的空间位置关系,这种运算可以被看成是将各物体在图像内移动,特别是图像具有一定的规律性时,一个图像可以又另一个图像通过几何变换产生
齐次坐标、平移、缩放、镜像变换、旋转变换、复合变换
P97 灰度级插值
几何变换之后的目标图像的位置坐标并非整数
在进行图像的几何变换时,除了要进行几何变换运算之外,还需要进行灰度级插值处理。常用的灰度级差之方法有三种:最邻近法、双线性插值法和三次内插法。
P97 最邻近法 这种灰度估值方法会产生较大的误差,甚至可能影响图像质量
P99 双线性插值法 这种方法具有低通滤波性质,使高频分量受到损失,是图像细节退化而变得轮廓模糊。在某些应用中,双线性灰度插值的斜率不连续还可能会产生一些不期望的结果
P139 图像增强是数字图像处理的基本内容之一,其目的是根据应用需要突出图像中的某些有用的信息,削弱或除去不需要的信息,以达到扩大图像中不同物体特征之间的差别,使处理后的图像对于特定应用而言,比原始图像更合适或者为图像的信息提取以及为其他图像分析技术奠定基础
图像的增强处理并不一定是一种无损处理
图像噪声的消除是以纹理信息(高频信息)的减弱为代价而实现的
噪声是指图像中的非本源信息
P140 图像噪声分类,按产生原因分外部噪声和内部噪声,外部噪声是指系统外部干扰从电磁波或经电源传进系统内部而引起的噪声
P140 图像噪声的特点:叠加性、分布和大小不规则、噪声与图像之间具有相关性
P141 图像增强分类:空域增强和频域增强
空域增强又分为:灰度变换和空域滤波
灰度变换:灰度变换时基于点操作的增强方法,将每一像素点的灰度值按照一定的数学变换转换为一个新的灰度值。
空域滤波:空域滤波是基于领域处理的增强方法,它应用某一模板对每个像素点与其周围领域的所有像素点进行某种确定数学运算得到该像素点的新的灰度值,输出值的大小不仅与该像素点的灰度值有关,而且还与其领域内的像素点的灰度值有关,常见的图像平滑滤波与锐化滤波技术就属于空域滤波范畴
频域增强:频率域增强法首先将图像从空间域安装某种变换模型(如傅里叶变换或其他变换)变换到频率域,然后在频域对图像进行处理,再将其反变换到空间域。通常包括低通、高通、带通和带阻四种典型的滤波器结构。
P142 图像增强效果评价 定性评价、定量评价
P142 常见的空域灰度变换:直接灰度变换、基于直方图的灰度变换、对多个灰度图像进行代数运算实现灰度变换
P143 线性灰度拉伸
按 比例线性拉伸
分段线性拉伸
直方图均衡化
空间滤波增强 均值滤波 中值滤波
P177 图像复原
图像复原与图像增强技术一样,也是一种改善图像质量的技术。图像复原的基本方法是根据事先建立起来的系统退化模型,将退化了的图像以最大的保真度恢复为原始图像或物体的真实影像。
P200 图像中的信息冗余:视觉冗余,空间冗余,时间冗余,信息熵冗余,结构冗余,知识冗余
视觉冗余:指人类视觉系统不敏感或不能感知的那部分图像信息
空间冗余:图像内部向量像素之间存在相关性所产生的图像冗余信息称为空间冗余
信息熵冗余:又称为编码冗余
结构冗余:许多图像中可能村咋很强的结构或自相似性
P202 图像编码:图像编码是安装一定的格式存储图像的数据的过程,而编码技术则是研究如何在满足一定图像保真条件下,压缩表示原始图像数据的编码方法。
信道编码:信道编码的主要任务是解决信息传输的可靠性问题,使处理过的信号在传输过程中尽量不出错或少出错,以及产生出错之后的错误纠正
信源编码:信源编码的主要任务是解决信息表示的有效性问题,即尽量提高编码效率,以最少的数码表示尽可能多的信息量,对信源实现压缩处理。
图像编码的目的是要研究数码的压缩率,即高校编码问题
按压缩原理划分,编码方法可以分为四大类:熵编码、预测编码、变换编码、混合编码。
根据解码后的图像与原始图像数据是否完全一致,可分为有损编码和无损编码。
有损压缩编码是指对图像进行解压后重新构造的图像与原始图像存在一定的误差。有损压缩李永乐图像信息本身包含的许多冗余信息,例如视觉冗余和空间冗余
无损编码是指对图像数据进行解压后重新构造出来的图像与原始图像之间完全相同,行程编码就是无损编码的一个实例
P203 图像编码的新方法:分形编码、小波变换编码、模型压缩编码
分形编码最大限度地利用了图像在空间域上的自相似性
P204 图像编码的评价
图像编码的评价可分为主观评价和客观评价
效率指标:信息熵、码字长度、编码效率、信息冗余度、,每秒钟所需的传输比特数、压缩比
P206 图像的统计编码
8.3 重点 大题2个 霍夫曼编码、香农范诺编码、香农对分编码、算术编码,行程编码的最简单形式
P214 行程编码。REL编码原理比较简单,即在被压缩文件中寻找连续重复的数值,以重复次数和重复数值自身两个值取代文件中的连续值,重复次数称为行程长度。例如,若有一串字符信息"aaaaabbbbcccddeefffaa',经过RLE编码处理可表示为"5a4b3c2d2e3f2a"
8.6 8.7知道JPEG、MPEG的定义
静止彩色图像和灰度图像(也称为连续色调图像)的压缩标准--JPEG标准。
MPEG标准不是一个单一的标准,而是一个用于全运动视频和相关音频压缩的标准系列。
图像的技术特征分为三层结构:图像处理、图像分析、图像理解与识别
图像处理、图像分析、图像理解与识别的基础工作都是建立在图像分割的基础上的
图像分割的最终结果是将图像分解成一些具有某种特征的单元,称为图像的基元
图像特征是指图像中可用作标志的属性,它可以分为统计特征和视觉特征两类
图像分割是进行图像分析的关键步骤
所谓边缘(又称为边沿),是指其周围像素灰度有阶跃变化或屋顶形变化的那些像素的集合
分割依据:相似性、非连续性
P243 分割的三种途径:以区域对象进行分割、以物体的边界为对象进行分割、先检测边缘像素,再将边缘像素连接起来构成边界进行分割
P244 灰度阈值法分割
P249 常见的边缘检测算子
图像的边缘点包括:空间曲面上的不连续点、物体与背景的分界线、不同材料组成的边缘线、阴影引起的边缘线
P251 边缘检测算子
罗伯特(Robert)边缘算子模板
1 | 0 |
0 | -1 |
0 | 1 |
-1 | 0 |
索贝尔(Sobel)边缘算子
-1 | -2 | -1 |
0 | 0 | 0 |
1 | 2 | 1 |
-1 | 0 | 1 |
-2 | 0 | 2 |
-1 | 0 | 1 |
普瑞维特(Prewitt)边缘算子
-1 | -1 | -1 |
0 | 0 | 0 |
1 | 1 | 1 |
1 | 0 | -1 |
1 | 0 | -1 |
1 | 0 | -1 |
拉普拉斯(Laplacian)边缘算子
0 | -1 | 0 |
-1 | 4 | -1 |
0 | -1 | 0 |
-1 | -1 | -1 |
-1 | 8 | -1 |
-1 | -1 | -1 |
凯西(Kirsch)边缘算子
5 | 5 | 5 |
-3 | 0 | -3 |
-3 | -3 | -3 |
-3 | 5 | 5 |
-3 | 0 | 5 |
-3 | -3 | -3 |
-3 | -3 | 5 |
-3 | 0 | 5 |
-3 | -3 | 5 |
-3 | -3 | -3 |
-3 | 0 | 5 |
-3 | 5 | 5 |
-3 | -3 | -3 |
-3 | 0 | -3 |
5 | 5 | 5 |
-3 | -3 | -3 |
5 | 0 | -3 |
-3 | 5 | 5 |
5 | -3 | -3 |
5 | 0 | -3 |
5 | -3 | -3 |
5 | 5 | -3 |
5 | 0 | -3 |
-3 | -3 | -3 |