图像处理:
特征:图像处理的基本特征是图像处理系统的输入和输出都是图像。
图像分析:
图像处理和图像分析之间的关系:
图像处理是对图像低级处理阶段,图像分析是对图像高一级处理阶段。
二值图像指:每个像素点均为黑色或者白色的图像。二值图像一般用来描述字符图像,其优点是占用空间少。缺点是,当表示人物,风景的图像时,二值图像只能展示其边缘信息,图像内部的纹理特征表现不明显。这时候要使用纹理特征更为丰富的灰度图像。
采样:将一幅连续图像(二维空间和亮度值都是连续值的图像;模拟图像)分割成M*N个网格,每一个网格用一个亮度值来显示。此时一个网格都称为像素,M×N的取值满足采样定理。
量化:把采样点上对应的亮度连续变化区间转换为单个特定数码的过程。量化后,图像就被表示成一个整数矩阵。每个像素具有两个属性:位置和灰度。位置由行、列表示。灰度表示该像素位置上亮暗程度的整数。此数字矩阵M×N就作为计算机处理的对象了。灰度级一般为0-255(8bit量化)。
取样的实现是由产生数字图像的传感器或者数字化装置决定,比如扫描仪(分为线阵扫描仪和面阵扫描仪)。
其次,均匀量化实质是将图像的灰度取值范围[0,Lmax]划分成L个等级,并将二维图像平面上的M*N个网格的中心点的灰度值分别量化成L个等级中与其最接近的那个等级值。(一般的数字图像灰度级取值范围为从黑到白,即从[0,L-1]。0表黑,L-1表示白)。
非均匀量化:在视觉上,根据图像细节的丰富程度进行间距选取。越丰富时,采样间距就小,否则间可以调大。在统计特性上,像素灰度值频繁出现的灰度值范围内可取小间距;而对于像素灰度值极少出现的范围则取大间距也能够满足。即细节对应紧密,平缓对应稀疏。
1、空间分辨率
用单位距离内可分辨的最大线对数来度量。如用黑白交替的垂线构造图形,线宽为W,黑白线对宽为2W,则单位距离内有1/2W个线对。
空间分辨率反映的是图像数字化对图像像素划分的密度,即反映的是一个图像的细节。如果细节越丰富,采样的间距就越小越清晰。如下图所示:
2、灰度级分辨率
承接着均匀分布来说,灰度级分辨率跟均匀分布的实质差别不大。灰度级分辨率实质就是在对连续图像中,对灰度级别的一个细节分辨的最小变化。即假设均匀变化的量化从[0,L-1],256灰度级分辨率对细节的分辨非常清晰。那么将分辨率降到32、16、8甚至2时,因为对细节的划分越来越稀疏,反而会出现“伪轮廓、丢失细节”等方面的问题的出现。
可以看出灰度设定的细节越松散,对于部分地方差别非常明显。
需要根据图像的类型进行分别存储空间计算。数字化图像数据有两种存储方式:位图存储和矢量存储。
1、图像分类
黑白(二值图像):图像的每个色素只能是黑或白,没有中间的过渡,故又称为二值图像。二值图像的像素值为0或1。
灰度图像:每个像素的信息由一个量化的灰度级来描述的图像,没有彩色信息。
彩色图像:每个像素的信息由RGB三原色构成的图像,其中RGB是由不同的灰度级来表示的。
2、位与色
1位可以表示2种状态,2位可以表示4种 状态,3位可以表示8种( 2^3)状态…以此类推。
位与颜色在于一个像素所占的bit位个数。也就是说,越低位所表现的图像越单调黑白;越高位图像所能展示的像素颜色越丰富。
位图存储计算示例如下:
如果对于像素p坐标位于某个位置,其水平和垂直方面相邻的像素q最多有四个。
同理,四对角邻域就是对角方向的相邻最多有四个像素p
上述两个概念的结合就是8—邻域。也就是说如果像素p和q是4邻接,那么一定就是8邻接。
连通域标记,就是将一副二值图像中的每个白色像素进行标记,属于同一个连通域的白色像素标记相同,不同连通域的白色像素有不同的标记,从而能将图像中每个连通域提取出来。
灰度图像的直方图是一种描述一幅灰度图像中灰度级内容的最简单且最有用的工具。它表达一种表示数字图像中各级灰度值及其出现频数的关系的函数,实质上就是柱状图。
1.直方图的位置缺失性
灰度直方图仅仅反映了数字图像中各个灰度级出现频数的分布,但是无法确定像素的位置,即两幅图可能由相同的直方图,但是对应的像素可能处在不同的位置。
2.直方图与图像的一对多特性
每一幅图像可以唯一确定一个直方图,但是由于直方图的位置缺失性而导致直方图与图像的具有一对多特性。
3.直方图的可叠加性
由于灰度直方图统计的是各灰度级出现频数的统计值,若一幅图像分为几个子图,则该图像的直方图就等于各子图直方图的叠加。
总的来说:直方图反映了图像的清晰程度,当直方图均匀分布时,图像最清晰。
具体说来:
图像的几何变换用于使得原图像产生大小、形状和位置等变化的效果。
图像的几何变换包括图像平移变换、图像旋转变换、图像镜像、图像转置、图像的缩放
图像增强就是通过对图像的某些特征如如边缘、轮廓、对比度等内容,进行强调或者尖锐化。使之更加适合于人眼的观察或者机器的处理的一种技术。
直方图均衡,就是把一已知灰度概率分布的图像,变换成具有均匀概率分布的新图像的过程。
首先找一种变换,使具有任意概率分布密度的直方图的图像,变换成接 近于均匀概率分布密度的直方图的图像。设 r 为原图像的归一化灰度值, 0≤r≤1,s 为增强后的新图像的归一 化灰度值,且0≤s≤1,直方图均衡变换函数为:
s = T ( r ) 0 ≤ r ≤ 1 s=T(r) 0≤r≤1 s=T(r)0≤r≤1
T®的选取应满足如下条件:
(1)在区间0≤r≤1内,T®为单值单调增加;(保证原图各灰度级在变换后 仍保持从黑到白(或从白到黑)的排列次序)
(2)对于0≤r≤1,有0≤s≤1。(保证变换前后灰度值动态范围的一致性)
从s到r的反变换r=T^-1(s)同样满足条件(1)(2).
结合欧拉公式和傅里叶积分:
变换分析的直观在于将一个信号波形拆分成很多不同频率的正弦波之和,即最后得到的相位谱和相位角,
基于如上,傅里叶变换性质如下:
线性性质、可分离性、平均值性质、周期性、共扼对称性、平移性、旋转不变性、尺度变换性、卷积性质
先通过对图像进行离散傅里叶变换把图像变换到频率域,然 后利用适当的频率域图像处理方式对图像进行处理,处理完 后再把它转换回空间域中,就可解决那些在空间域不便于解 决的图像处理问题。那么就需要理解频率域上的问题。
频率域图像增强核心:
图像中的边缘和灰度的陡峭变化对应于傅立叶频谱的高频部分,选择能使高频通过、使低频衰减的转 移函数,就可以实现高通滤波,达到突出图像的高频边缘 成分,实现图像增强的效果。
用于消除以某点为对称中心的给定区域内的频率,或用于阻止 以原点为对称中心的一定频率范围内信号通过的问题,就可以用带阻滤波器实现。带通滤波器也可以通过对相应的带阻滤波器进行“翻转”获得,即1-‘带阻滤波器的传递函数’。
低通滤波:理想低通滤波器、巴特沃斯低通滤波器、高斯低通滤波器
选择能使低频通过、使高频衰减的转移函数,就可以实现低通 滤波,达到滤除噪声的目的。
理想低通滤波器( ILPF )的转移函数定义:
D0是一个非负整数,D(u,v)为频率平面从原点到点(u,v)的距离。
简单来说,就是只有那些位于该圆柱体内的频率范围的信号才能通过,而位于圆柱体外的频率成分都将被滤掉。
图像恢复是使退化了的图像去除退化因素,并以最大保真度恢复成原来图像的一种技术,也就是其目的就是改善图像质量。
图像恢复:从造成图像质量下降的客观原因出収,改善图像质量;试图恢复图像 原来的面貌。图像恢复总是试图寺找引起图像质量下降的客观原因,有针对性地迕行 “恢复”处理。
图像的退化过程可以理解为施加于原图像上的运算和噪声两者联合作用的结果。
思路:1、找出使原图像退化的因素,找出图像质量下降的物理过程。
2、图像的退化过程模型化。3、据此采用相反的过程对图像进行处理,从而恢复出原图像。
图像增强和图像恢复的目的都是改善图像质量。
图像恢复总是试图寻找引起图像质量下降的客观原因,有针对性地进行 “恢复”处理。
图像的退化过程可以理解为施加于原图像上的运算和噪声两者联合作用的结果。
运动模糊图象实际上就是同一景物图象经过一系列的距离延迟后再叠加,最终形成的图象。
噪声与图像信号无关,这种独立亍图像信号的噪声称为加性噪声
噪声的幅值与图像本身的灰度(亮度)值有关,这种噪声称为乘性噪声
高斯噪声是一种源于电子电路噪声和由低照明度或高温带来的传感器噪声
傅里叶变换:知道一段时间内,信号的各个频率分量有分别多少。
小波变换:知道一段时间内,信号的各个频率分量有分别多少,以及他们都是什么时候出现的。
小波:区域小、长度有限且均值为0的振荡波形。
小:即衰减性,局部非0。非0系数的个数多少,反映了高频成分的丰富程度。
波:即波动性。在于振幅正负相间的一种振荡形式
是一维离散小波变换得推广,是将信号在不同尺度上的分解,从而得到原始信号的近视值和细节值;由于信号是二维的,所以分解也是二维的。
分解后的结果是:
分割方法:
用来从图像中分离出具有某种相同特征的几何形状(如,直线,圆等)。最基本的霍夫变换是从黑白图像中检测直线(线段)。
核心思想在于将图像空间坐标X-Y变换到关于P-Q参数空间,将给定的直线或者曲线变换成参数空间的点形成峰值,就可以将原本检测整体特性转换成检测局部特性的问题。
阈值化分割就是提取出物体与背景的灰度差异,并且把图像分为具有不同灰度级的目标区域和背景区域的一种图像分割技术。
如上图所示,暗的地方代表背景,亮的地方代表物体。此时我们就在这两个峰值中间的谷底T为阈值来切分背景和物体来分别两者。
边缘检测就是一种使用数学方法对图像像素集合灰度灰度具有阶跃或者屋顶等变化进行提取检测的一种技术,一般可以通过使用一次求导或者二次求导发现其中的规律。而梯度在于对二元函数针对x方向或者y方向进行一次偏微分求导的过程,得到图像的梯度幅度。
纹理的特性:
粗糙度、方向性、规则性。
图像的熵反映了图像中平均信息量的多少,反映的是图像的复杂程度。并且图像的熵是一个整体量,不代表某个局部。一维熵表示图像中灰度分布的聚集特征所包含的信息量。
三基色:自然界绝大部分颜色可以分解成红、绿、蓝三种颜色组合而成。
加色系统:红绿蓝三基色按照不同的比例进行相加混色称为相加混色。
减色系统:利用染料等吸色系统可以实现相减混色,比如白光照射在青色染料能够吸收红色而反射青色,是相对于加色系统而言的概念。
RGB模型:基于笛卡尔坐标构成彩色立方体空间。RGB对应的是响应坐标的顶点,黑色是原点,白色是离原点最远的顶点。除了白色、黑色、红绿蓝以外的顶点,还有品红(蓝加红)、青(绿加蓝)、黄(红加绿)。
HSI模型:H:色调,反映了该颜色最接近什么样的光谱波长、S:饱和度,是色环的原点到彩色点的半径长度、I:亮度,确定了像素的整体亮度。就是集合三种描述被观察物体的颜色的解释,常用于观察者进行颜色匹配实验使用。它是一个双圆锥子集。
伪彩色增强就是将一幅具有不同灰度级的图像通过一定的映射转变为彩色图像,来达到增强人对图像的分辨能力。
就是将灰度图转换成彩色图片的技术。
颜色通道中不同敏感度、增光因子、偏移量等使图像的3个分量发生了不同的线性变换