如何用一个数值方式来表示一个图像
数字图像是图像的数字表示,像素是其最小单位
一般是用整数矩阵来描述一个数字图像
用矩阵坐标系来定义图像的坐标
黑白图像又称2值图像,像素值为0、1
灰度图像是指每个像素的信息由一个量化的灰度级来描述的图像,没有彩色信息
彩色图像用RGB三个不同的灰度级来描述,用三个矩阵同时描述
是指将模拟图像经过离散化之后,得到用数字表示的图像
图像的数字化包括空间离散化(采样),和明暗表示数据的离散化(量化)
将空间上连续的图像转变成离散的采样点
采样间隔太小,则增大数据量,太大,则会发送信息的混叠,导致细节无法辨认
将各个像素所含的明暗信息离散化后,用数字来表示
考虑到人眼的识别能力之后,一般采用8bit量化,采用0~255的整数来描述“从黑到白”
在3bit下的量化,会出现伪轮廓现象
在数字图像处理中,一个最简单,最有用的工具
灰度直方图是灰度级的函数,是对图像中灰度级分布的统计,有俩种表示形式
横坐标表示灰度级,纵坐标表示图像中对应某个灰度级所出现的像素个数
数组的下标表示相应的灰度级,数组的元素表示该灰度级下的像素个数
通俗地讲,就是亮暗地对比程度
对比度通常表现了图像画质地清晰程度
C = ∑ δ δ ( i , j ) 2 P δ ( i , j ) C=\sum_{\delta}\delta(i,j)^2P_\delta(i,j) C=δ∑δ(i,j)2Pδ(i,j)
其中
δ ( i , j ) = ∣ i − j ∣ \delta(i,j)=|i-j| δ(i,j)=∣i−j∣
代表相邻像素间地灰度差
P δ ( i , j ) P_\delta(i,j) Pδ(i,j)
是像素灰度差为 δ \delta δ的像素分布概率
图像增强是为了改善画质,使得图像的显示效果更加清晰
通过亮度差异(即对比度)扩大,来把人所关心的部分强调出来
进行像素点对点的,灰度级的线性影射,该映射关系通过调整参数,来实现亮暗差异的扩大
动态范围是指图像所记录的场景中从暗到亮的变化范围
通过动态范围的压缩,可以将所关心部分的灰度级的变化范围扩大
直方图均衡化方法的基本思想是,对在图像中像素个数多的灰度级进行展宽,而对像素个数少的灰度级进行缩减。从而达到清晰图像的目的。
由于人眼分辨不同彩色的能力比分别不同的灰度级的能力强,因此,把人眼无法区别的灰度变化,施以不同的彩色来提高识别率,这便是伪彩色增强的基本依据。
要由灰度图像生成一幅彩色图像是一个一到三的影射。
显然由少信息量获得多信息量必然是基于估计原理。也就是说,对未知的部分,通过各种手段进行合理的估计。
研究的目的不同,则给出的灰度到彩色的估计影射方法也随之不同。
图像的几何变换包括了图像的形状变换和图像的位置变换
放大,缩小,错切
平移、镜像、旋转
思路:等间隔选取数据
双线性插值
f ( 0 , y ) = f ( 0 , 0 ) + y ∗ [ f ( 0 , 1 ) − f ( 0 , 0 ) ] f ( 1 , y ) = f ( 1 , 0 ) + y ∗ [ f ( 1 , 1 ) − f ( 1 , 0 ) ] f ( x , y ) = f ( 0 , y ) + x ∗ [ f ( 1 , y ) − f ( 0 , y ) ] f(0,y)=f(0,0)+y*[f(0,1)-f(0,0)]\\ f(1,y)=f(1,0)+y*[f(1,1)-f(1,0)]\\ f(x,y)=f(0,y)+x*[f(1,y)-f(0,y)] f(0,y)=f(0,0)+y∗[f(0,1)−f(0,0)]f(1,y)=f(1,0)+y∗[f(1,1)−f(1,0)]f(x,y)=f(0,y)+x∗[f(1,y)−f(0,y)]
注意旋转后处理
图像噪声,是图像在摄取时或是传输时受到的随机干扰信号
常见的有椒盐噪声,高斯噪声
出现位置是随机的,但噪声的幅值基本相同
出现的位置是一定的,但噪声的幅值是随机的
高斯噪声,均值滤波比中值滤波好
椒盐噪声,中值滤波比中值滤波好
目的是加强图像中景物的细节边缘和轮廓
锐化的作用是使灰度反差增强
锐化算法的实现是基于微分作用
通过某种方法,使得画面场景被分为目标物和非目标物,即将图像的像素变换为黑、白俩种。
一般结果为二值图像,所以又称图像分割为图像的二值化处理
将具有相似性质的像素集合起来构成区域
将相互连接在一起的黑色像素的集合称为一个连通域
消除连通域的边界点,使得边界点收缩的处理
将与目标区域的背景点合并到该目标物中,使得目标物边界向外部扩张的处理
先腐蚀再膨胀
先膨胀再腐蚀
一个DFS就可以了
骨架:图像中所有目标区域的轴线。
细线化:求一图像骨架的过程。
方法:“剥洋葱”的办法。在去层时,需要保持不改变原有区域的连通性。
删除:将该点从连通域中删除,将像素值从1变成0.
原则:(1)内部点、端点、孤立点不能被删除;
(2)如果删除该点会改变连接状况,则不能被删除;
(3)如果当前点为边界点,且删除之后不改变连通性,则可以删除。
描述颜色的不同,取决于颜色的波长
描述颜色的深浅,取决于颜色中混合白光的比例多少
描述色光的明暗变化的强度,取决于色光的能量
色调饱和度统称为色度
RGB表色系
HSL表色系
CMYK表色系
YUV表色系
数据冗余:
只要接收端不会产生误解,九可以减少承载信息的数据量
通过改变图像的描述方式,来实现图像的压缩。
将一行中灰度值相同的相邻像素,用一个计数值和该灰度值来代替。
一维行程编码是利用一行上像素的相关性,逐行对图像进行扫描,然后对扫描的结果进行编码。
只是扫描路径不同而已
老生常谈
先算概率,每次选择最小的俩个合并
最后根据从根节点出发的路径进行编码
DCT变换是希望在接收方不产生误解的前提下进行一定的信息丢失。
DCT变换编码的思想是利用离散余弦变换对数据信息强度的集中特性,可以将数据中视觉上容易察觉的部分与不容易察觉的部分进行分离,由此可以达到进行有损压缩的目的。
由前面所讲到的频域变换得到的启示,就是将低频与高频部分的信息,分别按照不同的数据承载方式进行表述。
将多种编码方式的优点进行综合,提高编码的效率
就是傅里叶变换,不过是离散的
同时根据计算机的计算特点,实现了快速傅里叶变换,也就是FFT