数字图像处理及MATLAB实现中的一些知识点总结。
名词 | 概念解释 |
---|---|
数字图像 | 物体的数字表示,以数字格式存放的图像 |
图像增强 | 改善图像视感质量,突出图像中人所感兴趣的部分 |
图像编码 | 对图像信号进行高效编码,即研究数据压缩技术 |
图像复原 | 基于模型和数据的图像恢复 |
图像分割 | 把图像按其灰度或集合特性分割成若干区域的过程 |
图像分类 | 将图像经过某些预处理后,再将图像中有用物体的特征进行分割、特征提取 |
图像重建 | 从数据到图像的处理(输入是数据,输出是图像) |
数字图像处理与模拟图像处理的根本不同在于:
它不会因图像的存储、传输或复制等一系列可变换操作而导致图像质量的变化
数字图像处理的特点:
(1)处理信息量大(2)占用频带较宽(3)数字图像各个像素相关性大
数字图像处理的优点:
(1)精度高(2)再现性好(3)通用性、灵活性强
数字图像处理的研究内容:
(1)图像增强(2)图像编码(3)图像复原(4)图像分割(5)图像分类(6)图像重建
名词 | 概念解释 |
---|---|
马赫带效应 | 是一种主观的边缘对比效应。当观察两块亮度不同的区域时,边界处亮度对比加强,使轮廓表现得特别明显。 |
图像的采样 | 将空间上连续的图像变换成离散点的操作 |
图像的量化 | 将像素灰度转换成离散的整数值 |
二值图像 | 只有黑白两种颜色,一个像素占1bit,0表示黑,1表示白 |
灰度级数 | 一幅图像中不同灰度值的个数,灰度级数=2^g,g=1.2.3… |
亮度图像 | 像素灰度级用8bit,每个像素介于0~255 |
索引图像 | 把像素值直接作为RGB调色板下标的图像 |
RGB图像 | 每个像素由红绿蓝三个字节组成,每个字节为8bit |
人类的视觉过程包括:光学过程、化学过程、神经处理过程
图像的采样:采样间隔越大,图像分辨率越低,图像质量越差,严重时会出现马赛克效应,
采样间隔影响图像质量。
图像的数据量:一幅大小为M×N,灰度级数为G=2^g的图像需要的存储空间,大小为M×N×g(bit)
像素间的基本关系:相邻像素,有4邻域或8邻域之分,4邻域属于8邻域
两个像素的关系:(1)4邻接(2)8邻接(3)m邻接
像素的距离:(1)欧式距离(2)城市距离(3)棋盘距离
图像基本运算包括:点运算、代数运算、逻辑运算、几何运算
点运算 | 具体运算形式 |
---|---|
线性点运算 | 输入图像的灰度值和输出图像的灰度值呈线性关系:s=ar+b |
非线性点运算 | 常见:对数运算或幂次运算 |
代数运算 | (代数运算指像素点对点运算)加法、减法、乘法、除法 |
---|---|
逻辑运算 | (逻辑运算一般运用于二值图像)与(and)或(or)非(not) |
几何运算 | 图像的平移、镜像、旋转、缩放、灰度重采样(最近邻法、双线性插值、三次内插) |
---|
傅里叶级数:任意周期信号可分解为复正弦信号的叠加
连续傅里叶变换:把一个函数分解为该函数的频率谱,时域→频域
离散余弦变换(DCT):类似于离散傅里叶变换,但是只使用实数
灰度级直方图反映图中不同灰度级出现的统计概率
n(k)=nk/n;nk为图像中灰度级为k的像素个数,n为像素总个数
将图像所占有的像素灰度间距拉开,进而加大图像反差,改善视觉效果。
将输入图像灰度分布变换成一个期望的灰度分布直方图。
采用模板处理方法
局部平滑法用邻域内各像素的灰度平均值代替该像素原来的灰度值。
图像锐化:增强图像的边缘或轮廓。
图像平滑 | 通过积分使图像边缘模糊 |
---|---|
图像锐化 | 通过微分使图像边缘突出 |
核心为傅里叶变换。
频率域平滑滤波器 | 理想低通滤波器、巴特沃斯低通滤波器、指数低通滤波器、梯形低通滤波器 |
---|---|
频率域锐化滤波器 | 理想高通滤波器、巴特沃斯高通滤波器、指数高通滤波器、梯形高通滤波器 |
注意平滑是低通滤波器,锐化是高通滤波器。(图像的边缘、细节主要位于高频部分)
图像复原又名图像恢复,其关键问题在于建立退化模型。
常见的噪声模型:高斯噪声 、均匀分布噪声、脉冲噪声(“椒盐”噪声)
均值滤波器 | 以周围像素灰度值(比如3×3区域内,包括自身)的算式平均值作为该点的输出 |
---|---|
中值滤波器 | 将区域内(比如3×3)像素灰度值从小到大排列,将中间值作为该点的输出 |
最大/最小值滤波器 | 将区域内(比如3×3)像素灰度值从小到大排列,将最大/最小值作为该点的输出 |
对于图像边缘像素点,可以选择保持灰度值不变。
逆滤波 | 已知系统的传递函数,对没有退化的输入图像的频谱采用傅里叶反变换,得到恢复图像(要求信噪高) |
---|---|
维纳滤波 | 最小均方误差滤波器,在有噪声的情况下,进行图像复原 |
信息量 | 信息源中发出的所有信息中该信息出现概率的倒数的对数,概率越大,信息量越大 |
---|---|
信息熵 | 衡量信息的不确定,一个系统越是有序,信息熵就越低。 |
图像数据冗余 | 由于两幅相邻图像之间的时间间隔很短,故两幅图像中包含大量重复信息 |
冗余的类型 | 空间冗余、时间冗余、信息熵冗余、视觉冗余、结构冗余、知识冗余 |
哈夫曼编码 | 根据可变长最佳编码定理,应用哈夫曼算法产生的一种编码方法 |
关于哈夫曼编码,可以看看链接(有具体的例子说明):
链接: https://blog.csdn.net/qq_36653505/article/details/81701181
哈夫曼编码的特点:
(1)对于同一个信息源,构造的码不唯一,但效率唯一
(2)对于不同信息源,编码效率不同
(3)实现电路复杂,存在误码传播问题
(4)只能用近似的整数而不是理想的小数表达
图像分割是图像识别和图像处理的基本前提步骤,是指将一幅图像分解为若干互补交叠的、有意义的、具有相同性质的区域。
图像的边缘有方向和幅度值两个属性,沿边缘方向像素变化平缓,垂直于边缘方向的像素变化剧烈,边缘上的这种变化可以用微分算子检测出来,通常用一阶或二阶导数来检测边缘,不同点在于:一阶导数认为最大值对应边缘位置,二阶导数则以过零点对应边缘位置。
一阶算子 | Roberts算子、Prewitt算子、Sobel算子 |
---|---|
二阶算子 | 拉普拉斯算子、高斯-拉普拉斯算子(LoG) |
适用于分割物体与背景有较强对比的景物。
基于灰度阈值的分割方法是通过设置阈值,把像素点按灰度级分成若干类,从而实现图像分割。
全局阈值选择的主要方法:人工选择法、直方图技术选择法、自动计算选择法。
自适应阈值:把灰度阈值取成一个随图像中位置缓慢变化的函数值。
阈值分割比较少或没有考虑空间关系,基于区域的分割方法可以弥补这点不足。
区域分割方法利用的是图像的空间性质,认为分割出来的属于同一区域的像素应具有相似的性质。
传统的区域分割方法主要有区域生长法、区域分裂合并法。
当处理二值图像时,形态学主要应用于提取对于描绘和表达形状有用的图像成分。
形态学操作:腐蚀、膨胀、开运算、闭运算等等
膨胀使图像扩大而腐蚀使图像缩小。
开运算、闭运算都会使对象的轮廓变得光滑。
但是又有区别,开运算断开狭窄的间断和消除细的突出物,闭运算弥合狭窄的简短和长细的鸿沟,消除小的孔洞。
形态学运算的介绍来源于:
链接: https://blog.csdn.net/qq_40855366/article/details/81177174
形态学算法包括:边界提取、连通分量、凸壳、区域骨架等
预处理或后处理方法如区域填充、细化、粗化、修剪等。
牛顿发现的现象:当一束太阳光通过一个玻璃棱镜时,出现的光束不是白色的,而是由彩色谱组成(紫色、蓝色、青色、绿色、黄色、橙色、红色的连续彩色谱)
三原色原理:
(1)自然界的任何光色都可以由3种光色按不同的比例混合而成。
(2)三原色之间是相互独立的,任何一种光色都不能由其余的两种光色来组成。
(3)混合色的饱和度由3种光色的比例来决定。混合色的亮度为3种光色的亮度之和。
使用红绿蓝三原色的亮度来定量表示颜色,也称加色混色模型,以RGB三色光相互叠加来实现混色效果。
B=cat(dim,A1,A2,A3,...) %dim为维数,cat函数将A1,A2,A3,...矩阵连接成维数为dim的矩阵
该彩色模型用H、S、I三个参数描述颜色特性,H为颜色的波长,称为色调;S表示颜色的深浅程度,称为饱和度;I表示强度或亮度。
两个RGB像素点的距离与人类对这两点的视觉感知距离并不一致,而HSI模型与人类的视觉是近似一致的,使得HSI彩色模型非常适合借助人类的视觉系统来感知彩色特性的图像处理算法。
%%将一幅彩色图像从RGB彩色空间转换到HSI彩色空间(该转换是非线性转换)
rgb=imread('*.jpg');
rgb1=im2double(rgb);
r=rgb1(:,:,1);
g=rgb1(:,:,2);
b=rgb1(:,:,3);
I=(r+g+b)/3;
tmp1=min(min(r,g),b);
tmp2=r+g+b;
tmp2(tmp2==0)=eps;
S=1-3.*tmp1./tmp2;
tmp1=0.5*((r-g)+(r-b));
tmp2=sqrt((r-g).^2+(r-b).*(g-b));
theta=acos(tmp1./(tmp2+eps));
H=theta;
H(b>g)=2*pi-H(b>g);
H=H/(2*pi);
H(S==0)=0;
hsi=cat(3,H,S,I);
figure,imshow(rgb);
figure,imshow(H);
figure,imshow(S);
figure,imshow(I);
应用场景:医学、监控、军事及数据显示。
主要目的:提高人眼对图像细节的分辨能力,以达到图像增强的目的。
基本原理:将灰度图像或单色图像的各灰度级匹配到彩色空间中的一点,从而使单色图像映射成彩色图像。
全彩色图像处理和灰度图像的处理的区别:灰度图像处理的是灰度标量,而彩色图像处理的是分量向量。
彩色图像平滑:使图像模糊化,减少噪声
彩色图像锐化:突出图像的细节