此总结是关于《数字图像处理(第三版) 冈萨雷斯》 的总结
此总结可能存在很多漏洞,望请指正
推荐资源:
数字图像: 当坐标 x,y 和灰度值 f 是有限离散值时的图像
灰度(强度): 在空间 (x,y) 任何一点的幅度值 f
- 低级处理: 以输入、输出都是图像为特征,如: 降噪、对比度增强、图像尖锐化
- 中级处理: 以输入为图像,输出是从图像中提取的特征为特点、如: 图像分割、减少目标物
- 高级处理: 涉及“理解”已识别目标的总体,以及在连续统一体的远端执行与视觉相关的认知功能
数字图像处理: 指借助于数字计算机来实现图像之间的变换以改善图像的视觉效果
图像分析: 对图像中感兴趣的目标进行分割,纹理、形状等特征进行提取、检测和测量,以获得其客观信息,从而建立对图像的描述
图像理解: 在图像分析基础上,进一步研究图像中各目标的性质及其联系,并得出对图像内容含义的理解以及对原来客观场景的解释,从而指导决策
图像工程: 将光学、数学、心理学、计算机等学科的原理应用于图像相关工业领域,是图像处理技术与图像处理经验结合发展起来的
图像信息: 符号信息、景物信息、情绪信息
数字图像处理的主要内容: 图像变换、图像增强、图像恢复、图像分割、形态学图像处理、图像编码与压缩
图像处理的基本过程:
图像获取:对图像预处理
图像增强:以对问题的主观判断,对图像进行操作,使得图片比原始图像更适合处理
图像复原:改进图像外观,与图像增强相比,图像复原指的是客观处理图像
小波变换和多分辨率处理:以不同的分辨率来描述图像
图像分割:将一幅图像划分为其他组成部分或目标
图像处理的相关硬件设备:
亮度函数: 一种确定的表征图像特征的方法
一般表达式: I = f ( x , y , z , λ , t ) I = f(x, y, z, \lambda, t) I=f(x,y,z,λ,t)
平面二维单色图像亮度函数: I = f ( x , y ) = i ( x , y ) ∗ r ( x , y ) I = f(x,y) = i(x, y) * r(x,y) I=f(x,y)=i(x,y)∗r(x,y)
- i ( x , y ) i(x, y) i(x,y): 为入射分量,即入射到被观察场景的光源照射总量,其性质取决于照射源
- r ( x , y ) r(x, y) r(x,y): 为反射分量,即场景中物体所反射的光照总量,其性质取决于成像物体的特征
分辨率:
图像深度: 在位图图像中,表示各象素点亮度或色彩信息的二进制位数
图像数据量: 象素点数目与象素点所需字节数的乘积
空间频率: 指视像空间变化的快慢
数字化坐标轴称为取样,数字化幅度值称为量化
灰度级:典型取值是 2 的整数次幂,通常假设离散灰度级等间隔且是区间 [0,L-1] 内的整数
k bit 图像: 一副有 2 k 2^k 2k 灰度级的图像
动态范围:灰度级取值范围
高动态范围图像: 占有灰度级全部有效段的图像
当多个象素呈现该特征时,图像就有较高的对比度
对比度: 图像中最高和最低灰度级间的灰度差
图像的运算:
几何运算: 涉及到空间位置变化,和灰度插值
最邻近插值(零阶插值): 令输出像素的灰度值等于离它所映射到的位置最近的输入像素的灰度值
线性插值: 通过在同一直线上的 2 个点去估计给定点的灰度值
双线性插值: 通过 4 个邻近点去估计给定位置的灰度值
赋值公式: f ( x , y ) = a x + b y + c x y + d ,      f ( x , y ) f(x, y) = ax + by + cxy + d,\,\,\,\, f(x,y) f(x,y)=ax+by+cxy+d,f(x,y) 表示灰度值,4 个系数由 4 个临近点组成的未知方程确定
双三次插值: 包括 16 个最近邻点,商业图像编辑程序的标准内插法
马赫带效应: 视觉的主观感受在亮度有变化的地方出现虚幻明亮或黑暗的条纹
人类的视觉系统有增强边缘对比度的机制
同时对比度: 当物体对背景的亮度、对比度保持一致时,即使物体和背景的亮度在很大的范围里变化,人眼对亮度的感觉仍保持不变
空间频率特征: 指视像空间变化的快慢,清晰图像表明有大量的高频成分,模糊图像只有低频空间成分
灰度变换: 将一个灰度区间映射到另一个灰度区间的变换
目的: 可使图像动态范围加大、图像对比度扩展、图像清晰、特征明显,是图像增强的重要手段
方式: s 与 r 分别代表处理前后的像素值
- 图像反转: s = L − r − 1 s = L - r -1 s=L−r−1
- 对数变换: s = c ∗ l o g ( 1 + r ) s = c * log(1 + r) s=c∗log(1+r)
- 幂律(伽马)变换: s = c ∗ ( r + ε ) γ ,    ε s = c * (r + \varepsilon)^{\gamma}, \,\, \varepsilon s=c∗(r+ε)γ,ε 为偏移量
- 分段线性变换: 对比度拉伸、灰度级分层、比特平面分层
灰度直方图: 关于灰度级分布的函数,是对图像中灰度级分布的统计
表示图像中具有某种灰度级的像素的个数,反映了图像中某种灰度出现的频率
三条性质:
- 灰度直方图只能反映图像的灰度分布情况,不能反映图像像素的位置
- 一幅图像对应唯一的灰度直方图,但不同图像可对应相同直方图
- 若一幅直方图分成若干区域,则这些区域的直方图之和即为原图像直方图
累计直方图: 图像组成成分在灰度级的累计概率分布情况,每一个概率值代表小于等于此灰度值的概率
幅度的密度函数:
幅度分布函数:
图像幅值信息量(熵): 表征一幅图像含有的信息量有多少
信息量公式: H = − ∑ i = 1 k p i l o g 2 ( p i ) H = - \sum_{i = 1}^k p_i log_2(p_i) H=−∑i=1kpilog2(pi),其中 k 为图像灰度级别个数,p(i) 为各灰度级别出现概率
特点: 当图像中的各个灰度级别出现的概率相等时,图像的熵值最大
图像直方图的特点:
直方图均衡化: 对图像中像素个数多的灰度级进行展宽,而对像素个数少的灰度级进行缩减,从而达到清晰图像的目的
基本原理: 把原始图像的灰度分布直方图变换为均匀分布的形式,扩大像素灰度值的动态范围,从而增强图像对比度
映射函数需要满足的条件:
映射函数单调递增
映射函数值域不超过原始图像灰度的动态范围
例题: 设有 k bit 图像 f 做直方图均衡化后得到图像 g,以 k=8 为例:
求出原图 f 的灰度直方图,设为 h,h 为一个 2 k 2^k 2k 维的向量
求出图像f的总体像素个数 N f = m ∗ n N_f=m*n Nf=m∗n (m,n分别为图像的长和宽)
计算各灰度级像素所占百分比: h s ( i ) = h ( i ) / N f ( i = 0 , 1 , … , 255 ) hs(i)=h(i)/N_f (i=0,1,…,255) hs(i)=h(i)/Nf(i=0,1,…,255)计算图像各灰度级的累计分布 hp: h p ( i ) = ∑ k = 0 i h s ( k ) , i = 1 , 2 , . . , 2 k − 1 hp(i) = \sum_{k = 0}^i hs(k), i = 1,2,..,2^{k - 1} hp(i)=∑k=0ihs(k),i=1,2,..,2k−1
求出新图像 g 的灰度值: g = ( 2 k − 1 ) ∗ h p ( i ) , i = 0 , 1 , . . . , 255 g = (2^k - 1) * hp(i), i = 0,1,...,255 g=(2k−1)∗hp(i),i=0,1,...,255
直方图匹配(规定化): 用于产生处理后有特殊直方图的方法
线性系统性质:
叠加原理: 如果输入信号是两个序列之和,则输出信号也为两个对应的输出信号之和
即:若 y 1 = T [ x 1 ] , y 2 = T [ x 2 ] y_1 = T[x_1],y_2 = T[x_2] y1=T[x1],y2=T[x2],则有 y 1 + y 2 = T [ x 1 ] + T [ x 2 ] = T [ x 1 + x 2 ] y_1+y_2=T[x_1]+T[x_2] = T[x_1 + x_2] y1+y2=T[x1]+T[x2]=T[x1+x2]
齐次原理:如果 y = T[x],则有 a y = T [ a x ] = a T [ x ] ay = T[ax] = aT[x] ay=T[ax]=aT[x]
综上,线性系统对于所有输入信号 x1,x2 以及所有复常数 a、b,皆有 a y 1 + b y 2 = T [ a x 1 + b x 2 ] ay_1 + by_2 = T[ax_1 + bx_2] ay1+by2=T[ax1+bx2]
即,线性系统对于输入信号的加权和的响应等于单个输入信号响应的加权和
移不变系统: 指如果输入序列进行移位,则输出序列进行相应的移位
线性移不变系统: 具有移不变系统的线性系统
卷积
定义: ∫ − ∞ + ∞ h ( t − ι ) f ( ι ) d ι \int_{- \infty}^{+\infty} h(t - \iota) f(\iota) {\rm d} \iota ∫−∞+∞h(t−ι)f(ι)dι
h(t) 是表征线性移不变系统特性的一个函数,叫做冲击响应
冲击响应: 指系统的输入是单位冲击时得到的输出
线性移不变系统的输出可以通过输入信号与该系统的冲击响应的卷积得到
卷积步骤:
图像平滑: 在空域图像平滑处理中,采取邻域累积的方式平滑图像
距离:
掩模:是一个对图像局部进行操作的小矩阵,其数值是系数,不同的掩模往往决定图像处理的效果
掩模,又称为模板,窗口,核,滤波器等
图像平滑处理前后的图像变化: 在消除孤立噪声的同时,模糊了图像的边缘
公式: g ( i , j ) = [ d x 2 ( i , j ) + d y 2 ( i , j ) ] 1 / 2 g(i,j) = [ d_x^2 (i,j) + d_y^2(i,j) ]^{1/2} g(i,j)=[dx2(i,j)+dy2(i,j)]1/2
Sobel 锐化算法:
$d_x = \begin{bmatrix} -1 & 0 & 1 \ -2 & 0 & 2 \ -1 & 0 & 1 \end{bmatrix} $ $d_y = \begin{bmatrix} -1 & -2 & -1 \ 0 & 0 & 0 \ 1 & 2 & 1 \end{bmatrix} $
Priwitt 锐化算法:
d x = [ − 1 0 1 − 1 0 1 − 1 0 1 ] d_x = \begin{bmatrix} -1 & 0 & 1 \\ -1 & 0 & 1 \\ -1 & 0 & 1 \end{bmatrix} dx=⎣⎡−1−1−1000111⎦⎤
d y = [ − 1 − 1 − 1 0 0 0 1 1 1 ] d_y = \begin{bmatrix} -1 & -1 & -1 \\ 0 & 0 & 0 \\ 1 & 1 & 1 \end{bmatrix} dy=⎣⎡−101−101−101⎦⎤
图像锐化与图像平滑的区别与联系:
区别:
图像锐化用于增强图像边缘,导致高频分量增强,会使图像清晰
图像平滑用于消除图像噪声,但也容易引起边缘模糊
联系: 都属于空间图像增强,改善图像效果
积分变换: F ( s ) = T [ f ( t ) ] = ∫ a b k ( s , t ) f ( t ) d t F(s) = T[f(t)] = \int_a^b k(s,t) f(t) dt F(s)=T[f(t)]=∫abk(s,t)f(t)dt 称 F(s) 为 f(t) 的有限积分变换, k(s,t) 是积分变换的核
傅里叶级数三角形式: f T ( t ) = a 0 2 + ∑ n = 1 + ∞ ( a n cos n w 0 t + b n sin n w 0 t ) f_T(t) = \frac{a_0}{2} + \sum_{n=1}^{+ \infty} (a_n \cos nw_0t + b_n\sin nw_0t) fT(t)=2a0+∑n=1+∞(ancosnw0t+bnsinnw0t)
其中: w 0 = 2 π T w_0 = \frac{2 \pi}{T} w0=T2π, a n = 2 T ∫ − T 2 T 2 f T ( t ) cos n w 0 t   d x a_n = \frac 2 T \int_{- \frac T 2}^{\frac T 2} f_T(t) \cos nw_0t \,{\rm d}x an=T2∫−2T2TfT(t)cosnw0tdx, b n = 2 T ∫ − T 2 T 2 f T ( t ) sin n w 0 t   d x b_n = \frac 2 T \int_{- \frac T 2}^{\frac T 2} f_T(t) \sin nw_0t \,{\rm d}x bn=T2∫−2T2TfT(t)sinnw0tdx
cos n w 0 t = 1 2 ( e j n w 0 t + e − j n w 0 t ) \cos nw_0t = \frac 1 2 (e^{j n w_0 t + e^{-j n w_0 t}}) cosnw0t=21(ejnw0t+e−jnw0t) , sin n w 0 t = j 2 ( e − j n w 0 t − e j n w 0 t ) \sin nw_0t = \frac j 2 (e^{-j n w_0 t - e^{j n w_0 t}}) sinnw0t=2j(e−jnw0t−ejnw0t)
傅里叶级数复指数形式: f T ( t ) = ∑ n = − ∞ + ∞ c n e j n w 0 t f_T(t) = \sum_{n = - \infty}^{+\infty} c_n e^{j n w_0 t} fT(t)=∑n=−∞+∞cnejnw0t,其中: c n = 1 T ∫ − T 2 T 2 f T ( t ) e − j n w 0 t d t c_n = \frac1 T \int_{- \frac T 2}^{\frac T 2} f_T(t) e^{-j n w_0 t} dt cn=T1∫−2T2TfT(t)e−jnw0tdt
傅里叶积分公式: f ( t ) = 1 2 π ∫ − ∞ + ∞ [ ∫ − ∞ + ∞ f ( ι ) e − j w ι d ι ] e j w t d w f(t) = \frac 1 {2 \pi} \int_{- \infty}^{+ \infty} [ \int_{- \infty}^{+ \infty} f(\iota) e^{-j w \iota} d \iota ] e^{jwt} dw f(t)=2π1∫−∞+∞[∫−∞+∞f(ι)e−jwιdι]ejwtdw
傅里叶变换对: F ( w ) = ∫ − ∞ + ∞ f ( t ) e − j w t d t F(w) = \int_{- \infty}^{+ \infty} f(t) e^{-j w t} dt F(w)=∫−∞+∞f(t)e−jwtdt 与 f ( t ) = 1 2 π ∫ − ∞ + ∞ F ( w ) e j w t d w f(t) = \frac1 {2 \pi} \int_{- \infty}^{+ \infty} F(w) e^{jwt} dw f(t)=2π1∫−∞+∞F(w)ejwtdw
傅立叶振幅谱: ∣ F ( w ) ∣ = R 2 ( w ) + I 2 ( w ) |F(w)| = \sqrt{R^2(w) + I^2(w)} ∣F(w)∣=R2(w)+I2(w)
傅立叶相位谱: ϕ ( w ) = a r c t g I ( w ) R ( w ) \phi(w) = arctg \frac{I(w)}{R(w)} ϕ(w)=arctgR(w)I(w)
傅立叶能量谱: E ( w ) = ∣ F ( w ) ∣ 2 = ∣ R 2 ( w ) + I 2 ( w ) ∣ E(w) = | F(w) |^2 = | R^2(w) + I^2(w) | E(w)=∣F(w)∣2=∣R2(w)+I2(w)∣
傅里叶性质:
卷积定义: $f_1(t) * f_2(t) = \int_{- \infty}^{+ \infty}f_1(\iota)f_2(t - \iota) d \iota $
卷积定理: ζ [ f 1 ( t ) ∗ f 2 ( t ) ] = F 1 ( w ) F 2 ( w ) \zeta[ f_1(t) * f_2(t) ] = F_1(w) F_2(w) ζ[f1(t)∗f2(t)]=F1(w)F2(w) 与 ζ [ f 1 ( t ) f 2 ( t ) ] = 1 2 π F 1 ( w ) ∗ F 2 ( w ) \zeta[ f_1(t) f_2(t) ] = \frac 1 {2 \pi} F_1(w) * F_2(w) ζ[f1(t)f2(t)]=2π1F1(w)∗F2(w)
频域图像增强的步骤:
通用的频域图像增强方法:①低通滤波;②高通滤波;③带通或带阻滤波;④同态滤波
频域滤波的原理:
按增强的作用域分类:
理想低通滤波 ILPF: H ( u , v ) = { 1 , D ( u , v ) < = D 0 0 , D ( u , v ) > D 0 H(u,v) = \begin{cases} 1, & \text D(u,v) <= D_0 \\ 0, & \text D(u,v) > D_0 \end{cases} H(u,v)={1,0,D(u,v)<=D0D(u,v)>D0,其中 D ( u , v ) = u 2 + v 2 D(u,v) = \sqrt{u^2 + v^2} D(u,v)=u2+v2, D 0 D_0 D0 为截止频率
巴特沃思低通滤波 BLPF: H ( u , v ) = 1 1 + [ D ( u , v ) D 0 ] 2 n H(u,v) = \frac 1 {1 + [ \frac {D(u,v)} {D_0} ] ^{2n}} H(u,v)=1+[D0D(u,v)]2n1
和理想圆形低通滤波器相比:
- 没有明显的跳跃
- 模糊程度减少
指数低通滤波器 ELPF: H ( u , v ) = e l n 1 2 [ D ( u , v ) D 0 ] 2 n H(u,v) = e^{ln \frac 1 {\sqrt2} [ \frac {D(u,v)} {D_0} ] ^{2n} } H(u,v)=eln21[D0D(u,v)]2n
- 有更加平滑的过渡带,平滑后的图象没有跳跃现象
- 与 BLPF 相比,衰减更快,经过 ELPF 滤波的图象比 BLPF 处理的图象更模糊一些
梯形低通滤波器 TLPF: H ( u , v ) = { 1 D ( u , v ) < D 0 D ( u , v ) − D 1 D 0 − D 1 D 0 < = D ( u , v ) < = D 1 0 D ( u , v ) > D 1 H(u,v) = \begin{cases} 1 &\text D(u,v) < D_0 \\ \frac{D(u,v) - D_1}{D_0 - D_1} &\text D_0 <= D(u,v) <= D_1 \\ 0 &\text D(u,v) >D_1 \end{cases} H(u,v)=⎩⎪⎨⎪⎧1D0−D1D(u,v)−D10D(u,v)<D0D0<=D(u,v)<=D1D(u,v)>D1
四种低通滤波器的比较:
类别 | 振动程度 | 图像模糊程度 | 噪声平滑效果 |
---|---|---|---|
ILPF | 严重 | 严重 | 最好 |
TLPF | 较轻 | 轻 | 好 |
ELPF | 无 | 较轻 | 一般 |
BLPF | 无 | 很轻 | 一般 |
理想高通滤波: H ( u , v ) = { 0 , D ( u , v ) < = D 0 1 , D ( u , v ) > D 0 H(u,v) = \begin{cases} 0, & \text D(u,v) <= D_0 \\ 1, & \text D(u,v) > D_0 \end{cases} H(u,v)={0,1,D(u,v)<=D0D(u,v)>D0,其中 D ( u , v ) = u 2 + v 2 D(u,v) = \sqrt{u^2 + v^2} D(u,v)=u2+v2, D 0 D_0 D0 为截止频率
巴特沃思高通滤波: H ( u , v ) = 1 1 + [ D 0 D ( u , v ) ] 2 n H(u,v) = \frac 1 {1 + [ \frac {D_0} {D(u,v)} ] ^{2n}} H(u,v)=1+[D(u,v)D0]2n1 或 H ( u , v ) = 1 1 + ( 2 − 1 ) [ D 0 D ( u , v ) ] 2 n H(u,v) = \frac 1 {1 + (\sqrt2 - 1) [ \frac {D_0} {D(u,v)} ] ^{2n}} H(u,v)=1+(2−1)[D(u,v)D0]2n1
指数高通滤波器: H ( u , v ) = e − [ D 0 D ( u , v ) ] n H(u,v) = e^{- [ \frac {D_0} {D(u,v)} ] ^{n} } H(u,v)=e−[D(u,v)D0]n
- 有更加平滑的过渡带,平滑后的图象没有跳跃现象
- 与 BLPF 相比,衰减更快,经过 ELPF 滤波的图象比 BLPF 处理的图象更模糊一些
梯形高通滤波器: H ( u , v ) = { 1 D ( u , v ) > D 0 D ( u , v ) − D 1 D 0 − D 1 D 1 < = D ( u , v ) < = D 0 0 D ( u , v ) < D 1 H(u,v) = \begin{cases} 1 &\text D(u,v) > D_0 \\ \frac{D(u,v) - D_1}{D_0 - D_1} &\text D_1 <= D(u,v) <= D_0 \\ 0 &\text D(u,v) < D_1 \end{cases} H(u,v)=⎩⎪⎨⎪⎧1D0−D1D(u,v)−D10D(u,v)>D0D1<=D(u,v)<=D0D(u,v)<D1
灰度函数: f ( x , y ) = i ( x , y ) r ( x , y ) f(x,y) = i(x,y) r(x,y) f(x,y)=i(x,y)r(x,y)
i ( x , y ) i(x,y) i(x,y): 入射光,占据低频段
r ( x , y ) r(x,y) r(x,y): 反射光,占据高频段比较宽的范围
取决于物体的特性,物体的亮度特征主要取决于反射光
图像复原: 利用退化过程的先验知识,去恢复已被退化图像的本来面目
图像退化: 图像的质量变坏,退化的形式有图像模糊、图像有干扰等
图像退化原因: 由传感器噪声、摄像机未聚焦、物体与摄像设备之间的相对移动、随机大气湍流、光学系统的相差、成像光源或射线的散射等原因造成
信息熵: 表示图像在被接收之前,信号传输过程中损失的信息量
安全色: 表示安全信息的颜色,常被用作为加强安全和预防事故而设置的标志
图像退化模型:
线性位移不变的图像退化模型:
退化图像表示: g ( x , y ) = h ( x , y ) ∗ f ( x , y ) + η ( x , y ) g(x,y) = h(x,y) * f(x,y) + \eta(x,y) g(x,y)=h(x,y)∗f(x,y)+η(x,y)
频率域表示(傅里叶变换): G ( u , v ) = H ( u , v ) F ( u , v ) + N ( u , v ) G(u,v) = H(u,v)F(u,v) + N(u,v) G(u,v)=H(u,v)F(u,v)+N(u,v)
离散图像退化模型: y ( i , j ) = ∑ k = 1 M ∑ l = 1 N h ( i , j ; k , l ) f ( k , l ) + n ( i , j ) = h ( i , j ) ∗ f ( i , j ) + n ( i , j ) y(i,j) = \sum_{k = 1}^M \sum_{l = 1}^N h(i,j;k,l) f(k,l) + n(i,j) = h(i,j) * f(i,j) + n(i,j) y(i,j)=∑k=1M∑l=1Nh(i,j;k,l)f(k,l)+n(i,j)=h(i,j)∗f(i,j)+n(i,j)
其中: f ( i , j ) f(i,j) f(i,j) 为原始图像, y ( i , j ) y(i,j) y(i,j) 为降质图像, h ( i , j ; k , l ) h(i,j;k,l) h(i,j;k,l) 为点扩散函数,图像为 M × N M \times N M×N 维
去卷积复原图像:
由 g ( x , y ) = f ( x , y ) ∗ h ( x , y ) + n ( x , y ) g(x,y) = f(x,y) * h(x,y) + n(x,y) g(x,y)=f(x,y)∗h(x,y)+n(x,y) 根据卷积定理得 G ( x , y ) = F ( u , v ) × H ( u , v ) + N ( u , v ) G(x,y) = F(u,v) \times H(u,v) + N(u,v) G(x,y)=F(u,v)×H(u,v)+N(u,v)
去卷积的主要问题:
确定引起退化的点扩散函数困难
由于受到噪声影响,图像复原需要考虑病态的干扰
因此常用的基本方法都建立基本假设或忽略次要问题
噪声的概率密度函数(PDF):
高斯噪声: p ( z ) = 1 2 π σ e − ( z − μ ) 2 2 σ 2 p(z) = \frac 1 {\sqrt{2 \pi} \sigma} e^{- \frac {(z - \mu)^2} {2 {\sigma}^2}} p(z)=2πσ1e−2σ2(z−μ)2,其中: σ 2 = b ( 4 − π ) 4 ,    μ = a + b π 4 \sigma ^2 = \frac {b(4 - \pi)} 4,\,\, \mu = a + \sqrt { \frac {b \pi} 4 } σ2=4b(4−π),μ=a+4bπ
瑞利噪声: p ( z ) = { 2 b ( z − a ) e − ( z − a ) 2 b z > = a 0 z < a p(z) = \begin{cases} \frac 2 b (z - a) e^{- \frac {(z - a)^2} b } &\text z >= a \\ 0 &\text z < a \end{cases} p(z)={b2(z−a)e−b(z−a)20z>=az<a
伽马噪声: p ( z ) = { a b z b − 1 ( b − 1 ) ! e − a z z > = 0 0 z < 0 p(z) = \begin{cases} \frac {a^b z^{b-1}}{(b - 1)!} e^{-az} &\text z >= 0 \\ 0 &\text z < 0 \end{cases} p(z)={(b−1)!abzb−1e−az0z>=0z<0,其中: μ = b a ,    σ 2 = b a 2 \mu = \frac b a,\,\, \sigma^2 = \frac b {a^2} μ=ab,σ2=a2b
指数噪声: p ( z ) = { a e − a z z > = 0 0 z < 0 p(z) = \begin{cases} a e^{-az} &\text z >= 0 \\ 0 &\text z < 0 \end{cases} p(z)={ae−az0z>=0z<0,其中: σ 2 = 1 a 2 ,    μ = 1 a \sigma^2 = \frac 1 {a^2}, \,\, \mu = \frac 1 a σ2=a21,μ=a1
均匀噪声: p ( z ) = { 1 b − a a < = z < = b 0 其 他 p(z) = \begin{cases} \frac 1 {b - a} &\text a <= z <= b \\ 0 &\text 其他 \end{cases} p(z)={b−a10a<=z<=b其他,其中: μ = a + b 2 ,    σ 2 = ( b − a ) 2 12 \mu = \frac {a + b} 2,\,\, \sigma^2 = \frac {(b -a)^2} {12} μ=2a+b,σ2=12(b−a)2
脉冲(椒盐)噪声: p ( z ) = { P a z = a P b z = b 0 其 他 p(z) = \begin{cases} P_a &\text z = a \\ P_b &\text z = b \\ 0 &\text 其他 \end{cases} p(z)=⎩⎪⎨⎪⎧PaPb0z=az=b其他
均值滤波器:
顺序统计滤波器:
自适应中值滤波:
Level A
:若 Zmin < Zmed < Zmax
,则转向 Level B
,否则,增加窗口尺寸,若窗口尺寸 ,重复 Level A
,否则输出 Zmed
Level B
: 若 Zmin < Zxy < Zmax
,输出 Zxy
,否则输出 Zmed
周期噪声: 在图像获取过程中由电力或机电干扰产生
- 唯一的一种空间依赖型噪声
- 可通过专用的带阻、带通和陷波滤波器来削减或消除周期性噪声干扰
带阻陷波滤波器: u 0 = v 0 = 0 u_0=v_0=0 u0=v0=0 时,下述三个滤波器都变为高通滤波器
理想陷波带阻滤波器: H ( u , v ) = { 0 D 1 ( u , v ) , D 2 ( u , v ) ≤ D 0 1 其 它 H(u,v) = \begin{cases} 0 &\text D_1(u,v),D_2(u,v) \leq D_0\\ 1 &\text 其它 \end{cases} H(u,v)={01D1(u,v),D2(u,v)≤D0其它
其中: D 1 ( u , v ) , D 2 ( u , v ) = [ ( u − M 2 − u 0 ) 2 + ( v − N 2 − v 0 ) 2 ] 1 2 D_1(u,v),D_2(u,v) = [ (u - \frac M 2 - u_0)^2 + (v - \frac N 2 - v_0)^2 ]^{\frac 1 2} D1(u,v),D2(u,v)=[(u−2M−u0)2+(v−2N−v0)2]21
n 阶巴特沃思陷波带阻滤波器: H ( u , v ) = 1 1 + [ D 0 2 D 1 ( u , v ) D 2 ( u , v ) ] n H(u,v) = \frac 1 {1 + [ \frac {D_0 ^2} {D_1(u,v) D_2(u,v)} ] ^{n}} H(u,v)=1+[D1(u,v)D2(u,v)D02]n1
高斯陷波带阻滤波器: H ( u , v ) = 1 − e − 1 2 [ D 1 ( u , v ) D 2 ( u , v ) D 0 2 ] H(u,v) = 1 - e^{- \frac 1 2 [ \frac{D_1(u,v)D_2(u,v)}{D_0^2} ]} H(u,v)=1−e−21[D02D1(u,v)D2(u,v)]
带通陷波滤波器: u 0 = v 0 = 0 u_0=v_0=0 u0=v0=0 时, 陷波带通滤波器变为低通滤波器
使用目标和背景样品的灰度级,构建一个不模糊的图像 S
为减少噪声的影响,可以寻找强信号区域
运动模糊图像复原
运动模糊假设:
假设图像获取时图像被图像与传感器之间的均匀线性运动模糊了
由于运动是相对的,我们假设图像 f(x,y) 进行平面运动, x 0 ( t ) , y 0 ( t ) x_0(t),y_0(t) x0(t),y0(t) 分别是在 x 和 y 轴上响应的随时间变化的运动参数
则记录介质任意点的曝光总数通过对时间间隔瞬时曝光数积分得到
计算:
如果曝光时间为 T,结果为: g ( x , y ) = ∫ 0 T f [ x − x 0 ( t ) , y − y 0 ( t ) ] d t g(x,y) = \int_0^T f[x - x_0(t),y - y_0(t)] dt g(x,y)=∫0Tf[x−x0(t),y−y0(t)]dt, g(x,y) 为模糊图像
其傅里叶变换为: G ( u , v ) = ∫ − ∞ + ∞ ∫ − ∞ + ∞ [ ∫ 0 T f ( x − x 0 ( t ) , y − y 0 ( t ) ) d t ] e − j 2 π ( u x + v y ) d x d y G(u,v) = \int_{- \infty}^{+ \infty} \int_{- \infty}^{+ \infty} [ \int_0^T f(x - x_0(t),y - y_0(t))dt ]e ^{-j 2 \pi (ux + vy) dx dy} G(u,v)=∫−∞+∞∫−∞+∞[∫0Tf(x−x0(t),y−y0(t))dt]e−j2π(ux+vy)dxdy
问题:恢复出来的结果与预期结果相差很大,甚至面目全非
改进一: M ( u , v ) = { k H ( u , v ) ≤ d 1 H ( u , v ) H ( u , v ) > d M(u,v) = \begin{cases} k &\text H(u,v) \leq d \\ \frac 1 {H(u,v)} &\text H(u,v) > d \end{cases} M(u,v)={kH(u,v)1H(u,v)≤dH(u,v)>d
改进二: M ( u , v ) = { 0 ( u 2 + v 2 ) 1 2 > D 0 1 H ( u , v ) ( u 2 + v 2 ) 1 2 ≤ D 0 M(u,v) = \begin{cases} 0 & \text (u^2 + v^2)^{\frac 1 2} > D_0 \\ \frac 1 {H(u,v)} &\text (u^2 + v^2)^{\frac 1 2} \leq D_0 \end{cases} M(u,v)={0H(u,v)1(u2+v2)21>D0(u2+v2)21≤D0
HSI 模型: 反映了人的视觉对色彩的感觉
H
定义颜色的波长,称为色调
色调 H: 由角度表示,反映了颜色最接近什么样的光谱波长,即光的不同颜色
通常假定 0° 表示的颜色为红色, 120° 的为绿色, 240° 的为蓝色
S
表示颜色的深浅程度,称为饱和度
饱和度 S: 表征颜色的深浅程度,饱和度越高,颜色越深
饱和度参数是色环的原点到彩色点的半径的长度
在环的边界上的颜色饱和度最高,其饱和度值为 1;在中心的饱和度为 0
I
表示强度或亮度
亮度 I: 指光波作用于感受器所发生的效应,其大小由物体反射系数来决定,反射系数越大,物体的亮度愈大,反之愈小
伪彩色处理: 指将黑白图像转化为彩色图像,或者是将单色图像变换成给定彩色分布的图像
主要目的: 为了提高人眼对图像的细节分辨能力,以达到图像增强的目的
由于人眼对彩色的分辨能力远远高于对灰度的分辨能力,所以将灰度图像转化成彩色表示,就可以提高对图像细节的辨别力
基本原理: 将黑白图像或单色图像的各个灰度级匹配到彩色空间中的一点,从而使单色图像映射成彩色图像
实现方法:
A 被 B 膨胀: A ⨁ B = { z ∣ ( B ^ ) z ⋂ A ≠ ϕ }    ⟺    A ⨁ B = { z ∣ ( B ^ ) z ⋂ A ⊆ A } A \bigoplus B = \{ z| (\hat{B})_z \bigcap A \neq \phi \} \iff A \bigoplus B = \{ z| (\hat{B})_z \bigcap A \subseteq A \} A⨁B={z∣(B^)z⋂A̸=ϕ}⟺A⨁B={z∣(B^)z⋂A⊆A},其中 A 和 B 是 Z 2 Z^2 Z2 中的集合
- 定义: B 对 A 的膨胀是以 B 的相对于其自身原点的映射且由 z 对映像进行位移为基础的集合
- 作用: 膨胀可用来修复小的间断点
A 被 B 腐蚀: A Θ B = { z ∣ ( B ) z ⊆ A }    ⟺    A Θ B = { ( B ) z ⋂ A c = ϕ } A \Theta B = \{ z | (B)_z \subseteq A \} \iff A \Theta B = \{ (B)_z \bigcap A^c = \phi \} AΘB={z∣(B)z⊆A}⟺AΘB={(B)z⋂Ac=ϕ}
- 定义: B 对 A 的腐蚀是一个用 z 平移的 B 包含在 A 中的所有点 z 的集合
对偶性: ( A Θ B ) c = A c ⨁ B ^ (A \Theta B)^c = A^c \bigoplus \hat{B} (AΘB)c=Ac⨁B^ 与 ( A ⨁ B ) c = A c Θ B ^ (A \bigoplus B)^c = A^c \Theta \hat{B} (A⨁B)c=AcΘB^
B 对 A 的开操作: A ∘ B = ( A Θ B ) ⨁ B A \circ B = (A \Theta B) \bigoplus B A∘B=(AΘB)⨁B
就是 B 对 A 的腐蚀,然后用 B 对结果进行膨胀
一般会平滑物体的轮廓、断开较窄的狭颈并消除细的突出物
B 对 A 的闭操作: A ⋅ B = ( A ⨁ B ) Θ B A \cdot B = (A \bigoplus B) \Theta B A⋅B=(A⨁B)ΘB
就是 B 对 A 膨胀,然后用 B 对结果进行腐蚀
会平滑物体轮廓、弥合较窄的间断和细长的沟壑、消除小的孔洞、填补轮廓线中的断裂
击中或击不中变换: 可用于形状检测
A ⨂ B = ( A Θ X ) ⋂ [ A c Θ ( W − X ) ] = ( A Θ B 1 ) ⋂ [ A c Θ B 2 ] = ( A Θ B 1 ) − [ A c ⨁ B ^ z ] A \bigotimes B = (A \Theta X) \bigcap [ A^c \Theta (W - X) ] = (A \Theta B_1) \bigcap [ A^c \Theta B_2 ] = (A \Theta B_1) - [A^c \bigoplus \hat{B}_z] A⨂B=(AΘX)⋂[AcΘ(W−X)]=(AΘB1)⋂[AcΘB2]=(AΘB1)−[Ac⨁B^z]
从二值图像中提取连通分量是许多自动图像分析应用中的核心
步骤:
集合 A 的骨架 S(A): S ( A ) = ⋃ k = 1 K S k ( A ) S(A) = \bigcup_{k = 1}^K S_k(A) S(A)=⋃k=1KSk(A),其中 S k ( A ) = ( A Θ k B ) − ( A Θ k B ) ∘ B S_k(A) = (A \Theta kB) - (A \Theta kB) \circ B Sk(A)=(AΘkB)−(AΘkB)∘B
( A Θ k B ) = ( ( . . . ( A Θ B ) Θ B ) . . . ) (A \Theta kB) = ((...(A \Theta B) \Theta B)...) (AΘkB)=((...(AΘB)ΘB)...),K 是 A 被腐蚀为空集前的最后一次迭代步骤: K = m a x { k ∣ ( A Θ k B ) ≠ ϕ } K = max\{k | (A \Theta kB) \neq \phi\} K=max{k∣(AΘkB)̸=ϕ}
图象分割: 指把图象分成各具特性的区域并提取出感兴趣目标的技术和过程
- 图象分割是由图象处理进到图象分析的关键步骤,也是一种基本的计算机视觉技术
- 图象的分割、目标的分离、特征的提取和参数的测量将原始图象转化为更抽象更紧凑的形式,使得更高层的分析和理解成为可能
图像分割目的: 为图像理解和分析作准备
图像特征:
分割方法:
边缘检测: 基于灰度突变来分割图像的常用方法
边缘检测的步骤:
- 为降噪对图像进行平滑处理
- 边缘点的检测
- 边缘定位
LOG 算子: 将 Laplace 算子与高斯低通滤波相结合
步骤:
对图像进行高斯滤波(G × f),再进行Laplace算子运算Δ(G × f)
保留一阶导数峰值的位置,从中寻找 Laplace 零点
对过零点的精确位置进行插值估计
CANNY 算子: 对信噪比与定位乘积进行测度,得到最优化逼近算子
步骤:
- 去噪
- 用一阶偏导的有限差分来计算梯度的幅值和方向
- 对梯度幅值进行非极大值抑制
- 用双阈值算法检测和连接边缘
Sobel 算子:通过 3×3 模板作为核与图像中的每个像素点做卷积和运算,然后选取合适的阈值以提取边缘
梯度模板求边缘总结:
Hough 变换与直线检测: 在直角坐标系和极坐标系中,点、线是对偶关系
即直角坐标系中的点是极坐标系中的线,直角坐标系中的线是极坐标系中的点
把原始图像中给定曲线的检测问题转化为寻找参数空间中的峰值问题
也即把检测整体特性转化为检测局部特性
阈值分割: 以像素特性分布为基础的分割技术
因其处理直观、实现简单、计算速度快,因此阈值处理在图像分割中处于核心地位
门限 T 定义: T = T [ x , y , p ( x , y ) , f ( x , y ) ] T = T[x,y,p(x,y),f(x,y)] T=T[x,y,p(x,y),f(x,y)]
其中: f(x,y) 是点 (x,y) 处的灰度值, p(x,y) 是点 (x,y) 为中心的局部性质
门限 T 数学表示: g ( x , y ) = { 1 f ( x , y ) > T 0 f ( x , y ) ≤ T g(x,y) = \begin{cases} 1 &\text f(x,y) > T \\ 0 &\text f(x,y) \leq T \end{cases} g(x,y)={10f(x,y)>Tf(x,y)≤T
域值法分类:
全局门限: T 仅取决于 f(x,y)
全局域值是一种最简单的域值处理技术,通过判断图像每个象素的灰度值,实现目标与背景区分
这种方法能否成功完全取决于图像直方图能否能较好的分割
全局域值自动分割算法:
选择一个初始化全局估计域值 T
用 T 分割图像,生成两组像素: G1,G2
G1 由灰度值大于 T 的所有像素组成
G2 由灰度值小于等于 T 的像素组成
求 G1,G2 的平均灰度值 u1,u2
计算新门限值(阈值): T = (u1+u2)/2
重复 2到4,直到迭代所得到的 T 值之差小于预定参数 T0 为止
局域门限: T 取决于 f(x,y) 和 p(x,y)
动态\自适应门限: T 还取决于空间坐标 (x,y)
自动确定门限值方法:
均值法: 使用图像所有灰度的均值作为阈值,分割图像
方差法: 按图像的灰度特性,将图像分成背景和目标两部分
方差值越大,说明构成图像的两部分差别越大,当部分目标错分为背景或部分背景错分为目标都会导致两部分差别变小,因此类间方差最大分割的错分概率最小
基于区域的分割: 以直接寻找区域为基础的分割技术
区域生长: 根据预先定义的准则将像素或子区域组合成更大区域的过程,即从一组种子点来生长区域
基本方法: 以一组“种子”点开始将与种子类似的相邻图像附加到区域的每一个种子上
注意的问题:
区域的分裂与聚合: 先将一幅图像细分为一组任意的不相交区域,然后聚合和/或分裂这些区域
图像表示分类:
边界分段: 将边界分成若干段,然后分别对每一段进行表示,从而降低边界的复杂度,并简化表示过程
基本步骤:
- 构造边界的凸包
- 跟踪区域凸包的边界,记录凸包边界进出区域的转变点即可实现对边界的分割
多边形近似: 因为多边形的边用线性关系表示,所以多边形的计算比较简单,有利于得到一个区域的近似值
- 多边形近似比链码、边界分段更具有抗噪声干扰的能力
- 对封闭曲线而言,当多边形的线段数与边界上点数相等时,多边形可以完全准确的表达边界
- 但在实际应用中,多边形近似的目的是用最少的线段来表示边界,并且能够表达原边界的本质形状
标记图: 将原始的二维边界用一个一维函数来表示,从而降低表达难度
最小周长多边形法:以周长最小的多边形来近似表示边界,适用于无自交情况的多边形
将边界看成是介于多边形内外界限之间的有弹性的线,当它在内外迹象的限制之下收缩紧绷时,就可以得到最小周长边界
算法详解:
- 在获取边界之后,先查找边界的拐角点,并且标记该拐角点是凸点还是凹点
- 然后将所有的凸拐点连接起来作为初始的最小周长多边形 P0
- 接着把所有在多边形 P0 之外的凹拐点移除
- 再将剩余的凹拐点和所有凸拐点依次连接,形成新的多边形 P1
- 然后移除所有原为凸点而在新多边形中变成凹点的拐点
- 再用剩余的点连接形成新多边形,再次移除
- 如此循环,直至新形成的多边形中没有凹点
边界周长: 边界所包围的区域的轮廓的周长
- 4-连通边界:其长度为边界上像素点个数
- 8-连通边界:其长度为对角码个数乘上水平和垂直像素点的个数的和
边界直径: 边界上任意两点距离的最大值
傅里叶描绘子:
统计矩: 用 1-D 函数描述边界曲线,易于实现并且具有对边界形状的物理意义
μ n = ∑ i = 0 ( K − 1 ) ( r i − m ) n g ( r i ) \mu _n = \sum_{i = 0}^{(K - 1)} (r_i - m)^n g(r_i) μn=∑i=0(K−1)(ri−m)ng(ri),其中: m = ∑ i = 0 K − 1 r i g ( r i ) m = \sum_{i = 0}^{K - 1} r_i g(r_i) m=∑i=0K−1rig(ri)
纹理: 反映像素灰度的空间分布属性的图像特征通常变现为局部不规则但宏观有规律性
纹理描述方法:
统计法: 基于图像的灰度直方图的统计矩来描述纹理
即通过统计图像的空间频率、边界频率、空间灰度依赖关系等来分析纹理
结构描述法: 把复杂纹理拆分为许多简单纹理单元,并将这些基本纹理单元按照某一规律重复排列组合成复杂纹理
使用形式语言对纹理的排列规则进行描述
但需要计算出纹理基元的偏心度、面积、方向、矩、延伸度等特征
并需要应用模式识别和编译原理中的句法理论
频谱法: 利用信号处理方法,主要借助傅里叶变换将空间域的纹理图像变换到频率域中,通过计算峰值处的面积、峰值与原点距离的平方、峰值处的相位、两个峰值间的相角差等来获得纹理特征
傅里叶频谱的三个特征:
- 频谱中突出的尖峰给出纹理模式的主要方向
- 频率平面中尖峰位置给出模式的基本空间周期
- 采用滤波方法消除任何周期分量而留下非周期性元素,然后采用统计技术来描述
灰度共生矩阵: 令 Q 是定义两个像素彼此相对位置的一个算子,并考虑一幅具有 L 个可能灰度级的图像 f;令 G 为一个矩阵,其元素 g i j g_{ij} gij 是灰度为 z i z_i zi 和 z j z_j zj 的像素对出现在 f 中由 Q 所指定的位置处的次数
不仅考虑强度分布,还考虑相同强度或近似强度值的像素位置
刻画共生矩阵特性的描绘子:
P537 图11.29
不变矩:
二维 (p + q) 阶矩: m p q = ∑ x = 0 M − 1 ∑ y = 0 N − 1 x p y q f ( x , y ) m_{pq} = \sum_{x = 0}^{M - 1} \sum_{y = 0}^{N - 1} x^p y^q f(x,y) mpq=∑x=0M−1∑y=0N−1xpyqf(x,y)
对应 (p + q) 阶中心距: μ p q = ∑ x = 0 M − 1 ∑ y = 0 N − 1 ( x − x ^ ) p ( y − y ^ ) q f ( x , y ) \mu _{pq} = \sum_{x = 0}^{M - 1} \sum_{y = 0}^{N - 1} (x - \hat{x})^p (y - \hat{y})^q f(x,y) μpq=∑x=0M−1∑y=0N−1(x−x^)p(y−y^)qf(x,y) ,其中: x ^ = m 10 m 00 \hat{x} = \frac{m_{10}}{m_{00}} x^=m00m10 与 y ^ = m 01 m 00 \hat{y} = \frac{m_{01}}{m_{00}} y^=m00m01
归一化中心距: η p q = μ p q μ 00 γ \eta_{pq} = \frac {\mu _{pq}}{\mu ^{\gamma}_{00}} ηpq=μ00γμpq,其中: γ = p + q 2 + 1 \gamma = \frac {p + q} 2 + 1 γ=2p+q+1
Anaconda 的安装与虚拟环境的搭建:
exit()
推出 python 环境pip install numpy
安装 numpy安装 OpenCV-python:
<安装目录>/Anaconda/Scripts
D:\OpenCV
conda create -n OpenCV
创建自己的以 OpenCV 命名的 python 虚拟环境activate opencv
来激活 opencv 虚拟环境pip install opencv-python
来安装 python-OpenCVpython
并回车,进入 python 交互环境import cv2
print(cv2.__version__)
打印 python-opencv 版本##4. 基于OpenCV的灰度直方图均衡化与规定化
典型车牌识别系统的步骤: