a) 从空间频域来看,人眼是一个低通线性系统
b) 人眼对亮度的响应具有对数非线性性质
c) 人类对亮度信号的空间分辨率大于对色度信号的空间分辨率
d) 人眼视觉系统对信号进行加权求和运算,相当于使信号通过一个带通滤波器。
e) 图像的边缘信息对视觉很重要,特别是边缘的位置信息,人眼容易感觉到边缘的位置变化,而对边缘的灰度误差并不敏感
f) 人眼的视觉掩盖效应是一种局部效应,受背景照度、纹理复杂性和信号频率的影响,具有不同局部特性的区域,在保证不被人眼察觉的前提下,允许改变的信号强度不同
图像质量评价(IQA),根据参考图片(reference image),即原始图片的存在与否,可分为:
a) 全参考(full-reference)方法
b) 半参考(reduced-reference)方法
c) 无参考(no-reference)方法
其中,FR方法研究比较成熟,相关方法较多。RR方法只有原始图片的部分信息,相关方法不是很有效,NR方法目前还处于研究中,因此我们这里只对FR方法进行介绍
图像融合评价指标: 信息熵(IE)、标准差(STD)、对比度(CON)、空间频率(SF)、平均梯度(AG)及 Piella 基于结构相似性的两个指标 QW与 QE等。
定义:(正向指标,反向指标) 记 I1 与 I2 为任意两幅同源融合图像, O1 与 O2 为指标 M 给出的 I1 与 I2 的客观评价结果. 当 I1 的主观评价结果优于 I2 时, 若 O1 > O2, 则称指标 M 为正向指标; 否则, 称 M 为反向指标. 如无特殊说明, 均为正向指标.
在信息论中,熵(英语:entropy)是接收的每条消息中包含的信息的平均量,又被称为信息熵、信源熵、平均自信息量。
计算公式:
H ( X ) = ∑ i P ( x i ) I ( x i ) = − ∑ i P ( x i ) log b P ( x i ) H(X)=\sum \limits_{i}P(x_i)I(x_i)=-\sum \limits_{i}P(x_i)\log_bP(x_i) H(X)=i∑P(xi)I(xi)=−i∑P(xi)logbP(xi)
标准差(又称标准偏差、均方差,英语:Standard Deviation,缩写SD),数学符号σ(sigma),在概率统计中最常使用作为测量一组数值的离散程度之用。标准差定义:为方差开算术平方根,反映组内个体间的离散程度;标准差与期望值之比为标准离差率。
计算公式:
S D = 1 N ∑ i = 1 N ( x i − μ ) 2 μ 为 平 均 值 ( x ˉ ) SD=\sqrt{\frac{1}{N}\sum\limits_{i=1}^N(x_i-\mu)^2} \qquad \mu为平均值(\bar{x}) SD=N1i=1∑N(xi−μ)2μ为平均值(xˉ)
对比度是画面黑与白的比值,也就是从黑到白的渐变层次。比值越大,从黑到白的渐变层次就越多,从而色彩表现越丰富。对比度对视觉效果的影响非常关键,一般来说对比度越大,图像越清晰醒目,色彩也越鲜明艳丽;而对比度小,则会让整个画面都灰蒙蒙的。
计算公式:
C = ∑ δ δ ( i , j ) 2 P δ ( i , j ) C=\sum\limits_{\delta}\delta(i,j)^2P_{\delta}(i,j) C=δ∑δ(i,j)2Pδ(i,j)
其中, δ ( i , j ) = ∣ i − j ∣ \delta(i,j)=|i-j| δ(i,j)=∣i−j∣,即相邻像素间灰度差; P δ ( i , j ) P_{\delta}(i,j) Pδ(i,j)为相邻像素间灰度差为 δ \delta δ的像素分布概率。
空间频率(spatial frequency),空间频率反映的是图像灰度的变化率.
其计算公式为 :
S F ( F ) = R F 2 + C F 2 SF(F)=\sqrt{RF^2+CF^2} SF(F)=RF2+CF2
其中,RF 和 CF 分别为图像的行频率和列频率,如下:
R F = 1 m n ∑ i = 1 M − 1 ∑ j = 1 N − 1 ( F ( i , j ) − F ( i , j + 1 ) ) 2 RF=\sqrt{\frac{1}{mn}\sum_{i=1}^{M-1}\sum_{j=1}^{N-1}(F(i,j)-F(i,j+1))^2} RF=mn1i=1∑M−1j=1∑N−1(F(i,j)−F(i,j+1))2
C F = 1 m n ∑ i = 1 M − 1 ∑ j = 1 N − 1 ( F ( i , j ) − F ( i + 1 , j ) ) 2 CF=\sqrt{\frac{1}{mn}\sum_{i=1}^{M-1}\sum_{j=1}^{N-1}(F(i,j)-F(i+1,j))^2} CF=mn1i=1∑M−1j=1∑N−1(F(i,j)−F(i+1,j))2
空间频率可用于反映图像的清晰度. 一般地, 图像越清晰, 空间频率越高.
点(m,n)处的梯度定义为:
S ( m , n ) = G x ( m , n ) 2 + G y ( m , n ) 2 S(m,n)=\sqrt{G_x(m,n)^2+G_y(m,n)^2} S(m,n)=Gx(m,n)2+Gy(m,n)2
清晰度评价准则定义:
D e f i n i t i o n _ m e t r i c = ∑ m M ∑ n N ( S ( m , n ) − S ˉ ) 2 Definition\_metric=\sum_m^M\sum_n^N(S(m,n)-\bar S)^2 Definition_metric=m∑Mn∑N(S(m,n)−Sˉ)2
其中, G x G_x Gx 和 G y G_y Gy 分别代表使用 Sobel 梯度算子求得的 x x x 和 y y y 方向的图像梯度, S ˉ \bar S Sˉ 代表梯度图像 S S S 的平均梯度。清晰度评价准则值越大表示图像越清晰,反之,图像越模糊。
主要用于度量两个概率分布间的差异性信息。
H ( p , q ) = ∑ i p ( i ) ⋅ log ( 1 q ( i ) ) H(p,q)=\sum_i p(i)\cdot \log (\frac{1}{q(i)}) H(p,q)=i∑p(i)⋅log(q(i)1)
交叉熵可在神经网络(机器学习)中作为损失函数,p表示真实标记的分布,q则为训练后的模型的预测标记分布,交叉熵损失函数可以衡量p与q的相似性。交叉熵作为损失函数还有一个好处是使用sigmoid函数在梯度下降时能避免均方误差损失函数学习速率降低的问题,因为学习速率可以被输出的误差所控制。
FR方法需要同时用到原始图片和失真图片,对二者的特征进行相似性比较。一般来说,FR-IQA包括两类方法,一种是传统的自底向上方法,这类方法基于HVS的某些视觉通路,如掩盖效应,对比灵敏度,最小可视差等,由于HVS的复杂性和认知的有限性,这类自底向上的方法通常很难与主观感知保持一致;比较经典的自底向上方法有MSE/PSNR。另一种是自顶向下的方法。这类方法对HVS的整体函数进行建模,利用了图像的全局信息,与主观感知的一致性要高于前一类方法。这类方法比较经典的算法包括,SSIM,MDSI以及GMSD
HVS能高度自适应提取场景中的结构信息,它分别从亮度、对比度、结构三方面度量图像相似性。
亮度:
μ x = 1 N ∑ i = 1 N x i \mu_x=\frac{1}{N}\sum_{i=1}^N x_i μx=N1i=1∑Nxi
σ x = ( 1 N − 1 ∑ i = 1 N ( x i − μ x ) 2 ) 1 2 \sigma_x=\left( \frac{1}{N-1}\sum_{i=1}^N(x_i-\mu_x)^2 \right)^{\frac{1}{2}} σx=(N−11i=1∑N(xi−μx)2)21
亮度相似性:
l ( X , Y ) = 2 μ x μ y + C 1 μ x 2 + μ y 2 + C 1 l(X,Y)=\frac{2\mu_x\mu_y+C_1}{\mu_x^2+\mu_y^2+C_1} l(X,Y)=μx2+μy2+C12μxμy+C1
对比度相似性:
c ( X , Y ) = 2 σ x σ y + C 2 σ x 2 + σ y 2 + C 2 c(X,Y)=\frac{2\sigma_x\sigma_y+C_2}{\sigma_x^2+\sigma_y^2+C_2} c(X,Y)=σx2+σy2+C22σxσy+C2
计算得:
S S I M ( X , Y ) = [ l ( X , y ) ] α ⋅ [ c ( X , Y ) ] β ⋅ [ s ( X , Y ) ] γ SSIM(X,Y)=[l(X,y)]^\alpha\cdot [c(X,Y)]^\beta\cdot[s(X,Y)]^\gamma SSIM(X,Y)=[l(X,y)]α⋅[c(X,Y)]β⋅[s(X,Y)]γ
其中, C 1 , C 2 , C 3 C1,C2, C3 C1,C2,C3为常数,用于防止分母为零。SSIM取值范围[0,1],值越大,表示图像失真越小.
在结构相似理论的基础上, Piella 提出了三个融合质量评价指标 Q Q Q, Q W Q_W QW和 Q E Q_E QE. Q Q Q 的计算思想是: 首先, 使用滑动窗口对融合图像和源图像进行切割. 然后, 分别对每个子图计算结构相似性.
Q ( A , B , F ) = 1 ∣ W ∣ ∑ w ∈ W ( λ A ( w ) S S I M ( A , F ∣ w ) ) + λ B ( w ) S S I M ( B , F ∣ w ) Q(A,B,F)=\frac{1}{|W|}\sum_{w \in W}(\lambda_A(w)SSIM(A,F|w))+\lambda_B(w)SSIM(B,F|w) Q(A,B,F)=∣W∣1w∈W∑(λA(w)SSIM(A,F∣w))+λB(w)SSIM(B,F∣w)
式中,$ SSIM(A,F|w)$ 是融合图像 F F F 与源图像 A 在w 处的子图块 (大小为$ block_size×block_size ) 结 构 相 似 度 . ‚ ) 结构相似度. ‚ )结构相似度.‚\lambda_A(w) =\frac{ s(A|w)}{ s(A|w)+s(B|w)}$ , s ( A ∣ w ) s(A|w) s(A∣w) 和 s ( B ∣ w ) s(B|w) s(B∣w)分别为图像 A A A 与 B B B 在窗口 w w w 处的显著性.
考虑到每个图像块的重要程度存在差异, 如果按重要程度设置图像块质量在质量评价中的比重,可以进一步改善评估效果. 因此, Piella 等提出一种加权质量评估指标.
Q W ( A , B , F ) = ∑ w ∈ W c ( w ) ( λ A ( w ) S S I M ( A , F ∣ w ) ) + λ B ( w ) S S I M ( B , F ∣ w ) Q_W(A,B,F)=\sum_{w \in W}c(w)(\lambda_A(w)SSIM(A,F|w))+\lambda_B(w)SSIM(B,F|w) QW(A,B,F)=w∈W∑c(w)(λA(w)SSIM(A,F∣w))+λB(w)SSIM(B,F∣w)
$c(w) $是 w w w 处的图像块在整个图像中的重要程度:$ c(w) =C(w)/\sum_{w’\in W}C(w’)$, 这里, C ( w ) = max ( s ( A ∣ w ) , s ( B ∣ w ) ) C(w) = \max(s(A|w),s(B|w)) C(w)=max(s(A∣w),s(B∣w)).
图像质量优劣与边缘的完整度、 清晰度等密切相关,HVS 对图像边缘敏感度最高. 因此,Piella 在求出 Q W Q_W QW 之后,分别对源图像和融合图像进行边缘检测,再将边缘图像带入上式 中求其加权相似度,最后综合两个 Q W Q_W QW , 得到基于边缘的结构相似指标:
Q E ( A , B , F ) = Q W ( A , B , F ) 1 − α ⋅ Q W ( A ′ , B ′ , F ′ ) α Q_E(A,B,F)=Q_W(A,B,F)^{1-\alpha}\cdot Q_W(A',B',F')^\alpha QE(A,B,F)=QW(A,B,F)1−α⋅QW(A′,B′,F′)α
S S I M SSIM SSIM 参考链接
对于图像 A、B 和 F,互信息的数学表达式为:
M I = J E A , F + J E B , F I E A + I E B J E A , F = ∑ i = 0 L − 1 ∑ j = 0 L − 1 P A , F ( i , k ) log P A , F ( i , k ) / ( P A ( i ) × P F ( k ) ) MI=\frac{JE_{A,F}+JE_{B,F}}{IE_A+IE_B} \\ JE_{A,F}=\sum_{i=0}^{L-1}\sum_{j=0}^{L-1}P_{A,F}(i,k)\log P_{A,F}(i,k)/(P_A(i)×P_F(k)) MI=IEA+IEBJEA,F+JEB,FJEA,F=i=0∑L−1j=0∑L−1PA,F(i,k)logPA,F(i,k)/(PA(i)×PF(k))
J E A , F JE_{A,F} JEA,F表示 A A A与 F F F之间的联合熵, I E IE IE为图像的信息熵,$P_{A,F}(i,k) 和 和 和 P_{B,F}(j,k)$ 分别为 A A A与 F F F、 B B B与 F F F之间的归一化联合直方图。 M I MI MI越大代表融合图像包含源图像的信息越多。
MSE:反向指标,PSNR:正向指标
峰值信噪比(英语:Peak signal-to-noise ratio,常缩写为PSNR)是一个表示信号最大可能功率和影响它的表示精度的破坏性噪声功率的比值的工程术语。由于许多信号都有非常宽的动态范围,峰值信噪比常用对数分贝单位来表示。
峰值信噪比经常用作图像压缩等领域中信号重建质量的测量方法,它常简单地通过均方误差(MSE)进行定义。两个m×n单色图像I和K,如果一个为另外一个的噪声近似,那么它们的的均方误差定义为:
M S E = 1 m n ∑ i = 0 m − 1 ∑ j = 0 n − 1 [ I ( i , j ) − K ( i , j ) ] 2 MSE=\frac{1}{mn}\sum \limits_{i=0}^{m-1}\sum \limits_{j=0}^{n-1}[I(i,j)-K(i,j)]^2 MSE=mn1i=0∑m−1j=0∑n−1[I(i,j)−K(i,j)]2
在图像融合质量评价过程中, 通常没有参考图像, 所以用源图像代替参考图像.
峰值信噪比定义为:
P S N R = 10 ⋅ log 10 ( M A X I 2 M S E ) = 20 ⋅ log 10 ( M A X I M S E ) = 10 ⋅ lg 255 M S E PSNR=10\cdot \log_{10}(\frac{MAX_I^2}{MSE})=20\cdot\log_{10}(\frac{MAX_I}{\sqrt{MSE}})=10\cdot \lg \frac{255}{\sqrt{MSE}} PSNR=10⋅log10(MSEMAXI2)=20⋅log10(MSEMAXI)=10⋅lgMSE255
src = double(imread('src.bmp'));
dst = double(imread('dst.bmp'));
diff_img = src - dst;
diff_img_x = diff_img(:,:,1);
diff_img_y = diff_img(:,:,2);
diff_img_z = diff_img(:,:,3);
diff_square = (diff_img_x.^2 + diff_img_y.^2 + diff_img_z.^2);
diff_mean = mean(mean(diff_square));
val = 255;
psnr = 10*log10((val^2)/diff_mean);
[1] 张小利, 李雄飞, 李军. 融合图像质量评价指标的相关性分析及性能评估[J]. 自动化学报, 2014, 40(2):306-315.
[2] Lin Zhang. Research on Image Quality Assessment[EB/OL]. 2014[11/12 2018]. http://sse.tongji.edu.cn/linzhang/IQA/IQA.htm.