图像质量评价标准简介

1. 人类视觉系统（HVS）

a) 从空间频域来看，人眼是一个低通线性系统

b) 人眼对亮度的响应具有对数非线性性质

c) 人类对亮度信号的空间分辨率大于对色度信号的空间分辨率

d) 人眼视觉系统对信号进行加权求和运算，相当于使信号通过一个带通滤波器。

e) 图像的边缘信息对视觉很重要，特别是边缘的位置信息，人眼容易感觉到边缘的位置变化，而对边缘的灰度误差并不敏感

f) 人眼的视觉掩盖效应是一种局部效应，受背景照度、纹理复杂性和信号频率的影响，具有不同局部特性的区域，在保证不被人眼察觉的前提下，允许改变的信号强度不同

2. 分类

图像质量评价（IQA），根据参考图片（reference image），即原始图片的存在与否，可分为：

a) 全参考（full-reference）方法

b) 半参考（reduced-reference）方法

c) 无参考（no-reference）方法

其中，FR方法研究比较成熟，相关方法较多。RR方法只有原始图片的部分信息，相关方法不是很有效，NR方法目前还处于研究中，因此我们这里只对FR方法进行介绍

3. FR方法

FR方法需要同时用到原始图片和失真图片，对二者的特征进行相似性比较。一般来说，FR-IQA包括两类方法，一种是传统的自底向上方法，这类方法基于HVS的某些视觉通路，如掩盖效应，对比灵敏度，最小可视差等，由于HVS的复杂性和认知的有限性，这类自底向上的方法通常很难与主观感知保持一致；比较经典的自底向上方法有MSE/PSNR。另一种是自顶向下的方法。这类方法对HVS的整体函数进行建模，利用了图像的全局信息，与主观感知的一致性要高于前一类方法。这类方法比较经典的算法包括，SSIM，MDSI以及GMSD

4. 算法介绍

a) MSE/PSNR

其中，MAX是表示图像颜色的最大数值，对于8bit的灰度图，MAX为255。MSE是失真图像K与原始图像I像素值的均方误差。PSNR的单位是dB，数值越大表示失真越小。

PSNR是最普遍和使用最为广泛的一种图像客观评价指标，然而它是基于对应像素点间的误差，即基于误差敏感的图像质量评价。由于并未考虑到人眼的视觉特性（人眼对空间频率较低的对比差异敏感度较高，人眼对亮度对比差异的敏感度较色度高，人眼对一个区域的感知结果会受到其周围邻近区域的影响等），因而经常出现评价结果与人的主观感觉不一致的情况。

下图：失真图像的MSE都是一样的，也就是说它们的PSNR值是一样的，但是从人眼的角度来看，明显失真程度是不一样的。

b) 自顶向下方法的基本过程

对于一般的自顶向下方法，其工作过程大致可以分为两个阶段：首先，对参考图像和失真图像的局部特征进行相似性比较，得到图像的local quality map(LQM)，可用的特征有亮度，对比度，图像梯度等；之后对LQM使用一定的pooling strategy，得到一个全局的分数。常用的pooling方法有，average pooling，weighted pooling，Minkowski pooling等。其工作过程如下图所示：