图像质量评价(IQA)Optimizing Multistage Discriminative Dictionaries for Blind Image Quality Assessment

2018 TRANSACTION ON MULTIMEDIA的一篇文章,没有用到深度学习,是基于BoW的一种特征提取模型。高等代数的知识记得不牢固了,文章看的一知半解,等过段时间复习下数学知识再补充些理解。

文章主要解决的问题是现有的codebook构建方法存在两个问题,一个是codebook维数比较大,占用内存多且会引起过拟合的问题,二是现有的构造方法采用无监督的方法,样本质量信息的缺失造成结果非最优。模型的整体结构如下:

模型结构

模型可以分为两个部分,第一部分是MSDD的搭建,第二部分是根据MSDD进行质量评估。

MSDDL部分:1)首先把图片切成patch(p),然后转化为灰度图。2)每个patch根据FSIM算子求出质量分数(s)3)根据s值的不同,把p分成k组,处于i组的patch对应一个q值为:


quality-discriminative code

y和q作为输入,优化函数如下进行LC-KSVD:


optimization

4)Multistage体现在每次svd计算出来的结果,与输入y计算求得一个残差图,该残差图作为下一级的输入,直到达到的预设的N次,流程如下:


MSDDL

这样我们得到一个codebook。

MSFE:根据得到的codebook(D)求得特征值X,迭代过程和上述一致:


optimization


Multi-stage feature encoding

最后根据得到的特征值经过池化(均值)和回归(支持向量机),得到最终的结果。

本文主要的创新在于一个多次运用SVD求取特征值,采用残差作为下一层输入,可以看作提取更深度的信息。

你可能感兴趣的:(图像质量评价(IQA)Optimizing Multistage Discriminative Dictionaries for Blind Image Quality Assessment)