图像增强(image enhancement)Aesthetic-Driven Image Enhancement by Adversarial Learning

2018MM的一篇论文,这篇论文针对的是美学驱动的图像增强方式,但是主要工作是通过gan网络学习超参数,可以很容易的借鉴到其他领域。


The architecture of our proposed Enhance GAN framework 

生成网络是标准的ResNet-101,去掉了最后的池化层和全连接层,最后的输出为2048个future map,这2048个future为之后生成超参数做准备。文中提到了三种后序操作:

Piecewise Color Enhancer :图片转换为CIE颜色空间,在这种空间下,图片的亮度体现在一个通道,色度体现在另外两个通道,针对亮度和色度信息进行gamma转换,提升图片美学质量,变换如下:

亮度转换

类似的,根据LAB图像变换准则调整色度信息,如下所示:


色度转换

观察上边的两个方程组,共有a,b,p,q,α,β六个超参数,下面根据2048个future map学习这六个超参数。2048个future map通过卷积核为1*1的卷积层后变成7个卷积层,前六个卷积层对应六个超参数的候选值,最后一个卷积层对应上述候选值的不同排列的概率。Top-K池化层选取可能性最大的k种排列,对这k种排列根据概率做加权平均得到最终超参数的取值。

Deep Filtering-based Enhancer:上述方法性能具有局限性,可以通过将不同的增强方法线性组合,共同使用来提高性能。这个时候需要学习的是不同方法组合时候的权重因子,比如说采用了n种增强方法,那么就需要把2048个future map转变为n+1个future map,前n个对应n种方法的权重,最后一个对应各种权重不同排列的概率。后序操作上述一致。

Image Cropping Operator:需要学习的超参数是[x,y,w,h]思路与上边类似。

结构图很清楚的展示了上述三个应用的过程,最后的损失函数采用对抗损失和perceptual loss。


experiment

实验细节不说了,根据上图文中给出的结果,图片的质量提升还是很明显的。这种学习超参数的方法以后可以借鉴用到自己的工作中。

你可能感兴趣的:(图像增强(image enhancement)Aesthetic-Driven Image Enhancement by Adversarial Learning)