VDSR:基于深度卷积神经网络的实现精确图像超分辨率重建(2016)

Abstract

我们提出一个高精确度的单张图像超分辨率重建方法。我们的方法由VGG-net启发,我们发现,网络的深度对于超分精确度有着十分重要的的影响,我们最终的网路有20层。通过这么多小尺寸的卷积层,有效的利用了图像中的上下文信息,面对深度网络难以训练的问题,我们使用大的学习率梯度剪裁来解决这个问题。最后,实验证明我们提出的方法十分有效。

Intoduction

超分辨重建十分常用,广泛用于安全、监视、医疗等需要图像细节的领域。
在计算机视觉领域已经提出了很多的方法了,早期的方法比如bicubic插值、Lanczos resampling、基于utilizing statistical image priors、基于internal patch recurrence。
当前,最流行的时学习LR到HR之间映射关系的基于学习的方法。比如,Neighbor embedding、Sparse coding、random forest、convolutional neural network。
在这些当中,SRCNN开启了基于深度学习的超分方法。然而我们发现,这种方法有如下几个方面的局限:

  • 算法依赖于小范围的图像区域
  • 算法的训练很慢
  • 算法只能针对单张图像做超分
    本文针对这个问题,提出了新的解决方法。

Context

我们提出的网络能过捕获到大图像区域。对于大尺度的超分,需要更宽的感受野来提供足够的细节信息,所以需要十分深的网路。

Convergence

使用大学习率、残差学习。LR与HR在很大程度上是十分相识的,所以残差学习十分有用,同时在输入与输出相似度很大时,大的学习率对于网路的收敛十分有效。

Scale Factor

我们的网络是Scale free的,尺度有用户定义。

Contributon

本文提出了一个十分深的卷积网路来实现超分辨率重建,这个方法十分有效,测试结果如图:
VDSR:基于深度卷积神经网络的实现精确图像超分辨率重建(2016)_第1张图片

Related work

这里作者纠正了SRCNN文中的错误观点:深度网络对超分无用

Proposed Method

VDSR:基于深度卷积神经网络的实现精确图像超分辨率重建(2016)_第2张图片

  • 除了第一层和最后一层,其他层的参数是:3X3X64
  • 都知道,卷积操作会使得输入图像变小,这里,作者用零填充,使得经过每层网络后输入尺寸与输出尺寸相同。
  • 在网络的最后会让网络学习的细节信息与输入图像融合,最终得到HR图像。
  • 网络的loss有点不同
    先 构 建 残 差 图 片 r = y − x , x 是 L R 图 片 , y 是 H R 图 片 , 先构建残差图片r=y-x,x是LR图片,y是HR图片, r=yx,xLRyHR,
    l o s s = 1 2 ∣ ∣ r − f ( x ) ∣ ∣ 2 loss=\frac {1} {2}||r-f(x)||^2 loss=21rf(x)2

你可能感兴趣的:(机器学习,超分辨率重建,深度学习)