Deep Multi-scale Convolutional Neural Network for Dynamic Scene Deblurring(2017CVPR) 阅读笔记

  • Deep Multi-scale Convolutional Neural Network for Dynamic Scene
    Deblurring 深度多因子卷积神经网络应用于动态场景去模糊 。其实就是【CNN用于运动图像去模糊】
  • 原文链接:https://arxiv.org/pdf/1612.02177.pdf
  • 作者发布的用于运动去模糊的训练数据集 GOPRO
    dataset(现已经成为基于深度学习的去模糊算法最常用的数据集之一)下载地址:https://github.com/SeungjunNah/DeepDeblur_release

一、Introduction

传统方法都是依据以下式子做去模糊:
在这里插入图片描述

B:blurred image  (Known)
S:sharp image     (Unknow)
K:blur kernel     (Unknow)
n:addictive noise(Known)
  • K是作用在S上的模糊卷积核,是模糊的成因(例如在按下快门的一瞬间,你手抖了,或者说失去焦点,就会很容易造成呈像模糊)。
  • 对于盲去模糊,【盲】的意思就是【无标签,无sharp image,无S】,另外在去模糊问题本身,K一直都是未知的,人们只能【假想出/假设出/模拟出】近似的K,然后通过在B上进行【退卷积】操作得到S:
    在这里插入图片描述
    这里的Kassume就是估计/假设出来的模糊卷积核,定义∝为退卷积操作。
  • 传统方法是以上那样子做的,但是有以下缺点:
    1) 难以获得实测清晰图像和模糊图像对用于训练图像去模糊网络;
    2) 对于动态场景的图像去模糊问题,难以正确估计/假设出【Kassume模糊核】;
    3) 去模糊问题需要较大的感受野。
    故下面【本文工作】来了!

二、本文工作

  • 弄了一个专门为运动去模糊创造的数据集,内含【sharp】和【blurred】两个文件夹,就是一对对的sharp和blurred图像,blurrd图像是通过对sharp图像进行一系列变换,得到的(作者用了参考文献17的方法,具体我没细看)

  • 弄了一个【多尺度CNN模型】,对B进行端到端的学习,直接得到S,而不学习Kassume,得到的结果就没有那种因为模糊核估计错误而产生的【伪像】。另外该网络的设计其实是模仿传统方法的【由粗到细】优化方法(下面会说)。
    网络结构如下:Deep Multi-scale Convolutional Neural Network for Dynamic Scene Deblurring(2017CVPR) 阅读笔记_第1张图片

  • 作者通过三个多尺度的卷积神经网络,其中B1为待复原图像,分别降采样两次为B2 B3。

  • 将降采样的结果分别输入到网络中得到相应分辨率尺寸下复原结果,并将复原结果作为下一阶段的输入,从而知道后续的复原【上面的图片要从下往上看】。

  • 这种多尺度的策略,类似于传统的模糊核估计中的【由粗到细】的策略,将复杂的问题进行分解,逐步复原,先在低分辨率下复原大尺度的信息,然后再高分辨率下复原细节信息。简化问题的同时增大了图像的感受野。

PS:该博文只记录一下论文作者的思路和网络结构,实现细节没有看所以没写,以后觉得对本人研究工作有用了会翻出来仔细看一遍。

你可能感兴趣的:(论文笔记)