《Deep Convolutional Denoising of Low-Light Images》

《Deep Convolutional Denoising of Low-Light Images》

泊松噪声

泊松分布通常用于描述单位时间内随机事件发生的次数。在图像建模中,基于光照的图像噪声经常使用泊松噪声来描述,这主要是从传感器角度出发的。
由于光子数量是离散的,同时传感器在每个像素位置对光子的探测具有独立性。通常过程是传感器对一个时间区间内到达的光子数进行计数,这个过程符合泊松噪声的特征,其强度通常会受光源和亮度影响。
在计算机视觉上,以往为了简化运算,通常使用均值为零的高斯分布来模拟图像噪声,但是在物理意义上来说,高斯分布对图像噪声的描述不如泊松噪声准确。

使用CNN做降噪的原因

  • 强大的学习和表达能力,能够发掘潜在特征而不需要预先显式的定义
  • 已有模型对不同训练数据集的迁移能力较强,可通过自己的数据进行有针对性的训练
  • 目前已有许多高速实现包括GPU并行的工具,在计算卷积时,效率高于其他类型的模型

网络结构

《Deep Convolutional Denoising of Low-Light Images》_第1张图片

  • 20层64个3X3核的卷积层,其中前18层后接非线性层RELU,最后两层未使用。每层的前63个核获取的信息进入下一层进行计算,第64个核直接输出在最后一层之后与原图叠加,经过欧式距离Loss的训练,这些层将逐步表达为不同结构层次的噪声的负数,从而在与原图相加后消除噪声。
  • 输入:带噪声的图片
  • 输出目标:经过去噪后恢复的图片
  • 全部使用卷积的好处在于参数总数少,计算速度快。

进一步提升表现

通过先根据不同物体分类,再用对应网络参数进行去噪的方式能够提高表现。这是因为不同种类的物体通常会产生自己独特的噪声分布。例如人脸,花朵等,在已知分类的前提下,去噪网络的表现更符合该类物体的特征。

《Deep Convolutional Denoising of Low-Light Images》_第2张图片

如图展示的是人脸降噪网络的对比,可以注意到,对比起传统非网络的高斯去噪方法(左二),以及通用的去噪网络(左三),针对人脸训练的去噪网络效果最好(左四)。
但同时我们可以发现,在与原图的对比中,降噪后的图片损失了胡子等信息。如果这部分信息有用,则降噪过程是一个破坏性的过程。
因此,正如作者在题目中表明的,这样的网络降噪适用于在低光照条件下,图片本身提供的信息较少,噪声较多,通过网络参数所表达的关于噪声的“先验知识”,能一定程度上增强图片中的信息。而对于正常光照等噪声占比较小的情况下,降噪网络会造成信息的损坏。

可能的引申应用

  • 对于低光照下的人脸图片,通过以正常光照图片为目标,训练能够近似正常光照条件下效果的网络,从而根据恢复出来的信息进行人脸识别

  • 对于受固定分布噪声影响的图片,例如红外图片,训练一个有针对性的去噪网络,便于后续应用

  • 根据低光照条件下的噪声分布规律(泊松分布),有意识地在人脸识别等任务的训练网络的输入中,增加该类噪声,以达到数据增强,和增加网络的鲁棒性的效果

你可能感兴趣的:(《Deep Convolutional Denoising of Low-Light Images》)