首次将半监督学习方法用于低光图像增强。
【题目】:From Fidelity to Perceptual Quality: A Semi-Supervised Approach for Low-Light Image Enhancement
【DOI】:10.1109/CVPR42600.2020.00313
【会议】:2020-CVPR
【作者】:Wenhan Yang(香港城市大学), Shiqi Wang(香港城市大学), Yuming Fang(江西财经大学), Yue Wang(字节), Jiaying Liu(北京大学)
【论文链接】:https://ieeexplore.ieee.org/document/9156559
【代码链接】:https://github.com/flyywh/CVPR-2020-Semi-Low-Light
【视频链接】:https://www.youtube.com/watch?v=J5ogMvSDdF4
缩小信号保真度和感知质量之间的差距。
提出了一种深度递归频带网络DRBN(Deep Recursive Band Network ),在DRBN中,首先执行频带表示学习。在成对数据集的指导下,对每个频带信号进行学习恢复,该阶段确保信号保真度和细节恢复。然后,在非配对数据集的感知指导下,执行频带重组以增强图像的视觉质量,其中高质量图像充当人类视觉感知的先验。
提出的深度递归频带网络 (DRBN) 的框架包括两个阶段: 递归频带学习和频带重构。
在DRBN中,首先执行频带表示学习。在成对数据集的指导下,对每个频带信号进行学习恢复,该阶段确保信号保真度和细节恢复。然后,在非配对数据集的感知指导下,执行频带重组以增强图像的视觉质量,其中高质量图像充当人类视觉感知的先验。
目的:确保信号保真度和细节恢复。(保真)
构建了一系列类似U-Net的深度网络,称为带学习网络 BLN(band learning networks)。每个BLN将输入Y和最后一次递归的增强结果的连接,投影到特征空间中,然后通过几个卷积层变换特征。在中间层中,首先对特征的空间分辨率进行下采样,然后通过步幅卷积和反卷积进行上采样。存在跳跃连接(用红色表示),将具有相同空间分辨率的特征从浅层连接到深层,这有助于浅层生成的特征中包含的局部信息到达输出。每个BLN分别在尺度S1=1/4、S2=1/2和S3=1处产生三个特征。
举例说明递归学习的第一次循环:
其中,分别是从 y 中提取的相应尺度的特征;
为相关过程;
是将特征投影回相应尺度的图像域的过程;
是上采样过程。 图像首先以最粗糙的尺度 s1 重建。 然后,在精细尺度上,残差信号被预测为整个结果的一部分。
之后,在第 t 次重复时,仅在先前(第 t-1 次)估计结果的指导下学习残差特征和图像。 y 和先前估计结果的串联被视为输入:
该公式将所有频带特征紧密连接起来,形成了所有频带的联合优化。在最终的递归 T(本文工作中设置为 4),第一阶段的重建损失:
其中是下采样过程,给定缩放因子si;就是把ground truth x下采样到和s1,s2一样大小。 Φ (·) 计算输入图像的SSIM值; λ1和 λ2是加权参数。
目的:通过感知质量引导的对抗学习,重组频带表示,以提高增强的弱光图像的感知质量。(感知质量)
生成器:来自上一阶段的频带表示被前馈到类似U-Net的网络(生成器)中, 被用来对重构过程
进行建模,以生成重构频带信号的系数 {w1,w2,w3},该变换系数线性地操纵和融合这些频带得到增强图像
。如下所示:
判别器 D:
第二阶段的损失函数:
是从预训练的VGG网络中提取深层特征的过程。
1、配对低光数据集LOL:第一阶段把图片切为256*256用于训练,第二阶段把图片切为320*320用于训练。
2、非配对高质量图像数据集AVA[21] :Band Recomposition 阶段利用了一个对抗性学习(类似EnlightenGAN)Global-Local的一种机制,学习了AVA这个数据集,大约有25万张照片(每张都很美),然后在最后做损失函数的计算。
低照度图像数据集_chaikeya的博客-CSDN博客_低光数据集
表1:定量结果。本文方法PSNR和SSIM以及SSIM-GC值都是最好的。(基于 Gamma 校正结果计算的 SSIM,称为 SSIM-GC)
图3:定性结果。左:原始结果。右:通过伽玛变换校正的结果,以获得更好的可见性。本文的方法视觉上效果最好。