目录
摘要
介绍
方法
A. Generator Architecture
B. Discriminator Structure
C. Loss Function
实验结果和分析
A. Experimental Settings
B. Parameter Selection
作者分别分析了传统、CNN、GAN在该领域的进展:传统方法输出图像过于平滑或引入新的噪声,算法的鲁棒性和泛化能力有待提高;CNN的特征提取能力受到数据集、硬件资源和运行时间的限制,只有在大的情况下才能获得更好的去噪结果;GAN网络的稳定性有待提高。
此文主要贡献如下:
提出了一种多通道训练生成器结构。在主特征提取通道的基础上,增加了伪影和噪声注意通道以及边缘特征注意通道,以提高对不同类型信息的分类和处理能力。
在伪影和噪声注意通道中,设计了一个基于LSTM的递归注意子网络来捕捉条纹伪影的周期性变化,从而提高网络对条纹伪影的估计能力。在边缘特征注意通道中,设计了边缘特征提取模块来捕获LDCT图像的边缘特征,从而弥补多级去噪带来的边缘和结构信息的损失。
为了提高鉴别器的能力和生成对抗网络的稳定性,提出了一种多尺度Res2Net鉴别器,该鉴别器能够在多个尺度上表达图像特征,并扩展了网络各层的感受野。
为了保证网络的整体去噪性能,除了传统的全局L1损失外,还针对去噪网络的每个子通道提出了与其功能相对应的改进损失函数。
本文提出的网络的工作分为两部分,两者相互补充:
如图2所示。在去噪过程中,主要特征提取通道用于提取图像的主要特征,伪影和噪声注意通道和边缘特征注意通道用于提取补充特征,然后输入到主要特征通道。伪影和噪声注意通道用于从LDCT图像中提取干扰信息的掩蔽特征。边缘特征注意通道用于从LDCT图像中提取有用信息的特征,例如组织边缘细节。
三个特征提取通道具体结构如下:
整体过程个人猜想:主特征通道的前端输出与伪影通道的输出掩膜按照元素相乘得到伪影与噪声图像,经过中端和后端处理后,输出残差图,用LDCT与之相减得到生成的干净图像,最后于边缘特征通道的结果结合,形成最终输出的干净图像。
通过在鉴别器的设计中引入Res2Net模块,我们设计了一个多尺度Res2Net鉴别器,它可以在给定的残差块中进行多尺度特征提取。
如图3和表1所示,所提出的鉴别器包含3层。鉴别器的第一层采用卷积核大小为4 × 4、步长为2的卷积运算,以减少网络计算量,扩大感受野。第二层由Res2Net模块组成,用于提取图像同一尺度特征块中的多尺度特征。鉴别器的第三层采用卷积核大小为4×4、步长为1的卷积运算,并在卷积层后增加了一个sigmoid激活函数。具体流程如下:
用128个核,每个核大小为1 × 1,步长为1进行卷积运算,实现特征维数变换。
变换后的128个特征被平均分成四组,每组包括32个通道用于处理。第一组特征保持不变,并直接添加到第二组特征中。组合后的特征馈入卷积层,其核大小为3 × 3,步长为1,填充为1,用于处理。此外,前一通道的已处理特征和下一通道的未处理特征被加在一起,并被用作下一通道的输入。相应的缩放操作被连续执行,并且相同的操作被重复四次。
将所有中间特征级联,用1 × 1的卷积核大小实现降维。
利用跨层连接的思想实现深层特征和浅层特征的融合,可以在一定程度上缓解训练过程中产生的梯度消失或梯度爆炸的问题。
本文提出的多尺度Res2Net鉴别器通过增加网络在模块中的感受野来减少网络参数,提高鉴别器的特征提取能力,从而可以利用同一尺度中的特征。
本文使用不同的损失函数去训练不同的通道,这些函数分为三类:
伪影一致性损失:其约束对象是理想伪影图像和真实伪影图像。伪影一致性损失用于确保生成的理想伪影图像尽可能接近真实伪影图像。
逐像素L1损失:由数据保真度项和惩罚项组成,用于确保多通道生成器生成的最终图像的质量。
对抗性损失。
数据集:
对比算法:
HFSGAN
SiameseGAN
w/o Att: 刨除伪像和噪声注意通道的ADAGAN
w/o TV:刨除边缘特征注意通道的ADAGAN
w/o MultiD:将多尺度Res2Net鉴别器子网替换为传统鉴别器的ADAGAN
三个指标,包括峰值信噪比(PSNR) [37],结构相似性指数措施(SSIM)和视觉信息保真度(VIF) [38]被选为图像质量的定量评估。
使用Adam,设置如下:学习率,两个指数衰减因子和。
图像的输入尺寸为512×512。训练和测试批量为1。
有四个超参数λ1、λ2、λ3和λ4:λ2控制基于总变异(TV)的正则化项和每像素L1损失保真度项之间的权衡,而λ1、λ3和λ4分别控制伪像掩模损失、边缘损失和每像素L1损失在总损失中的权重。经过实验,λ3和λ4取相同值,λ1、λ2对实验结果有显著影响,因此做了许多实验,分析训练过程中损失函数的变化曲线,以及不同参数设置下去噪结果的PSNR和SSIM值,如图4。
考虑到两个损失函数在网络中的作用以及去噪图像的SSIM和PSNR值的性能,本文采用了以下设置:λ1 = 25,λ2 = 0.5,λ3 = 10,λ4 = 10。
根据图5的观察选取0.0002为学习率。
作者又针对伪影和噪声关注通道中LSTMs的数量和每个循环的ResBlock数量做了实验,最终取了4个LSTM和5个ResBlock,与上文同。
而后作者又对比了鉴别器中最后一个卷积层的卷积核大小和步长大小对网络性能的影响,发现卷积核在4x4时达到最优,步长在1时达到最优,与上文呼应。
PS:作者大大太肝了!!!!!!
后续就是作者在三个数据集上去噪成果的展示(实验量真的很大)感兴趣的读者可以看看原著,在此就不多记录了。感谢各位的耐心阅读,下篇见!