ADR-Net: Context extraction network based on M-Net for medical imagesegmentation

https://aapm.onlinelibrary.wiley.com/doi/full/10.1002/mp.14364

1. INTRODUCTION

医学图像分割是医学图像处理和分析的一个初步步骤,它可以被看作是一个特殊的分类问题。分割结果的形状和大小是重要的参考,根据这些结果可以诊断出威胁生命的疾病的早期表现。图像分割在医学中的应用已经引起了计算机科学界和医学界的关注,医学图像分割已经迅速成为一个热门的研究课题。例如,在眼底血管分割方面,Fan等人1采用倍频卷积来学习多空间频率特征,创造了一种更有效的方法来捕捉不同形状和大小的视网膜血管。Zhang等人2提出了一种基于深度神经网络的新方法,与现有的方法相比表现出更好的准确性。Tan等人3采用了区域生长、最大类间差异和快速行进方法来完成肺血管分割的任务。Holger,4 Gibson,5和Kakeya6提出了一种基于三维(3D)卷积神经网络的计算机断层扫描(CT)图像的多器官分割方法。正如上述例子所证实的,医学图像分割的方法既基于传统方法,也基于深度学习方法。

在医学图像分割中,传统方法主要包括使用水平集的基于形状的方法和基于学习的方法,7-9等。基于水平集的形状方法7已被用于医学图像的二维分割和三维分割。字典学习和稀疏编码方法被用于腹部CT图像的多器官分割。9这些方法由于依赖手工制作的特征来获得分割结果,因此存在分割精度低和转移学习能力差的缺点。在这种情况下,为一种类型的图像设计的函数并不适合于其他类型的图像。

最近,卷积神经网络已被广泛用于语义分割。例如,Long等人10提出了用于语义分割的完全卷积网络。此外,SegNet11被提出用于图像分割。然而,目前的网络在分割过程中只利用从深层获得的特征,而忽略了浅层特征。这是有问题的,因为即使高层次的特征有助于分类,浅层的特征在详细信息方面要丰富得多。12 此外,某些网络已经被提出来以提高分割性能。U-Net网络13是一个像素级的语义分割网络,包括一个编码器路径和一个解码器路径。编码器路径通过下采样逐渐减少图像的空间尺寸,而解码器路径通过上采样逐渐恢复物体的细节和空间尺寸。由于U-Net在医学图像的小样本上具有良好的性能,因此被广泛应用于医学图像分割中。一些基于U-Net的扩展方法也被提出,14 例如,UNet++网络是U-Net的一个增强版本。与U-Net相比,U-Net++在跳过连接处增加了一系列的卷积层,以减少编码器和解码器的特征图之间的语义差距。此外,为了提高中间部分接收正在传输的梯度的能力,在卷积层之间嵌入了额外的深度监督。随后,M-Net15被提出,通过增加多尺度输入和深度监督,用于同时进行视盘和视杯分割。受剩余连接和密集连接的启发,ResU-Net16和DenseU-Net17分别用剩余连接和密集连接模块替换了U-Net的每个子模块。Alom18等人提出了基于U-Net的双循环CNN(R2Unet)。该方法将残差连接与递归卷积结合起来,取代了U-Net中的原始子模块。残差单元帮助训练深度网络,并积累残差卷积层的特征,以确保在分割过程中更好地表示特征。为了提高网络性能,在U-Net的跳过连接中引入了注意门(AG)机制19,以适当地重新调整编码器的输出特征。这个模块产生一个门控信号来控制不同空间位置的特征的重要性。最近,有人提出了一种基于器官注意网络和统计融合的算法20,用于腹部多器官分割。在该方法的第一阶段,进行网络训练,获得概率图作为网络输入的补充。在第二阶段,引入了辅助监督和反向连接。最后,多视图模型的EM算法被纳入网络中。有人提出了一个用于眼底血管分割的三阶段模型21,它将血管分割分为三个阶段--粗血管的分割、细血管的分割和血管的融合。

上述方法未能有效地分割小型医疗目标的图像。这主要可归因于它们缺乏上下文特征信息。虽然这个缺点可以通过增加考虑的特征数量来解决,但这仍然受到内存和图形处理单元(GPU)计算能力的限制。12随着语义分割适用范围的扩大,丰富的上下文信息在图像分割中逐渐发挥了重要作用。这使得获得多尺度的上下文信息对分割至关重要。为此,Deeplab22增加了不同扩张率的卷积,以捕捉不同大小的目标,而CE-Net23有效地从二维医学图像中提取了更高层次的语义和空间信息。此外,金字塔集合能够从不同方向提取特征图。遵循这一原则,一个新的网络24用空间金字塔池化取代了普通池化,并在U-Net的跳过连接部分加入了空间金字塔池化,以获得全局的上下文特征。
目前,深度学习方法被广泛用于医学图像分割13,14,以协助医生对疾病进行诊断。虽然已经提出了许多方法用于医学图像分割,但由于相关数据的复杂性,它仍然是一项具有挑战性的任务。例如,人体结构的图像很复杂,包括众多组织、低对比度、模糊边界、身份变化和小目标。在本文中,我们试图提高有小目标的医学图像的分割精度。为了获得更多的可区分的特征,我们提出了一个联合的多尺度背景提取网络架构(ADR-Net)。所提出的网络是M-Net15的扩展,集成了密集无序卷积块(DAC块)和残余金字塔池块(RMP块)。23 DAC块类似于Inception块。25 然而,与Inception块不同,DAC块由四个级联分支组成,具有多尺度扩张卷积,以捕获更多的高级特征。为了进一步编码目标物体的多尺度上下文特征,我们将多尺度RMP块纳入所提出的架构中,这类似于具有不同池核的空间金字塔池化。使用不同的扩张率,卷积层在四个级联分支上增加。本研究的贡献可以列举如下。

  1. 串联操作被集成在跳过连接层中。我们将侧面输入的卷积图像串联起来,通过下采样在解码器中获得更多的特征图。在网络的编码部分,通过连续卷积和池化降低特征分辨率。DAC块和RMP块被整合到架构中,以获得不同大小的感受野,并提取与不同特征有关的信息。

  2. 注意力门模块被集成到网络中,以增强目标区域的注意力权重,并抑制不相关区域的影响。

  3. 在五个不同的数据集上对所提出的模型进行了评估,在每个数据集上,它的表现都优于最新的方法。它的通用性也得到了充分的证明。

你可能感兴趣的:(ADR-Net: Context extraction network based on M-Net for medical imagesegmentation)