DS-UNeXt

DS-UNeXt: depthwise separable convolution network with large convolutional kernel for medical image segmentation

用于医学图像分割的大卷积核深度可分卷积网络

论文:https://link.springer.com/article/10.1007/s11760-022-02388-9

摘要

现在基于U型结构的卷积神经网络广泛应用于医学图像分割任务中。由于卷积运算的固有局部性,基于cnn的方法很难使用swing - unet学习全局信息远程语义信息交互。然而,我们发现UNet和swing - UNet在小目标上的有不好的分割性能。针对这一问题,本文提出了一种端到端深度可分的大卷积核U型卷积网络(DS-UNeXt)。DS-UNeXt网络有更大的接受域来提取特征,这有助于提高多尺度医疗分割的性能。在DSUNeXt中,提出了并行深度可分空间池化**(PDSP)来聚合全局信息。PDSP由多个并行深度可分离卷积组成**,增强了高级语义特征。

Introduction

介绍CNN和Transformer:
医学图像的自动分割方法主要依靠u型结构的CNN。经典的UNet[3]提出了一种带有跳跃式连接的对称结构。由于UNet在各种医学影像应用中取得了巨大的成功,按照u型网络结构开发了多种算法,如3D UNet[6]、Res-UNet[7]、UNet++[8]、Attention UNet[9]和UNet3+[10]。这些基于cnn的方法[11,12]在许多医学图像分割中的优异性能证明学习辨CNN别特征的强大能力。
CNN在空间位置表示方面具有优势,但由于卷积运算在上下文信息交互和全局语义信息获取方面的局限性,为了追求更高的分割精度以满足临床医疗应用的需要,受Transformer在自然语言处理(NLP)[13]中应用的巨大成功的启发,研究人员将Transformer引入了计算据视觉中,由于Transformer在远程依赖性方面的优势,Transformer已被应用到医学图像领域。例如TransUNet并验证了Transformer在医学图像分割方面的潜力。研究者也逐渐倾向于使用Transformer作为主要模块来构建网络结构。而CNN的共享参数、平移不变性和归纳偏置使其效率更适合于高分辨率医学图像。由于医学图像数据和标签的限制,在医学图像应用中使用ViT和CNN构建混合模型来解决这一问题[16-20]。Liu等人[24]还表明,完全由CNN构造的ConvNeXts可以与ViT竞争。该模型证明了大卷积核在计算机视觉中的有效性。然而,采用大卷积核的网络层不仅会增加参数的数量,而且复杂的网络结构也容易导致图像分割的过拟合
提出的新的网络架构:
为了解决上述问题,文中提出了一种新型的U型网络。在编码器中采用了一个大的卷积核,增加了接受域的大小,来提高对于小物体的分割。此外,提出了一种PDSP聚合全局信息的方法,可以弥补卷积不能很好地建模全局信息的局限性。该模块改进了全局信息的交互和融合,有利于仅使用局部信息难以分割的区域。然后,我们还提出了一种简单高效的卷积解码器,既融合了深度特征和浅层特征,又高效。同时,我们的网络采用深度可分离卷积,大大降低了网络参数量和计算量。本文的主要研究贡献如下:
1.设计一个基于大卷积核和深度可分离卷积的网络架构DS-UNeXt。
2.使用PDSP来聚合全局信息。
3.取得了很好的分割效果。

网络架构

DS-UNeXt_第1张图片

网络包含编码器、跳跃连接、解码器和瓶颈结构。
编码器:先通过22的卷积进行下采样,将特征图的大小缩小2倍(扩大接收域),同时将通道数量翻倍。接着是两个ConvNeXt他是一个残差结构,包含一个 depthwise separable convolution layer (可分离的深度卷积层)卷积核大小为77,其中使用LN+GELU。
DS-UNeXt_第2张图片
瓶颈结构PDSP:采用深度可分卷积并行采样来获取输入特征的上下文信息。深度可分卷积是一种轻量级的卷积方法,主要由深度卷积(DW)和点卷积(PW)组成。与传统卷积相比,它需要的参数和计算量更少。图3 PDSP网络的结构,在减少flop和网络参数的同时补偿了容量损失。如图3所示,PDSP并行使用三个深度可分离的卷积层,聚合来自多个特征映射的信息,并将来自多个卷积层的特征拼接起来。
DS-UNeXt_第3张图片
解码器DWlU:(a)是普通的解码器模块(b)是论文中使用的解码器模块。先进行跳跃连接+3*3的深度可分离卷积+转置卷积来高效的恢复图像的分辨率。

结论

提出了一种新的端到端网络,DS-UNeXt,用于医学图像分割。DS-UNeXt由一个具有大卷积核尺寸的编码器结构和一个使用深度可分卷积的轻量级解码器结构组成。采用大尺寸的卷积核作为特征提取来构建层,使编码器可以获得大尺寸的接收域,这更适合用于检测小物体。此外,PDSP由一个并行的深度可分卷积和一个空间池层组成,用于聚合全局信息。

补充知识(深度可分离卷积)

参考博客
DS-UNeXt_第4张图片

你可能感兴趣的:(医学图像分割,深度学习,人工智能)