CE-Net: Context Encoder Network for 2D MedicalImage Segmentation

Title:用于二维医学图像分割的上下文编码器网络

摘要:在医学图像分割领域中,基于UNet已经成为主流的应用框架。但是在UNet结构中连续的池化和跨步卷积操作会导致一些空间信息的丢失。在本文中提出了一个上下文编码器网络(简称为CE-Net)

CE-Net主要包含三个主要部分:特征编码器模块,上下文特征提取模块和特征解码器模块。使用预训练的ResNet块作为固定特征提取器。上下文提取模块由新提出的密集卷积(DAC)块和残差多核池化块(RMP)组成。

Introduction

U-Net及其变体的一个常见限制是,连续的池化操作或卷积跨步降低了特征分辨率,以学习日益抽象的特征表示,直观地说,在中间阶段保持高分辨率的特征图可以提高分割性能。但是,它增加了特征图的大小,对于加速训练和缓解优化的难度来说并不是最优的。

因此,在加速训练和保持高分辨率之间需要权衡。一般来说,U-Net结构可以被认为是编码器-解码器结构。编码器的目标是逐步降低特征图的空间维度,捕获更多的高级语义特征。解码器的目标是恢复物体细节和空间维度。为了提高分割性能,在编码器中捕获更多的高级特征,在解码器中保留更多的空间信息是很自然的。

本文提出了一种新的密集空洞卷积(DAC)模块来应用空洞卷积。原有的UNet架构在编码路径中采用连续的3x3卷积核池化操作,在有限的缩放范围内捕获多尺度特征。本文提出的DAC模块可以通过四个级联分支注入多尺度的空洞卷积来捕获更广泛和更深的语义特征。--DAC捕获更多的高级特征

还提出了一个基于空间金字塔池化的残差多核池化(RMP)。RMP块通过使用各种大小的池化操作进一步编码从DAC模块提取的对象的多尺度上下文特征,并且不需要额外的学习权重--RMP保留更多的空间信息

综上所述,DAC块被提议用多尺度的atrous卷积来提取丰富的特征表示,然后RMP块被提议用多尺度的池化操作来获得进一步的上下文信息。

方法

网络的整体架构如下图所示:

CE-Net: Context Encoder Network for 2D MedicalImage Segmentation_第1张图片

特征编码器模块(加入了残差连接其余相似--略)

上下文提取模块

上下文提取模块由DAC模块和RMP模块组成。这个上下文提取模块提取上下文语义信息,生成更高级的特征映射。

DAC模块:DAC模块的结构如下图所示

CE-Net: Context Encoder Network for 2D MedicalImage Segmentation_第2张图片

在四个级联中均设置了空洞卷积,DAC模块有4个级联分支,并且空洞卷积的数量也逐渐增加。每个分支的感受野是3,7,9,19应用了不同大小的感受野。并且在每个分支中我们应用一个1x1的卷积来校正线性激活。通常情况下,大感受野的卷积可以为大对象的提取生成更抽象的特征。而小感受野的卷积对小对象更好。通过组合不同的空洞率的空洞卷积。DAC块能够提取不同大小对象的特征。

RMP模块

分割中的一个挑战是医学图像中对象的巨大变化。例如,中晚期肿瘤可能比早期肿瘤大得多。在本文中提出了一种残差多核池化来解决这个问题,它主要依赖于多个有效的视野来检测不同大小的对象 。感受野的大小决定了我们可以使用多少多少上下文信息。

如下图所示,本文所提出的RMP编码具有4个不同大小的感受野的全局上下文信息

CE-Net: Context Encoder Network for 2D MedicalImage Segmentation_第3张图片

四级输出包含不同大小的特征图,为了减少计算成本,在每个级别的池化后使用1x1卷积,它将特征图的维数减少到原有维度的1/N,然后通过双线性插值对低维特征图进行上采样,以获得与原始特征图相同的特征大小的特征

特征解码器模块

 上尺度操作通过线性插值增加图像大小,而去卷积(也称为转置卷积)使用卷积操作来放大图像。直观地说,转置卷积可以学习自适应映射以恢复具有更详细信息的特征。因此,我们选择使用转置卷积来恢复解码器中的较高分辨率特征。

损失函数

使用DiceLoss作为这个模型的损失函数

最终总的损失函数是两个损失函数的加权和

其中第二个损失表示避免过度拟合的正则化损失

总结

本文提出的CE-Net。与U-Net相比,所提出的CE Net在特征编码器中采用了预训练的ResNet块。新提出的密集空洞卷积块和残余多核池被集成到ResNet修改的UNet结构中,以捕获更多高级特征并保留更多空间信息。

你可能感兴趣的:(医学图像分割论文,人工智能,计算机视觉)