CE-Net: Context encoder network for 2D medical image segmentation论文阅读

文章目录

  • Abstract
  • 一、Introduction
  • 二、Method


Abstract

医学图像分割是医学图像分析中的重要步骤。随着卷积神经网络在图像处理中的快速发展,深度学习已被用于医学图像分割,如视盘分割,血管检测,肺部分割,细胞分割等。以前,已经提出了基于U-net的方法。 。然而,连续的汇集和跨步卷积操作导致一些空间信息的丢失。在本文中,我们提出了一个上下文编码器网络(称为CE-Net)来捕获更多的高级信息并保留用于2D医学图像分割的空间信息。 CENet主要包含三个主要组件:特征编码器模块,上下文提取器和特征解码器模块。我们使用预训练的ResNet块作为固定特征提取器。上下文提取器模块由新提出的密集的空洞卷积(DAC)块和剩余的多内核池(RMP)块形成。我们将提出的CE-Net应用于不同的2D医学图像分割任务。综合结果表明,该方法优于原始U-Net方法和其他最先进的视盘分割,血管检测,肺部分割,细胞轮廓分割和视网膜光学相干断层扫描层分割方法。


一、Introduction

U-net成为生物医学分割的框架

以U-net为基础进行各种改造

U-Net及其变体的一个常见局限是连续的池化操作或卷积跨度降低了特征分辨率,以学习越来越抽象的特征表示。虽然这种不变性有利于分类或物体检测任务,但它常常会阻碍需要详细空间信息的密集预测任务。直观地说,在中间阶段维护高分辨率特征图可以提高分割性能。然而,它增加了特征图的大小,这对于加速训练并减轻优化的难度并不是最佳的。因此,在加速训练和保持高分辨率之间存在折衷。通常,U-Net结构可以被认为是编码器 - 解码器架构。编码器旨在逐渐减少特征图的空间维度并捕获更高级的语义特征。解码器旨在恢复对象细节和空间维度。因此,在编码器中捕获更高级别的特征并在解码器中保留更多空间信息以提高图像分割的性能是自发的。

由于上述讨论以及使神经网络更宽更深的InceptionResNet结构[53],[54]的推动,我们提出了一种新的密集空洞卷积(DAC)块来应用空洞卷积。原始的UNet架构通过在编码路径中采用连续的3x3卷积和池化操作,在有限的缩放范围内捕获多尺度特征。我们提出的DAC模块可以通过注入具有多尺度空洞卷积的四个级联分支来捕获更广泛和更深的语义特征。在该模块中,利用剩余连接来防止梯度消失。此外,我们还提出了一个由空间金字塔池[55]推动的剩余多核池(RMP)。 RMP块通过采用各种大小的池化操作进一步编码从DAC模块提取的对象的多尺度上下文特征,而没有额外的学习权重。总之,建议DAC块用多尺度的空洞卷积提取丰富的特征表示,然后用RMP块获得具有多尺度池操作的进一步的上下文信息。将新提出的DAC模块和RMP模块与骨干编码器 - 解码器结构相结合,我们提出了一种名为CENet的新型上下文编码器网络。它依赖于DAC模块和RMP模块来获得更多抽象特征并保留更多空间信息以提高医学图像分割的性能。

二、Method

CE-Net: Context encoder network for 2D medical image segmentation论文阅读_第1张图片

A. Feature encoder module

在U-Net架构中,每个编码器块包含两个卷积层和一个最大池层。在所提出的方法中,我们将其替换为特征编码器模块中的预训练ResNet-34 [53],该模块保留了前四个特征提取块,而没有平均合并层和完全连接的层。与原始块相比,ResNet增加了快捷机制,避免了梯度消失,加速了网络收敛,如图1(b)所示。为方便起见,我们使用经过预先训练的ResNet的修改后的U-net作为骨干方法。

所谓预训练模型不是使用的是原版的在imagenet上预训练的,而是该模型本身的结构在imagenet上预训练的,你可以改变自身的resnet34结构,然后在训练一下,去掉fc和softamx,只保留网络结构部分即可。

B, Context extractor module

1)Atrous conv: 为了避免池化层对信息的损失

2)Dense Atrous convolution module: Inception [54]和ResNet [53]是深度学习中的两个经典且具有代表性的架构。初始序列结构采用不同的感受域来拓宽架构。相反,ResNet采用快捷连接机制来避免爆炸和消失的梯度。它使神经网络首次突破数千层。Inception-ResNet [54]块结合了Inception和ResNet,继承了两种方法的优点。然后它成为深度CNN领域的基线方法。

DAC: 空洞卷积以级联模式堆叠。在这种情况下,DAC有四个级联分支,随着自然卷积数量的逐渐增加,从1到1,3和5,然后每个分支的感受野将是3,7,9,19。它采用不同的感知领域,类似于Inception结构。在每个atrous分支中,我们应用一个1x1卷积进行整流线性激活。通常,大接收场的卷积可以为大对象提取和生成更抽象的特征,而小接收场的卷积对于小对象更好。通过组合不同动态速率的空洞卷积,DAC块能够提取具有各种尺寸的对象的特征。
CE-Net: Context encoder network for 2D medical image segmentation论文阅读_第2张图片
3)Residual multi-kernel poolig
CE-Net: Context encoder network for 2D medical image segmentation论文阅读_第3张图片

C. feature decoder module

D. loss function

Dice coefficient loss function

你可能感兴趣的:(医学图像分割,深度学习,计算机视觉,人工智能)