【论文笔记】——CE-Net简单总结

论文链接:CE-Net: Context Encoder Network for 2D Medical Image Segmentation
总的来说这篇论文有两个贡献:

  • 提出了DAC和RMP
  • 做了许多方面的分割实验

整体框架见下图:
【论文笔记】——CE-Net简单总结_第1张图片
网络分为三个部分,编码器部分用的是预训练后ResNet,框架是参考的U-Net,具体与U-Net的不同就是采用了shortcut(见(b)图);中间的部分是context提取器,提出了DAC和RMP两个新结构,用来提取语义信息和提取高级特征;最后是解码器。

DAC将空洞卷积应用到Inception和ResNet里面,这里不具体介绍了,具体见Inception-ResNet示意图。DAC的输入是编码器的输出,尺寸为14x14x512。简单来说,DAC有五个分支,四个分支是参考的Inception,采用rate值不同的空洞卷积,最终获得不同感受野(3/7/9/19);另一个分支参考的是ResNet的shortcut,结构见下图。这样做最终获得了不同感受野,适用于不同尺寸的对象。
【论文笔记】——CE-Net简单总结_第2张图片
RMP结构主要是用来解决医学图像分割中,对象大小总是差很多的情况。比如早期的肿瘤和中晚期肿瘤的大小就差很多。作者提出的这个方法其实就是用多种池化代替通常使用的单一maxpooling,从而获得不同的视场。如下图,将输入分别进入4个池化层,得到四种尺寸的输出再经过一个1x1卷积,将通道数变为1,然后再经过双线性差值变为输入图的尺寸,最后再与输入拼在一起。图中最右边的图很明显了,经过RMP其实就相当于在原来的14x14x512上再加4个通道,这4个通道分别来自不同池化层的结果上采样。
【论文笔记】——CE-Net简单总结_第3张图片
解码器很简单,作者选的是反卷积。

损失函数作者采用的是Dice coefficient loss function。K表示类别数,N表示像素数,p表示预测概率[0,1],g表示第k类的真值{0,1},w表示权重。
【论文笔记】——CE-Net简单总结_第4张图片
再加上正则化损失作为最终损失,正则化损失是防止过拟合。
在这里插入图片描述

你可能感兴趣的:(CE-Net,分割,医学)