一看就懂的CE-NET详解

一看就懂的CE-NET详解

针对问题

u-net及其变体存在限制,连续的pooling和交错的卷积运算会导致一些空间信息的丢失。

文章贡献

  • 提出了一个DAC模块和一个RMP模块来捕获更多的高级特征并保留更多的空间信息。
  • 在医学图像分割中,我们将所提出的数模转换模块和最小均方误差模块与编解码结构相结合。
  • 将该方法应用于不同的任务,包括视盘分割、视网膜血管检测、肺分割、细胞轮廓分割和视网膜光学相干断层扫描层分割。结果表明,在这些不同的任务中,所提出的方法优于最先进的方法。

网络结构

一看就懂的CE-NET详解_第1张图片

  • INPUT:4484483

  • Feature Encoder Module(Encoder):RES-NET 34

  • Context Extractor Module

  • 1)DAC block(Dense Atrous Convolution module):
    灵感来源:编码器-解码器和Inception-ResNet
    作用:通过注入具有多尺度空洞卷积的四个级联分支来捕获更广泛和更深的语义特征,使用快捷连接来防止梯度消失问题。
    Tips:In each atrous branch, we apply one 1×1convolution for rectified linear activation.
    一看就懂的CE-NET详解_第2张图片

  • 2)RMP block(Residual Multi-kernel pooling):
    灵感来源:空间金字塔池化
    作用:通过采用各种大小的池化操作进一步编码从DAC中提取的目标的多尺度上下文特征,而没有额外的学习权重。
    Tips:每个pooling生成1*1的feature map
    一看就懂的CE-NET详解_第3张图片

  • Feature Decoder Module(Decoder):类似于U-NET利用跳跃连接、上采样(转置卷积:转置卷积可以学习自适应映射来恢复具有更详细信息的特征)

实验

  • Loss Function:
    损失函数

  • 数据(5个):
    1)optic disc segmentation(视盘):为了根据原始分辨率分割视网膜眼底图像中的视盘,在最亮的点周围裁剪出800 × 800的区域。
    ORIGA (650幅图像,尺寸为3072×2048。分为2套:A套训练,B套测试)
    Messidor(1200幅图像,有三种不同的尺寸:1440 × 960、2240 × 1488、2340 × 1536),数据集官网:http://www.uhu.es/retinopathy/
    RIM-ONE-R1(RIM-ONE-R有三个版本。图像的数量分别为169、455和159,用1,提供裁剪后图像)
    2)retinal vessel detection(视网膜血管):
    DRIVE(40幅图像:20幅用于训练、20幅用于测试)
    3)lung segmentation:
    from the Lung Nodule Analysis (LUNA) competition(534个2D样本(512×512)和各自的标签图像,80%训练,其余测试)
    https://www.kaggle.com/kmader/finding-lungs-in-ct-data/data/

    4)cell contour segmentation(细胞轮廓):
    ISBI 2012(512512,30张训练,30张测试,测试的GT未公开)
    http://brainiac2.mit.edu/*
    5)retinal OCT layer segmentation(视网膜OCT层):
    TOPCON DATASET(由3D数据分离出的10个边界的2D图像)

  • 数据预处理:
    1)训练增强:(防止过拟合)水平翻转、垂直翻转和对角翻转,每幅图增加到8幅,然后做从90%缩放到110%,HSV颜色空间中的颜色抖动和图像随机移动等增强;
    2)测试增强:(提高医学图像分割方法的鲁棒性)包括图像水平翻转、垂直翻转和对角翻转(相当于预测每幅图像8次)。然后我们对8个预测进行平均,得到最终的预测图。

  • 实验设置:pytorch,Ubuntu 16.04系统,NVidia GeForce Titan显卡,内存12GB
    优化:SGD,批量大小为8,动量为0.9,重量衰减为0.0001;
    Poly learning rate policy:power= 0.9 、 initial learning rate=4e-3、maximum epoch= 100
    poly

  • 评估及结果:
    一看就懂的CE-NET详解_第4张图片
    在这里插入图片描述

一看就懂的CE-NET详解_第5张图片
一看就懂的CE-NET详解_第6张图片
一看就懂的CE-NET详解_第7张图片

一看就懂的CE-NET详解_第8张图片
一看就懂的CE-NET详解_第9张图片

一张图说明ImageNet pre-training的模型收敛更快

一看就懂的CE-NET详解_第10张图片

你可能感兴趣的:(神经网络,计算机视觉,深度学习,pytorch)