基于深度学习的医学图像分割学习笔记(六)V-Net

V-Net: Fully Convolutional Neural Networks for Volumetric Medical Image Segmentation

原文链接
代码pytorch版本
数据集:PROMISE2012

Vnet是Unet的一个变型,与Unet的不同点:
1.Vnet针对3D图像,不需要对输入集下切片处理
2.引入残差结构,加快收敛速度
3.卷积层代替池化层
4.提出了基于Dice系数最大化的新的目标函数

一、网络结构

基于深度学习的医学图像分割学习笔记(六)V-Net_第1张图片
网络的左边部分由一个压缩路径组成,右边部分对左边的信号进行解码,直到达到原始大小为止。网络中的卷积全部使用了适当的padding,进行尺寸控制,确保输出与输入图像尺寸一致。
网络的左侧分为不同阶段,以不同的分辨率运行。每个阶段由一到三个卷积层(卷积核尺寸为5×5×5)组成,提取图像特征。每个阶段都使用了残差学习,输入的feature map经几次卷积和非线性激活后得到的与输入的feature map逐点相加,在每个阶段结束后进行下采样(卷积核尺寸为2×2×2,stride=2),通过使用适当的步幅降低图像的分辨率,下采样后feature map大小减半,特征通道数量加倍。
网络的右侧也分为不同阶段与左侧对称,每个阶段由一到三个卷积层(卷积核尺寸为5×5×5,卷积核数量为上一阶段的一半)组成,在解码过程的每个阶段也使用了参数学习,在每个阶段之后执行转置卷积,将feature map大小加倍。
最后使用1×1×1的卷积,产生与输入体积大小相同的两个feature map输出,然后通过softmax,输出每个体素属于前景和背景的概率。
Vnet使用了与Unet类似的skip-connection结构,收集在压缩路径中会丢失的细粒度细节信息,提高网络的分割精度。

二、损失函数

我们感兴趣的解剖一般仅占据很小的扫描区域,这通常会使学习过程陷入损失函数的局部最小值,从而产生一个预测强烈偏向于背景的网络,导致前景区域经常丢失或仅被部分检测。为避免上述情况的发生,本文提出了一个基于dice系数的新的目标函数,它是一个介于0-1之间的量,我们的目标是使其最大化。
骰子系数:
基于深度学习的医学图像分割学习笔记(六)V-Net_第2张图片

你可能感兴趣的:(深度学习,计算机视觉,人工智能)