M-net: A Convolutional Neural Network for deep brain structure segmentation

论文链接:M-net: A Convolutional Neural Network for deep brain structure segmentation | IEEE Conference Publication | IEEE Xplore

摘要:

M-net:端到端可训练卷积神经网络(CNN)架构

用途:从磁共振图像(MRI)中分割深度(人类)大脑结构

M-net操作的是3D数据,但它只使用了2D卷积>提高效率

实验指标是骰子系数


设计目的:

在输入级利用一个切片周围的3D信息,在第一个阶段之后只对2D信息进行操作,以产生一个标记的切片作为输出。这确保了标签在片间的一致性和准确性,而不使用任何后处理步骤,这在短期内减少了运行时和内存需求。


M-net框架:

M-net: A Convolutional Neural Network for deep brain structure segmentation_第1张图片

 实心蓝色方框表示多通道特征图。蓝色框代表复制的特征图。通道的数量在方框的顶部表示

一个切片s和它的邻居组成一个堆栈s-n:s+n作为输入。n的值是由经验决定的。这使我们能够利用3D信息。切片堆栈通过一个3D -2D转换块传递,该转换块学习一个大小为7x7x(2n+1)的3D卷积滤波器,将2D切片堆栈组合成一个单独的2D切片s¯。然后通过M-net架构进行处理,以获得所需的分割。因此,整个卷的分割是一片一片地完成的。

        M-net主要有4条2D滤波器的路径:两条主要的编码和解码路径,以及两条侧路径,这两条侧路径赋予了我们的架构深度监督的功能。每个途径有4个步骤。

在编码路径中,每一步都有一个大小为3x3的2D卷积滤波器级联和2x2的maxpooling,这将输入的大小减少了一半,并允许网络学习上下文信息。在卷积滤波器的级联中,引入跳接,使网络能够更好地学习特征。解码层与编码层相同,但有一个例外:maxpooling被上采样层取代,将输入的大小增加一倍,并恢复原始大小的输出图像。

在相应的编码层和解码层之间也实现了跳跃式连接,以确保网络有足够的信息导出图像的细粒度标记,而不需要任何后处理。左操作s¯,有4个大小为2x2的maxpooling层,输出作为相应编码层的输入。右向上采样每个解码层的输出到s¯的原始大小。

解码层和右的输出由L个通道的1x1卷积层处理,其中L是包括背景在内的感兴趣结构的数量。在每一步和每一卷积层后分别使用Dropout(概率为0.3)和批归一化(BN)来减少过拟合。对于除最后一层之外的所有层,每个卷积层之后都应用一个ReLU激活。对于最后一层,应用softmax激活,给出每个体素属于不同结构的概率。

采用加权分类交叉熵函数来解决分类不平衡问题。这种损失函数和权重的定义是,当特定类中的体素更少时,权重就会增加。 M-net的优点是除一个3D卷积滤波器外,所有其他滤波器都是2D滤波器,这允许以相当低的内存需求(~ 5GB)对网络进行端到端训练。

你可能感兴趣的:(框架,深度学习)