DCU-Net: Multi-scale U-Net for brain tumor segmentation

论文:4区 2020
数据集:BraTS 2018

1. Introduction

胶质瘤是发生在大脑中最常见的原发性肿瘤类型之一。它由胶质瘤细胞生长而成,可分为低级和高级胶质瘤。高等级胶质瘤(HGG)更具侵略性和恶性,预期寿命最多两年,而低等级胶质瘤(LGG)可以是良性或恶性的,生长更缓慢,预期寿命为几年[1].良性肿瘤一般在手术后恢复,恶性肿瘤因其难治性而难以治愈。它严重危害人类健康,因此,如何更好地诊断和治疗它是至关重要的[2]。

随着医学影像技术的发展,影像技术在疾病诊断中的作用也越来越重要。医学影像技术主要包括X射线检查、计算机断层扫描(CT)、超声波和磁共振成像(MRI)等。其中,MRI由于其清晰度和组织分辨率,可以提供多种信息诊断能力,通过设置不同的参数实现多种解剖断层成像。此外,磁共振成像是非侵入性的,在不接受高电离辐射的情况下提供详细的图像形状、尺寸和位置信息。因此,它在脑瘤的诊断、治疗和手术指导方面引起了越来越多的关注。脑瘤分割在目前的诊断和治疗中是有效的。通过对脑肿瘤的分割,医生可以测量脑肿瘤的位置、大小和其他参数,确定肿瘤的生长状态和变化过程,对脑肿瘤进行定量分析和随访比较。

传统上,胶质瘤的判断和分期主要依靠放射科医生的经验和直觉,导致诊断的稳定性和可靠性差。通过准确可靠地将医学影像转换为量化的数字特征,放射组学通过描述肿瘤病变的微环境,为胶质瘤的自动检测和判断提供了有效的解决方案[3-5]。此外,通过提取个体患者的个性化特征,它在计算机辅助诊断和计算机辅助手术和放疗以及胶质瘤患者的医学研究中也被证明是有效的。随着大规模标注数据的出现和计算机技术的发展,利用卷积神经网络(CNN)对脑瘤进行自动分割已成为当前研究的热点。脑瘤分割可以是一个语义分割的任务。完全卷积网络(FCN)[6]建立了一个CNN结构,被广泛用于语义分割的任务。Ronneberger等人[7]在全卷积网络模型的基础上提出了用于医学图像分割的U-Net模型。U-Net和FCN都具有经典的编码-解码拓扑结构,但U-Net具有对称的网络结构和跳过连接,U-Net在脑肿瘤图像分割中的表现比FCN更好。

由于结构简单明了,U-Net很快发展成为医学图像分割中常用的基准[8]。基于U-Net的分割方法大致可以分为两类,二维U-Net结构和三维U-Net结构。

A. 基于二维U-Net结构的研究。随着网络的深入,U-Net会丢失一些细节特征信息,导致目标边界的模糊分割。因此,大多数研究者选择在U-Net的基础上进行多特征尺度的特征融合。Alom等人[9]提出了一个递归U-Net模型和一个递归残差U-Net模型,在网络参数相同的情况下,设计了更好的UNet架构,并通过实验证明该模型在视网膜图像分割、皮肤癌分割和肺部病变分割任务中具有更好的性能。Zhang等人[10]提出利用全卷积残差神经网络UNet的深度学习,对乳房MRI中的乳房和纤维腺组织(FGT)进行自动分割。由于引入了残差结构,该模型可以在MRI上获得准确的乳房和FGT的分割结果。Seo等人[11]在U-Net的跳过连接处增加了一个带有去卷积和激活操作的残差路径,以避免特征的低分辨率信息的重复。此外,提议的架构在跳过连接中增加了卷积层,以提取小物体输入的高层次全局特征以及大物体输入的高分辨率边缘信息的高层次特征。使用2017年肝脏肿瘤分割(LiTS)挑战赛的公共数据集,证明了修改后的U-Net(mU-Net)的功效。Ibtehaz N等人[12]在U-Net的基础上提出了Multi Res-Unet,增加了剩余连接的扩展,并提出了剩余路径,在ISIC,BRATS等数据集上验证了其良好的分割性能。

B. 三维U-Net结构的研究。三维网络结构可以充分利用MR图像的三维特征,获得更准确的分割结果。因此,一些研究者选择在U-Net的基础上使用3D卷积核来提取肿瘤的特征。Isensee等人[8]提出了一个医学图像分割框架,可以适应任何新的数据集。该框架可以根据给定数据集的属性自动调整所有的超参数,无需人工干预。Nnu-net仅依靠两个三维U-Net级联和强大的训练方案,在六个公认的分割挑战中取得了最先进的性能。Myronenko[13]设计了一个基于编码器-解码器结构的语义分割网络,用于从三维MRIs中分割肿瘤子区域。由于训练数据集大小有限,为了使共享解码器正规化并对其层施加额外的约束,增加了一个变异自动编码器分支来重建输入图像本身。该方法获得了BRATS 2018挑战赛的第一名。Chen等人[14]提出了一种新颖的Separable 3D U-Net结构,它分别利用了片内和片间表示,该模型在BRATS 2018数据集上的DSC得分达到了0.88。

可以发现,研究人员通过构建二维网络结构对输入的三维数据进行切片,并转换为二维数据输入,从而使网络在普通硬件设施上完成网络参数的快速训练。三维网络结构可以充分利用MR图像的三维特征,获得更准确的分割结果。但由于训练网络的参数较多,网络很难从头开始训练,而且存在GPU和内存消耗过大等问题,对计算机硬件设施要求较高。因此,研究人员在脑瘤分割的任务中更倾向于采用二维网络。

Ronneberger[7]采用了上卷积层,这对于恢复卷积网络中池化层的下采样过程所丢失的信息很有帮助。显然,这种技术只能够恢复部分丢失的信息。因此,这种图像识别技术的准确性仍然有限。为了解决这一局限性,Chen等人[15]采用了扩张卷积来提取更密集的特征图,而不使用预先训练好的网络的最后几层的下采样操作。Guillaume等人[16]提出了一个带有稀释卷积的全卷积网络,用于手写文本行的分割,并取得了比FCN更好的分割结果。Vo等人[17]研究了扩张卷积的级联结构和多分辨率输入图像的深度网络结构对语义分割的准确性的影响。结果表明,多分辨率输入图像的深度网络结构通过聚合多尺度的上下文信息提高了语义分割的准确性。可以看出,在CNN中加入稀释卷积可以提高网络的学习能力,获得更好的分割结果。

经典的U-Net方法在分割脑瘤的任务中表现良好,但它仍然存在一些问题。一方面,训练数据集中存在严重的类不平衡问题,这使得模型对小目标的特征学习不足,最终影响了分割的准确性。另一方面,U-Net模型下采样路径中的细节信息损失问题也没有得到解决,尤其是池化操作,严重降低了特征图的分辨率。针对U-Net方法在这两方面存在的问题,我们提出通过对训练数据集进行预处理,在U-Net模型中引入扩张卷积,通过扩张卷积弥补特征图的分辨率,建立一个比U-Net更高的脑肿瘤分割模型。

你可能感兴趣的:(DCU-Net: Multi-scale U-Net for brain tumor segmentation)