论文分享 Learning tree-structured representation for 3D coronary artery segmentation

Learning tree-structured representation for 3D coronary artery segmentation(2019.8)

摘要

冠状动脉的分割已经进行了广泛的研究,然而,由于其复杂的解剖结构,从三维冠状动脉ct血管造影(CCTA)中自动分割冠状动脉具有极大的挑战性。受近年来利用树状结构的长短期记忆(LSTM)来模拟具有树状结构的NLP任务的启发,我们提出了一种新的树状结构卷积门控递归单元(ConvGRU)模型来学习冠状动脉的解剖结构。然而,与针对自然语言处理中的语义关联和情感分类而提出的树结构LSTM不同,我们的树结构ConvGRU模型考虑了输入数据中的局部空间相关性,因为卷积适用于输入到端以及端到端的转换,因此更适合于图像分析。为了进行体素分割,我们提出了一种树状结构的分割框架。它由用于多尺度不同特征的提取和最终预测的全卷积网络(FCN),以及用于解剖结构建模的树状ConvGRU层组成。在四个大规模的三维CCTA数据集(据我们所知是最大的)上对所提出的框架进行了广泛的评估,实验表明,与其他冠状动脉分割方法相比,我们的方法更加准确和有效。

相关工作

1. Vessel segmentation

第一类方法需要在起点和终点之间建立一条最小成本路径,这是手动或自动预定义的( 3d MRA
coronary axis determination using a minimum cost path approach)。得益于利用更高层次的信息,它们往往会产生更符合解剖学的结果。然而,准确分割冠状动脉需要一个精心设计的成本函数来控制分割过程的迭代。

第二类方法的基本策略是产生一个预分割,然后恢复缺失的结构并去除假阳性分割( Automatic centerline extraction of coronary arteries in coronary computed tomographic angiography)。然而,它们需要相对准确的预分割来初始化细化过程。

第三类方法通过跟踪来实现血管的分割。他们反复决定下一个位置和血管的几何结构(如方位和半径)。这将显著降低计算成本,因为只需要探索图像体积的一小部分。不幸的是,这些技术对噪音、伪影和其他局部扰动也很敏感,因为它们只依赖于局部信息。
论文分享 Learning tree-structured representation for 3D coronary artery segmentation_第1张图片
图1. 从左到右:三维CCTA容积,相应的冠状动脉分段,以及冠状动脉的三个纵向视图。冠状动脉分段用红色表示。

2. Convolutional RNN models

到目前为止,过去的研究大多使用长短期记忆(LSTM)来处理梯度消失或爆炸的臭名昭著的问题,这是训练普通RNN模型时的一个重要问题。通过合并几个精心设计的门函数,LSTM减轻了这个问题。然而,输入到端和端到端的变化是基于LSTM中的完全连接层,忽略了输入数据中的局部空间相关性,因此,它不适合于图像序列的分析。最新提出的卷积LSTM(convlstm)用卷积运算代替了LSTM中的矢量乘法,它保留了输入的空间拓扑结构,同时在LSTM中引入稀疏性和局部性,以减少过参数化和过拟合。不幸的是,具有高度分支化和管状结构的血管是极其复杂的,而最初设计用于图像序列分析的convlstm不能处理这种复杂的树结构。虽然树结构LSTM被提出用于分析树结构数据(特别是在自然语言处理中的语义关联和情感分类),但是树结构LSTM单元中使用的向量乘法不适合于图像分析。相反,我们的树结构ConvGRU设计解决了这两个问题,即没有考虑复杂的树结构和输入数据中的局部空间相关性(图2)。

Methodology

1.1 LSTM & GRU

论文分享 Learning tree-structured representation for 3D coronary artery segmentation_第2张图片
论文分享 Learning tree-structured representation for 3D coronary artery segmentation_第3张图片

1.2 ConvLSTM

论文分享 Learning tree-structured representation for 3D coronary artery segmentation_第4张图片

2. Tree-structured ConvGRU

Sequential ConvRNNs无法处理树状结构的数据。为此,我们提出了一种新的树状结构的ConvRNN网络来提取树状结构的解剖学信息,其中父节点从其所有子节点选择性地聚集特征。例如,希望强调当存在较细动脉与主干动脉合并时,主动脉的几何结构和方向。

论文分享 Learning tree-structured representation for 3D coronary artery segmentation_第5张图片
图2. 从左至右:sequential ConvLSTM和提出的树结构ConvGRU。在ConvLSTM中,包括输入Xt、先前隐藏状态Ht-1和先前存储器Ct-1的信息按顺序传递(从t-1到t,然后到t+1)。与树结构的ConvGRU一样,它没有内存单元。信息从所有子节点传递到父节点。例如,此图中的节点j合并信息(来自其子节点l1和l2以及当前输入Xj的隐藏状态hl1和hl2)以生成当前隐藏状态Hj。节点k合并信息(来自其子j的隐藏状态hj及其输入Xk)以生成当前隐藏状态Hk。注意,尽管我们只显示树结构ConvGRU模型的一个或两个子节点,但它能够处理两个以上的子节点。

3. Artery centerline extraction

首先,我们从CCTA数据中提取冠状动脉中心线,它捕获冠状动脉的解剖结构。我们使用先前公布的方法(DeepCenterline)提取中心线。它是一种基于深度学习的方法,能够产生精确的(误差在单个体素内)中心线。这里总结了简短的流程。

  • 我们使用3D U-Net预分割冠状动脉。解剖结构是通过预分割获得的。尽管如此,仍然存在许多错误的预测。由于所提出的树型结构分割框架对不完全分割具有较强的抵抗力,因此本研究不需要精确的预分割。
  • 我们使用之前发表的基于深度学习的方法(DeepCenterline)进行中心线提取。更具体地说,通过训练的多任务FCN网络同时预测中心线的端点和距离图。
  • 最终的动脉中心线由最小路径算法生成。生成的中心线可以用树结构G=(V,E)表示,其中节点(表示中心线点)和邻接矩阵(表示中心线点之间的连接)分别用V和E表示。

4. Tree-structured segmentation network architecture

本文将冠状动脉分割问题描述为一个树状结构的分割问题,其中训练集是冠状动脉树的集合,预测值也被构建成树状结构。此工作中的输入树如下所示。对于动脉树G中的每个节点j,从中心线垂直方向的CCTA体积裁剪横断面图,我们进一步用主动脉强度和钙化阈值分别使这个小斑块标准化,以突出这两个重要区域。最后,将标准化的切片与原始切片连接起来,结果是一个与节点j相关联的树状通道图像xj。形式上,目标是学习一个非线性函数 ( H 1 , . . , H J ) = σ W ( x 1 , . . . , x J ) (H_1,.. ,H_J)=\sigma_W(x_1,... ,x_J) H1..HJ=σWx1...xJ,将树状结构输入映射到树状结构输出,其中J和W表示树中的节点数和要学习的参数。图3示出了所提出的树结构分割框架的概述。

在我们的网络中,我们将结构化信息建立在一个统一的神经网络中,该网络可以端到端地进行训练。它有三个模块:编码器、树结构的ConvGRU和解码器。编码器 ϕ \phi ϕ从输入数据中提取鉴别特征,得到每个节点j的多尺度表示xj。树结构ConvGRU模块 ψ \psi ψ建模冠状动脉的解剖结构,生成特征图Hj,编码新提取的解剖相关特征。基于由编码器和树结构ConvGRU生成的特征映射,解码器 φ \varphi φ生成最终预测Pj。

论文分享 Learning tree-structured representation for 3D coronary artery segmentation_第6张图片
图3. 对提出的树结构分割网络进行了综述。系统的输入是一个输入树V,即图像组织为树结构。输出P也被组织为树结构。树形分割网络由两部分组成:带编码器的FCN主干网 ϕ \phi ϕ用于判别特征学习和用于预测的解码器 φ \varphi φ,以及用于解剖结构建模的树结构ConvGRU层 ψ \psi ψ。FCN骨干网络和树结构的ConvGRU层由所有树节点共享。详细信息如图4所示。

4.1 Discriminative feature learning & tree-structured output generation

图4示出了用于特征提取和最终预测的骨干网络。它基于U-Net(Ronneberger等人,2015)架构。编码器,解码器将整个分割过程分为三个阶段:鉴别特征学习、解剖结构建模和树结构输出生成。

说明是用的2D U-Net

在鉴别特征学习阶段,输入与每个节点j相关联的图像xj进入编码器,其中包括几个3×3卷积层(每个卷积层后面跟着一个ReLU层)。两个2×2层也被用来对特征地图进行下采样。编码器能够从输入中提取鉴别特征 χ j = ϕ ( x j ) \chi_j=\phi(x_j) χj=ϕ(xj)。在解剖结构建模阶段之后,由树状结构的ConvGRU层生成隐藏状态Hj,解码器使用反卷积逐步将特征映射重新缩放到原始维度,同时合并从编码器传递的信息,得出最终预测Pj= φ \varphi φ(Xj,Hj)。编码器和解码器的细节如图4所示。
论文分享 Learning tree-structured representation for 3D coronary artery segmentation_第7张图片
图4. 详细介绍了提出的树型分割网络。编码器和解码器都由多个卷积层组成(每个卷积层后面跟着一个ReLU层,为了简单起见,该层被忽略)。对于与节点j相关联的输入图像Xj,它被传递到多个卷积层中,并由编码器中的池层逐步降采样,生成特征映射Xj。树结构的ConvGRU层接受输入Xj并生成隐藏状态Hj。在解码器中,来自树结构ConvGRU层的Hj逐渐向上采样到原始维度,同时合并来自编码器的信息,产生最终的预测Pj。

4.2 Anatomical structure modeling

树状结构ConvGRU的引入是由于冠状动脉树状结构中存在固有的解剖结构。例如,肾小管动脉由近端向远端逐渐变化,各节段的伸长和半径变化平稳。在我们的系统中使用树结构的ConvGRU有两个好处。首先,通过将编码器提取的特征反馈给树结构的ConvGRU,在树节点之间传播上下文信息。因此,最终的编码器不仅可以根据一个节点的特征进行预测,而且还可以考虑到沿冠状动脉树的拓扑变化。其次,如第3.2节所述,每个树节点可能存在多个分支,在这些特殊的位置,我们的系统能够对这些转换进行建模。树结构的ConvGRU层接受输入Xj并生成隐藏状态 H j = ψ ( χ j ) H_j=\psi(\chi_j) Hj=ψ(χj)

4.3 Loss function

即所有节点的平均Dice系数

论文分享 Learning tree-structured representation for 3D coronary artery segmentation_第8张图片

Experiments

我们收集了四家医院的四个大数据集(共916次CT扫描)。这些合作医院是从不同地区挑选出来的,代表着医疗环境的多样性。80%、5%和15%的扫描分别用于训练、验证和测试。
论文分享 Learning tree-structured representation for 3D coronary artery segmentation_第9张图片
论文分享 Learning tree-structured representation for 3D coronary artery segmentation_第10张图片

你可能感兴趣的:(医疗图像分割,论文分享)