CNN用于医学图像轮廓检测的最近发展 论文阅读

Recent Advances in the Applications of Convolutional Neural Networks to Medical Image Contour Detection 是一篇关于神经网络用于医学轮廓检测的综述。


摘要:
深度学习技术,由于其快速发展,已经成为医学图像分析中很多机器学习问题的主要解决方案。深度卷积神经网络(DCNN),作为深度学习技术中最重要的分支,被广泛应用到各种计算机辅助诊疗技术中,包括长期存在的和不断涌现的问题。图像轮廓检测是一个基础又具有挑战性的问题,已经有四十多年的研究历史。近来,由于CNN的发展,我们已经见证了轮廓检测方面极大的性能提升。除了在现有的自然图像数据集上追求好的表现,轮廓检测也在医学图像中发挥重要作用。放射图像和病理图像中的各类物体分割都需要对轮廓的准确检测。然而,有些问题,如不连续性和形状限制,其在CNN中的研究并不充分。因此,很有必要去阐明这些挑战性来鼓励新的探索。目前,基于CNN的轮廓检测方法的表现主要依赖于先进的CNN结构。对这些网络结构的设计思想和动机进行仔细的研究有助于轮廓检测。在这篇文章中,作者首先回顾了近年来医学图像轮廓检测的发展,并指出目前的前沿问题和挑战。然后谈论了一般CNN的发展和其在图像轮廓(边缘)检测上的应用,并对这些方法在细节上进行比较,阐明其优缺点。然后回顾最近这些网络在医学轮廓检测的应用和局限性,希望由此能够指出一些医学图像分析上的潜在方向。

医学图像轮廓检测综述

1. 挑战性和重要性

自然图像通常会包含多种类的语义对象,而医学图像则偏向modality-specific。特定模态的医学图像中,目标内部和物体之间的语义及纹理信息较少。因此,往往是目标的形状和结构在医学图像分割中起到了重要作用。
在图像获取和处理过程中的质量下降(噪声)也是个重要问题。噪声降低了真实边缘的可见度并引入了伪边缘信息。传统方法尝试在边缘检测前使用去噪算法,有一定的效果,但是并不promising。相对而言,利用目标物体先验知识的全局方法更能够克服局部噪声的影响。所以,一个好的轮廓检测算法,精细的边缘检测和物体的全局轮廓理解同样重要。
医学图像中,如何不受遮挡和伪影的影响,获取相连或重叠物体之间的(弱,破损)边缘是个长期存在的问题。有些时候检测这些视觉不可见的边缘几乎是不可能的,一个可行的补救方法是将破损的边缘连接起来。这个问题是边缘检测中一个active的研究主题。早期,可变型模型是一种流行的技术,能够保证轮廓的连续性和光滑性,比如参数化和非参数化的主动轮廓模型。但是,由于基于特定的假设,这一领域目前不再流行。最近,Deep active contours使用神经网络来预测主动轮廓的演变。
除了直接的轮廓检测,一些文献研究如何从一系列不连续的轮廓段来得到全局的轮廓。但是由于其很强的先验假设,如对称性等,这些方法在实际数据集场很难应用。此外,有一些使用CRF,RNN和Autoencoder来完成轮廓补全的文章,如Shape Completion with Recurrent Memory。
人类能够从那些视觉不可见的地方推断出存在的轮廓,其中推理在这一过程中非常重要。进一步分析,应当与以下两个因素有密切的关系:
1. 基于周围信息的推理。
2. 对于Appearance的先验记忆。
这两种推理都大量利用需要context信息。然而,目前大多数CNN并没有把注意力放到这种类型的context信息中。目前语义分割任务中,很多工作利用CRF和MRF来结合context,但是对于边缘检测,这种方法是困难的,因为边缘含有较少的语义信息,需要对目标形状和结构更深的理解。Occlusion boundary detection via deep exploration of context 利用CNN中的深度信息实现被遮挡边缘的检测。
此外,对于有限标记数据的高效学习是一个重要的课题,因为医学图像中大量级的训练数据是难以获得的。然而CNN通常都需要大量数据来训练,所以半监督和无监督以及迁移学习在最近得到了讨论。Deep convolutional neural networks for computer-aided detection: Cnn architectures, dataset characteristics and transfer learning. 是一篇针对医学图像的迁移学习文章。同时,在网络结构上好的设计能够提高参数利用到的效率。

总结一下:
医学图像的特点是:1)modality-specific; 2)纹理和语义信息少;3)噪声严重
解决方案:1)边缘和轮廓检测; 2)从破损的边缘中连接出轮廓
具体方法:1)context信息; 2)先验记忆; 3)学习方法

2. 早期医学图像轮廓检测

在深度学习兴起之前,轮廓检测有很多方向, Robust nucleus/cell detection and segmentation in digital pathology and microscopy images: A comprehensive review. 是一篇很详细的综述。
按照发展流程大约如下:
1. 基于灰度的阈值分割。缺点是不适用于复杂的图像。
2. 基于分水岭的分割。缺点是容易因为噪声的影响导致过分割。Deep Watershed Transform for Instance Segmentation将其和深度学习结合起来。
3. 基于活动模型的分割。其中具有代表性的有水平集,参数模型(Snake,GVF)。An automatic learning-based framework for robust nucleus segmentation 在分割中结合了形状先验模型。这类方法的一个缺点是需要合适的初始化,同时我个人觉得演化过程中和图像的交互比较rigid,对于图像质量有较高要求。
4. 基于图模型的分割。对图像建立图模型,然后利用minicut算法求解。Normalized cut是其中比较优秀的一种。
5. 传统机器学习分割算法。其中基于piexl-wise的分类通常需要后处理来连接断裂的部分。基于superpixel-wise分类的算法提高了效率,但是形成superpixel的过程需要很好的贴合图像边缘。这类方法一个比较显著的缺点是:需要人为设计特征,这在很多医学应用中难以实现,或者说可行性较低。

CNN

这一部分我先略过

图像轮廓检测

作者首先简要回顾边缘/轮廓检测的历史,然后介绍基于CNN的新型轮廓检测方法。接下来介绍一些重要的端到端的CNN网络,实现了目前最好的轮廓检测方法。最后,指出现用方法的不足之处。
原则上来说,好的边缘/轮廓检测算法能够检测到目标轮廓而忽略物体内部或背景中的边缘。目前有一些方法在医学图像中获得成功的应用,但尚有一些advanced方法没有应用到医学图像中,文章将会讨论他们的优缺点,并阐述将其对医学图像的益处。
CNN用于医学图像轮廓检测的最近发展 论文阅读_第1张图片

1. 轮廓检测的历史回顾

早期的代表:Canny通过局部信息得到边缘。其后的方法往往结合多尺度下的global和local的cues实现。其中有基于1)局部方向滤波器;2)谱聚类;3)稀疏重建;4)监督学习等等。具体可以看Edge and line oriented contour detection:State of the art。
CNN之前有几个代表性的边缘检测方法,至今仍在使用。
1. Global probability of boundary(gPb)。其在多尺度下计算局部有向梯度特征(亮度,颜色和纹理),然后通过normalized cut计算全局的谱分类来实现全局轮廓检测。在这个基础上,有oriented watershed and ultrametric contour map(OWT-UCM),multiscale combinationrial grouping(MCG)等方法。gPb方法一个主要缺点是效率低,1/240 FPS。
2. Structured Edge(SE)。这是使用随机森林进行边缘检测最成功的代表。其主要思想是利用结构化的学习,稠密的预测structures of patches,如直线,平行线,曲线,T连接,Y连接等等。这种方法的效率非常高,60 FPS。Robust muscle cell quantification using structured edge detection and hierarchical segmentation 将其应用到病理切片上。

2. CNN用于轮廓检测的先驱

为什么把这类方法叫做先驱,因为他们从传统思想中的edge patterns,structures 和多尺度等观念出发,利用了CNN对一个围绕一个中心点的pathes进行是边缘或者非边缘的判断。其中比较经典的是DeepEdge和DeepContour。
1. DeepEdge 使用多个层的特征输入到两个任务分支中。其中分类分支输出像素点是边缘的概率,the other regression branch is trained to learn the fraction of human labelers agreeing about the edge presence at a given pixel。最后结合两个输出来预测边缘。
2. DeepContour从局部patches中提取特征,并将这些特征作为额外的输入连同图像输入SE中。SE会将这些局部pathces分成不同种类的edge patterns。DeepContour首先训练CNN来生成丰富的特征,然后训练SE来预测边缘。通过这样一个过程,DeepContour在上述方法中取得了最好的效果。但是在效率上还是逊于SE。

3. FCN

FCN的引入引领了使用CNN进行dense predict的潮流。一方面使得实时的预测成为可能,另一方面大幅度提高了效果。
其改动点:
1. 去掉了全连接层,改成1*1的卷积。相对于分类来说,每个像素点只利用了其位置上的fm,而不是整个fm?
2. 利用转置卷积提高分辨率。
3. side outputs来利用多个卷积层的特征。

4. HED

HED是第一个将FCN成功应用到轮廓检测上的神经网络。其主要的贡献就在于side outputs和deep supervision。 HED中的side outputs不像FCN中直接结合起来或者DeepEdge分离的标签(?),HED中每个side output都直接用于预测edge。所以其网络的loss定义为:
Lside(W,w)=Si=1αiLiside(W,w)
由于边缘像素点的个数明显少于非边缘像素点,因此为了解决不平衡的两类问题,作者引入了weighted loss:
Liside(W,w)=βyY+logPr(yi=1|X;W,wi)(1β)yYlogPr(yi=0|X;W,wi)
where β=|Y||Y|
最终,所有的loss被融合起来,形成最后的输出:
Lfuse=Distance(Y,SiγiY^(i))
分析: 通过对多尺度特征的复用,Side-output with deep supervision对于dense predict的效果有很大提升。
其后有很多基于HED的改进和发展,RCF达到了目前BSDS500上最好的检测效果。HFL结合了MLP,并将其应用到语义轮廓标记和语义分割。Deep learning convolutional networks for multiphoton microscopy vasculature segmentation和Gland instance segmentation by deep multichannel side supervision是基于HED的医学图像应用。

5. Encoder-Decoder network

Encoder-Decoder network和DeconvNet有着非常相似的结构,但是其encoder和decoder部分是非对称的。其Encoder部分采用VGG-16的网络,Decoder部分没有采用deconvolution layer,而是使用unpooling+convolution layer。由于Decoder部分所利用的信息来自VGG的最后一个卷积层,因此对于非轮廓的边缘有较好的鲁棒性。所以这个网络在轮廓检测上的效果优于HED(57.0 ODS vs. 44.0 ODS),但是在边缘检测上的效果要略逊于HED。

6. Oriented contour detection

这种方法的思想不是很理解,感觉像是用多种专用网络去检测不同固定方向的边缘,然后综合起来。关于这方面CNN的研究比较少,文章介绍了两个网络。
Affinity CNN 使用48个预测器来预测每个像素点和其周围8个像素点在3种尺度下的affinity。其监督信息有预先计算的affinity matrix和图像边缘GT。
Convolutional Oriented Boundaries(COB)首先基于HED的思想得到初步edge map,然后利用多个small sub-network来对每个方向预测oriented edge map。为了得到每个像素点的最终方向,COB计算sub-network中最大响应。COB测试了VGG-16和ResNet,最终选择了50层的ResNet,并强调合适的基础网络结构能够对结果又较大的提升。

7. 弱监督,半监督和无监督

这一部分文章首先介绍了之前看过的Unsupervised Learning of Edges。这是一篇利用视频信息的无监督边缘检测方法。然后介绍了Learning relaxed deep supervision for better edge detection, 其中Relaxing label是有canny,SE和HED提供的,并利用“delayed strategy”处理其中的假阳性边缘。总的来说,这一部分在医学图像中很重要但是需要更多的研究。

医学图像中基于CNN的轮廓检测和语义分割

CNN用于医学图像轮廓检测的最近发展 论文阅读_第2张图片
[34]采用CNN作为patch-wise的像素点分类器来分割细胞膜,属于Pioneer类型的工作,赢得了ISBI 2012 细胞膜分割竞赛的第一名,并且明显超过当年其他方法。
[52]中针对细胞膜分割对CNN结构进行了改动,采用了更小的感受野和更深的网络。这样能够增加网络对于局部的非线性程度,从而提取更好的特征。结果在ISBI 2012上获得明显提高。
[194]利用多个不同尺度的预训练CNN来进行pixel-wise的分类,然后使用不同特征去定位目标轮廓并分离有黏连的物体。
其后大部分轮廓检测和分割方法都沿用了FCN和HED的结构。
[171]提出了U-net,并利用weighted loss来惩罚黏连细胞。在当时获得了ISBI 2012的最好结果。
[29]是现在ISBI 2012上的最好结果。他的结构与HED较相似,不同之处在于他通过辅助分类层来结合不同CNN层的输出获得最终分类结果。这样能够在前向传播过程中,更好的结合不同层的上下文信息?
[28]提出一种contour-aware的网络,利用side output做多任务的deep supervision(一个分支输出分割,一个分支输出轮廓),最后利用轮廓信息来防止细胞的黏连。这个结果赢得了2015 MICCAI Gland Segmentation Challenge。
[224]提出多通道的side supervision CNN来分割gland,这项工作可以被看做FCN和HED的结果,同时进行分割和轮廓检测。[150]提出了相似的网络结构。[19]提出一个利用CRF的数据融合过程来考虑分割和轮廓检测的结果。[172]使用基于空间信息的随机森林来整合语义分割和边缘信息。[139]利用多层特征进行多任务学习。[153]提出结合解剖学先验知识到CNN中。
最近两年,3D的图像分割获得较多关注。[46]扩展HED至3D并利用CRF来refine轮廓。[[33]]提出3D-Unet。[145]提出V-net,提出基于Dice的loss function来解决数据不平衡问题。
除了直接利用CNN,RNN和CNN的结合也是一个热点。[[198]]提出使用层叠的autoencoder来回复破损的轮廓。[90]基于无监督的多尺度CNN来完成胸部的dense分割。[227]利用RNN来完成超声图像中不清晰和破损轮廓的恢复。[30]利用RNN来结合2D的分割结果。[174]使用神经网络来预测主动轮廓的演化向量。[144]提出hough-CNN,通过投票机制来定位解剖中心线。最近,[146]结合CNN和动态系统完成心脏轮廓检测。这篇文章利用动态系统中的重要概念,有限循环来表示目标轮廓。将对于每个像素点的分类改成对每个像素点预测向量,根据得到的向量场,通过动态系统来检测轮廓。这个方法所需要的训练数据很少。

讨论

目前医学图像中轮廓检测和分割进入了一个比较窄的框架中,大多数方法利用端到端的CNN实现dense predict。作者提出了医学可能的发展方向:
1. 多尺度。以HED为例,HED一方面充分使用了CNN中的特征,另一方面也可以看做一种resembling。从ResNet到DenseNet,跳跃结构带来的特征复用有很好的实践效果。关于Side output中的deep surpervision,在底层往往会有较大的loss,这会影响到网络的收敛性,在实践中是需要谨慎对待和使用的。
2. 迁移学习。U-net展现了dense predict的CNN可以从少量样本中学习的能力,但是作者仍然相信迁移学习能够带来更多的图像理解,解决医学图像训练数据不足的问题。比如low-level和high-level的视觉相关性提示我们应当利用自然图像中CNN的浅层特征。
3. 边缘的不连续性。CNN在检测边缘上有强大的能力,但是对于不可见边缘,或者物体重叠导致的边缘消失,如何弥补是一个重要问题。RNN是目前较新的的解决方案,如何在RNN中输入更多的边缘特征来提高效果。此外,使用形状先验是个很好的办法,因为医学图像中的目标物体往往具有相似的结构。Learning shape priors for object segmentation via neural networks使用CNN来控制形状的演化。不过与CNN结合更加密切的方法是将形状信息结合到loss中或者形成关于轮廓的结构化输出。如Deep active contours和Deep Poincare Map for Robust Medical Image Segmentation。
4. 其他。如何使用小样本训练。如何对抗高的噪声。Fast detection of curved edges at low snr

你可能感兴趣的:(论文阅读)