MICCAI2019论文详解Multi-task Neural Networks with Spatial Activation for Retinal Vessel Segmentation and Artery/Vein Classification
论文:基于空域激活神经网络的眼底视网膜血管动静脉分割
Wenao Ma, Shuang Yu, Kai Ma, Jiexiang Wang, Xinghao Ding, Yefeng Zheng:
Multi-task Neural Networks with Spatial Activation for Retinal Vessel Segmentation and Artery/Vein Classification. MICCAI (1) 2019: 769-778
论文地址:
https://link.springer.com/chapter/10.1007%2F978-3-030-32239-7_85
https://dblp.uni-trier.de/pers/hd/z/Zheng:Yefeng.html
目录
一、概览
1.1 贡献点
1.2 方法
1.3 成果
二、背景
2.1 基于handcrafted与graph的方法
2.2 基于FCN(Fully convoution Network)的方法
2.3 本文方法
三、方法
3.1 模型架构
3.2 多输入
3.3 Spatial Activation
3.4 deep supervision
四、实验及结果
4.1 数据集及实验
4.2 Ablation studies模型简化测试
4.3 与现有方法比较
五、结论及个人总结
视网膜血管分割在疾病诊断过程中起到重要作用。本文:
输入端:
引入了域知识,加入了视网膜血管的增强方法
输出端:
在输出模块引入空域激活(spatial activation)机制
引入deep supervision使得网络的浅层可以提取更具有semantic的信息。
在AV-DRIVE数据集上,无论是血管分割还是动静脉分割都达到state of the art的准确率
一般的视网膜血管分割分为两个阶段,第一个阶段分割出眼底血管,第二个阶段分割出动脉和静脉:
基于特征的分类方法:将handcrafted feature作为提取特征的依据:
基于graph的方法:将眼底血管构建为graph,基于节点分析和graph分析来作为分类的依据,然后将graph tree分类为动脉和静脉:
这两种方法的缺点:前阶段血管分割的误差或者错误会直接导致动静脉分割表现不佳。对于handcrafted feature而言,过度依赖于血管中心线。对于graph而言,过度依赖于graph的构建。
近年来,基于FCN的方法成为主流。
将FCN应用为编码器-解码器:
FCN方法主要对于血管宽度大于3像素点有效:
缺点:现有方法容易将血管的一些像素分割为背景,特别是对于一些毛细血管分割效果较差。
将原始的图像增扩为IC:illumination correction光照增强的图像,VE:血管增强图像
图像切为patches,然后送入下文所讲的深度学习架构之中,然后深度学习模型同时输出血管,动脉,静脉的分割结果。
已有的方法,引入了邻域知识。
网络结构如图:
用Unet架构,提前用Resnet预训练作为encoder。在输入之前,加入了expanding compressing层,将输入映射到高维空间,再将相应的featuremap进行压缩到3维。因此输入通道可以与resnet相符合。
神经网络可以学到更加descriminative的feature。但是神经网络如果仅仅学习动静脉分割,则会对细小毛细血管的分类效果不佳。因此,希望神经网络可以更好的从动静脉分割中提取特征。
在输出阶段,设计了两个并行的模块。第一个模块提取出动静脉分割的概率,第二个将条件概率进行融合并且生成最终的动静脉分割的结果。
为了更好的输出毛细血管,本文设计了一个激活模块:
因此潜在的毛细血管就会被激活。
本文在resnet block的Encoder模块后加入了deep supervision
同时,相应的Loss函数也被设计,包括三项:二值的交叉熵,loss of deep supervision模块,weight decay regularizaiton term
AV-DRIVE数据集包括20张训练样本,20张测试样本,像素大小为584×565像素,每个像素标注为血管和动静脉血管。
训练过程中,每个图像被分为64×64大小的patch。
测试阶段,图片按照stride为10进行切分,然后将相应的预测输出拼接。带momentum的SGD被应用,并且迭代了60000次iter,batchsize为16.
综合实验分析被应用于模型之中,用来分析几个模块的作用。多任务MTs(Multi-task),多输入Multi-input (MIs) and 空间激活spatial activation mechanism (AC)。
本文进行了四个实验。
最好的性能就是三个模块都加上的性能。
将血管分割与动静脉分割结合作为multi-task,两个任务的效果可以相互增强。
输出阶段设计了一个multi-task output block,并且加入activation机制。利用相对简单的血管分割的结果提升动静脉分割的结果。特别有利于提升毛细血管的检测结果。
输入模块引入了领域知识,并且加入了filter based的血管增强方法。
Deep supervision被引入到网络早期的encoder模块,用于将low-level的特征提取出更加semantic的信息。
在AV-DRIVE数据集上,无论是血管分割还是动静脉分割都达到state of the art的准确率