【医学+深度论文:F20】2019 CVPR Attention Based Glaucoma Detection: A Large-scale Database and CNN Model

20

2019 CVPR
Attention Based Glaucoma Detection: A Large-scale Database and CNN Model

Method : 分类
Dataset :LAG 5824 fundus (2392 G,3432 N)、 RIM-ONE
Architecture : AG-CNN | attention
Results :LAG AC 95.3% SE 95.4% SP 95.2% AUC 0.975
     RIM-ONE AC 85.2% SE 84.8% SP 85.5% AUC 0.916

Methods

医学图像识别中存在冗余

注意力机制

注意机制的基本思想是定位深度神经网络(DNNs)中特征最显著的部分,从而消除视觉任务中的冗余。

  • 自我学习的方式生成,其他信息比如标签对注意图的监督较弱
  • 利用人类的注意力信息来引导DNNs聚焦于感兴趣区域(ROI)。
【医学+深度论文:F20】2019 CVPR Attention Based Glaucoma Detection: A Large-scale Database and CNN Model_第1张图片

目前还没有将人的注意力融入医学图像识别的研究。主要是因为缺乏医生注意数据库,这需要合格的医生和在诊断中获取医生注意的特殊技术。
因此,本文首先收集了一个大规模的基于注意力的眼底图像数据库用于青光眼检测(LAG),包括5824张带有诊断标签的图像和人类注意力GT。

Dataset

LAG

  • fundus
  • 5824 (2392 G,3432 N)
  • beijing Tongren Hospital

Data analysis

  • The ROI in fundus images is consistent across ophthalmologists for glaucoma diagnosis.
  • The ROI in fundus images concentrates on small regions for glaucoma diagnosis
  • The ROI for glaucoma diagnosis is of different scales.
    ROI is small, its scale is various across all the fundus images.

PipeLine

  • Framework

【医学+深度论文:F20】2019 CVPR Attention Based Glaucoma Detection: A Large-scale Database and CNN Model_第2张图片

每个conv后都有 BN 、ReLU

  • Attention prediction subnet
    • aim : to generate the attention maps of the fundus images
      学习青光眼检测的ROI,预测人类对青光眼诊断的注意力。
    • input: RGB fundus image (224×224×3)
    • network: 1 conv7×7,1 max pooling, 8 building blocks (ResNet block),FN ,multi-scale
    • output: gray attention map ( 112×112×1)
【医学+深度论文:F20】2019 CVPR Attention Based Glaucoma Detection: A Large-scale Database and CNN Model_第3张图片
  • Pathological area localization subnet

    • aim : to visualize the CNN feature map
      将预测的注意图嵌入到 Pathological area localization subnet 中,然后可视化该子网的特征图,定位病理区域。

    • input: Fundus Image , gray attention map

    • network: 1 conv7×7,1 max pooling,4 Multi-scale Building Block , FC , Guide BP

    • output: the visualization map of pathological area (112×112×1)

    通过 Guide BP 从全连接层输出到输入RGB通道眼底图像,得到病理区域可视化图

【医学+深度论文:F20】2019 CVPR Attention Based Glaucoma Detection: A Large-scale Database and CNN Model_第4张图片
  • Glaucoma classification subnet

    • aim : classification of glaucoma
    • input: Fundus Image , the visualization map of pathological area
    • network: 1 conv7×7,1 max pooling,4 Multi-scale Building Block , FC
  • Loss

3
- attention prediction loss
- pathological area localization loss
- glaucoma classification loss

Result

Experience

  • 分别和其他两种2018年算法比较在 LAG、RIM-ONE 数据集上的效果
  • Evaluation on attention prediction and pathological area localization
  • 比较了本文结构去掉不同的 subnet 效果
    • 有无预测注意图的病理定位结果:使用注意图可以有效地定位病变区域
    • 评估预测注意图和所定位的病理区域对青光眼检测性能的影响
      注意预测子网和病理区域定位子网能够提高AG-CNN青光眼检测的性能
      只植入病理区域定位子网而不植入注意预测子网的效果甚至比同时去除二者还要差
    • Resnet 可以提高检测性能
    • multi-scale 可以提高检测性能

Discussion

本文的主要贡献是:

(1)建立了一个包含5824幅眼底图像的数据库,图片、标签、注意图。
(2)将注意力图合并到AG-CNN中,这样可以去除眼底图像的冗余,用于青光眼的检测。
(3)我们开发了一种新的AG-CNN架构,将用于病理区域定位的CNN feature maps可视化,然后对双眼青光眼进行分类。

你可能感兴趣的:(Medical)