论文笔记 | 基于深度学习的乳腺转移瘤识别(Deep Learning for Identifying Metastatic Breast Cancer)

论文阅读笔记:原文链接

摘要

  1. 生物医学图像国际研讨会(International Symposium on Biomedical Imaging,ISBI)举办了一个在前哨淋巴节点全幻灯图中自动检测转移性乳腺癌的挑战赛。
  2. 该队全幻灯图分类准确AUC准确率为0.925,癌细胞定位得分为0.7051。病理学家的分类AUC准确率为0.966,癌细胞定位得分为0.733。
  3. 将病理学家诊断和深度学习系统预测结果相结合,可以将病理学家的AUC准确率提升至0.995,这意味着可以减少将近85%的人类错误率。
  4. 深度学习可以显著提升病理诊断的准确率。

1 介绍

计算机辅助的显微图像分析系统的重要性:

  • 病理学专业的任务是提供明确的疾病诊断以引导患者的治疗及管理决策。标准化、准确率和可重复的疾病诊断是精准医疗的关键因素。
  • 20世纪中叶,病理学家进行疾病诊断依靠的主要工具就是显微镜。显微镜的缺点:缺少标准化、诊断错误、需要人工识别幻灯片中数百万的细胞。
  • 计算机辅助的显微图像分析方法。

乳腺前哨淋巴结阳性诊断的重要性:

  • 国际生物医学成像研讨会于2015年10月到2016年4月举办了Camelyon挑战赛,以确定自动识别全幻灯图(whole slide image)中转移性乳腺癌的图像分析系统的最佳性能。
  • 乳腺前哨淋巴结评估是美国联合委员会TNM乳腺癌分期系统的重要组成部分,其中前哨淋巴结转移阳性的患者相对阴性有更高的TNM病理学分期,应该接收如腋窝淋巴结清除等更加积极的临床治疗措施。

人工进行前哨淋巴结诊断的弊端:

  • 耗时耗力
  • 使用免疫化学方法对在乳腺癌细胞中可以正常表达,但淋巴结不能表达的蛋白质进行检测。缺点:增加成本、增加幻灯片准备的时间及病理学家需要判断的幻灯张数。

基于深度学习的前哨淋巴结节点转移瘤识别方法。

  1. 文章使用数百万组织切片训练深度卷积神经网络,进行正常切片与肿瘤切片的切片级预测;
  2. 结合切片预测结果生成肿瘤概率热力图;
  3. 对热力图进行后处理,完成基于幻灯片的分类任务和肿瘤定位任务。
  4. 文章所提出的系统以接近人类的准确率赢得了2016年Camelyon 挑战大赛。最终,将深度学习预测结果与病理学家诊断结果相结合,从而显著减小了病理学家的错误率。

2 数据集和评价标准

2.1 Camelyon16 数据集

400张全幻灯图(whole slide images,WSI)270个作为训练集,130个作为测试集。每张切片都包括来自两个组织的样本(Radbound UMC and UMC Utrecht)。

组织 肿瘤训练集 癌症训练集 测试集
Radboud UMC 90 70 80
UMC Utrecht 70 40 50
总计 160 110 350

训练集的标签包含病理学家在前哨淋巴节点图像中标记的转移瘤区域。数据以两种方式提供,xml文件包含标记的转移瘤轮廓的节点位置和包含转移瘤位置的WSI二值图像。

2.2 评价指标

  • 切片评价指标:区分正常切片和癌变切片的性能评价。参与者提交测试切片可能包含癌变的可能性分布。比赛组织人员使用AUC(area under the receiver)分数给出性能评价。
  • 病变评价指标:参与者提交被预测为癌症的切片中每个像素为癌变细胞的可能性。比赛组织人员使用WSI中真正癌变细胞的六种假阳性率: 14,12,1,2,4 ,和每张WSI的8种假阳性率评判性能。

3. 方法

论文笔记 | 基于深度学习的乳腺转移瘤识别(Deep Learning for Identifying Metastatic Breast Cancer)_第1张图片

3.1 图像预处理

  • 去除背景:使用基于阈值的分割自动检测背景区域,去除背景,减少计算时间。
  • 将图像从RGB色彩空间转变到HSV,使用Otsu计算每个通道的最佳阈值,之后根据H和S通道掩码得到最终掩码图像。每张图像背景占比82%左右。

3.2 转移瘤检测框架

转移瘤检测架构包含基于切片的分类阶段和基于热力图的后处理阶段。

  • 基于切片的分类阶段:从全幻灯图像中提取小的正常、癌变切片,将位于癌细胞区域的切片标记为1,正常细胞区域的细胞标记为0。训练监督分类模型对两类切片进行分类。之后将所有预测结果汇总到热力图中。在基于热力图的后处理阶段,使用癌细胞可能性热力图计算基于幻灯图的评价分数和基于病变的评价分数。
  • 基于热力图的后处理阶段

3.3 块切片分类阶段

训练过程中,使用256x256的块切片训练癌变细胞分类模型。

  • 分类模型选择:使用四个经典分类网络:GoogleNet,AlexNet,VGG16和面向人脸的深度网络。GoogleNet和VGG16取得最好的块切片分类效果。本文GoogleNet:相对VGG16更快,更加稳定。GoogleNet共27个卷积层,多于6百万个参数。
  • 放大:文章进行了不同级别的放大,包括:40x、20x和10x,在40x时取得最佳性能。
不同分类网络的效果
GoogleNet 98.4%
AlexNet 92.1%
VGG16 97.9%
FaceNet 96.8%

3.4 肿瘤热力图后处理计算切片及病变可能性

肿瘤可能性热力图中每个像素的值介于0到1之间,表示该像素可能是肿瘤的可能性。
论文笔记 | 基于深度学习的乳腺转移瘤识别(Deep Learning for Identifying Metastatic Breast Cancer)_第2张图片

3.4.1 片分类

  • 提取28个几何及形态学特征,包括,癌变区域占整个组织的比例、癌变区域与最小周边凸区域的比例,癌变可能性的均值,癌变区域最大轴长。
  • 对训练集所有幻灯片计算特征之后,使用随机森林分类器对正常和癌变的幻灯片进行分类。AUC准确率为0.925,是Camelyon比赛中性能最佳的分类系统。

3.4.2 病变检测

  • 确定幻灯图中所有的癌变区域,并且假正率最低。
  • 使用初始训练集训练深度模型D-I
  • 使用邻接癌区域的正常组织扩充训练集,训练深度模型D-II
  • DII的假正率低于D-I,但敏感性也会降低
  • 对D-I产生的热力图进行二值化(阈值为0.9),检测热力图中的联通区域,使用癌变区域中心点坐标标记联通区域位置,之后评估这些位置癌变的可能性。结合D-I和D-II癌细胞预测的优势。Camelyon比赛中定义了6个级别的假正率以计算每张幻灯片的敏感性: 14121248 。文中所提出的系统得分为0.7051,为比赛中最高得分,比第二名高出22%(第二名得分0.5761)。

4 实验结果

4.1 Camelyon 评估结果

ROC图

4.2 结合人类病理学家经验

你可能感兴趣的:(深度学习图像处理)