2021-11-29

Nature | AI病理预测未知原发性癌症的起源

原创 榴莲不酥 图灵基因 今天

收录于话题#前沿生物大数据分析

撰文:榴莲不酥

IF=49.962

推荐度:⭐⭐⭐⭐⭐

亮点:

不明原发性癌症因为无法确定肿瘤的原发性主要解剖部位,这对于癌症的治疗来说提出了相当大的挑战。该团队提出了一种基于深度学习的算法——通过深度学习进行肿瘤起源评估(TOAD,即使用常规获得的组织学切片为原发肿瘤的起源提供鉴别诊断,深度学习可用作辅助工具,为转移性肿瘤和不明原发性癌症的复杂病例提供鉴别诊断,并可与辅助检查和广泛的诊断检查结合使用或代替辅助检查和广泛的诊断检查,以减少不明原发性癌症的发生。


2021年5月5日,在Nature杂志上发表了一篇名为“AI-based pathology predicts origins for cancers of unknown primary”的文章,提出了一种基于深度学习的算法——通过深度学习进行肿瘤起源评估,它可以使用常规获得的组织学切片为原发肿瘤的起源提供鉴别诊断,以更好的为原发肿瘤的诊断提供技术手段。


原发性肿瘤的主要解剖部位在指导转移性肿瘤患者的临床护理中至关重要,目前临床上确定肿瘤的原发性主要解剖部位通常通过组织病理学检查或者通过患者的临床和放射学评估确定。随着科技的发展,尽管对复杂的成像方式进行了改进,使用免疫造血化学(IHC)进行特定和敏感的测试,原发肿瘤原位的具体确定仍然可以是一个诊断难题。事实上,1%的癌症往往是分类为不明原发性癌症,不明原发性癌症患者经常接受全面诊断,包括病理学,放射学,内窥镜和实验室检查以确定肿瘤的发生位置。最近的研究建议使用基因组学和转录组学来确定肿瘤的主要来源,然而分子谱分析并非对每一位患者进行常规分析,尤其是在资源匮乏的条件下。深度学习的进步在医学的各种不同诊断任务中证明了准确、可靠和可重复的优点,能够轻松识别专家无法识别的特征。


FaisalMahmood教授团队向我们展示了TOAD,这是一种高通量、可解释的基于深度学习的方案,基于AI的肿瘤起源评估。它使用基于临床诊断确定肿瘤标本原发部位的苏木精-伊红全载玻片图像(WSI)。该团队认为他们的方法可用于同时预测肿瘤是否为转移性肿瘤并为原发肿瘤的起源分配鉴别诊断。TOAD可以作为病理学家的辅助工具,用于评估复杂的转移性和未知原发肿瘤病例,需要进行大量临床和辅助检查以缩小鉴别诊断范围。


TOAD工作流程如图一所示,将患者的数字化高分辨率组织学载玻片作为主网络输入,对于每个WSI,组织内容会自动分割并平均分成数千个~数万个区域作为小图像块。这些图像由具有固定参数的卷积神经网络处理,该网络作为编码器从每个补丁中提取紧凑的描述性特征向量。使用基于注意力的多实例学习算法,TOAD学习使用特征向量对幻灯片中的所有组织区域进行排序,并根据它们的相对重要性在整个幻灯片中聚合它们的信息,为感知到的区域分配更大的权重诊断相关性。作为额外的协变量,患者的性别可以与汇总的组织学特征融合以进一步指导分类。通过使用分支网络架构和多任务目标,TOAD可以预测肿瘤起源以及癌症是原发性还是转移性。每个任务学习单独的注意力层权重以增加模型的表达能力,使其能够根据任务关注幻灯片的不同信息丰富区域集。


图1:TOAD工作流程



该团队后续对深度学习模型性能进行了评估,结果显示模型在训练期间的整体准确率为83.4%;当使用top-k鉴别诊断准确度评估模型时,TOAD实现了top-3 95.5%的准确度和top-598.1%的准确度。最高预测对于转移性肿瘤和不明原发性癌症的复杂病例可能有用,在这些病例中缩小潜在的原发肿瘤起源可以帮助诊断肿瘤的工作流程并减少发现原发性肿瘤所需的辅助测试的数量。高top-k精度表明使用TOAD对给定幻灯片的最高预测将肿瘤的起源缩小到少数,他们表示该模型以高置信度做出的预测通常是可靠的。此外,TOAD能够以85.0%的准确度和0.942的受试者操作特征曲线下面积(AUCROC)预测肿瘤标本是否为转移。


该团队也在不同医疗保健领域评估了该模型的适应性。在没有调整或预适应的情况下,具有不同染色方案和患者群体的系统中,TOAD训练模型产生了79.9%的准确率以及93.4%的top-3准确率。此外在区分转移瘤和原发肿瘤,该模型AUC为0.919,表明该模型能够泛化到不同的数据源和染色训练期间未遇到的情况。


图2:TOAD模型性能



由于有限的真实标签和固有的相关不确定性,客观评估模型预测CUP病例的肿瘤起源的能力具有挑战性,即使在这些标签确实存在的情况下。因此,该研究团队首先测试集中分析了TOAD对转移性肿瘤的性能,该测试集中已为其分配了诊断并可用。对于这些转移性肿瘤,TOAD实现了82.8%的准确度和94.9%的top-3准确度。我们使用诊断性IHC染色的数量作为间接测量来识别难以诊断的病例26并检查模型在不同IHC使用水平上的性能。正如预期的那样,在不需要IHC诊断的患者中,TOAD的准确度最高,为87.4%,top-3准确度为96.7%。然而,即使在需要三个或更多IHC测试的更困难的情况下,TOAD仍然达到了75.7%的准确率和92.0%的top-3准确率。


图3:分类性能预测转移性肿瘤的癌症起源



该团队进一步整理了来自152个医疗中心的743名患者的数据集,这些患者在诊断和治疗过程中的某个时间点被诊断为CUP。这些患者不能单独使用组织学幻灯片进行初步诊断,需要彻底的临床检查和辅助测试。在分析了所有电子病历后,我们确定了317名患者的子集,这些患者被分配了主要差异。这些对CUP病例的鉴别诊断涉及不确定性和猜想的元素,应与可信的、真实的标签区分开来,而后者无法从CUP病例中实际获得。该团队观察到,模型的最高预测直接与317名患者中的192名分配的主要差异所指示的原点一致,并且在考虑到模型的top-3和top-5预测。这些结果令人鼓舞,因为我们的模型能够根据常规组织学图像分配一致的鉴别诊断,而CUP病例的鉴别诊断通常是在广泛的调查诊断检查后分配的。


图4:在转移性和原发肿瘤中预测癌症起源的表现



TOAD是一种深度学习算法,用于根据常规组织病理学幻灯片预测肿瘤的主要起源。使用最少的临床信息确定转移性肿瘤的起源具有挑战性,尤其是在仅根据组织学评估肿瘤时。使用常规H&E组织学和患者的性别作为输入,TOAD模型使用弱监督学习对数万个样本进行训练,可以做出相当准确的预测,证明使用多任务学习训练的单个网络可以预测肿瘤是否发生了转移,并且可以区分在同一组织部位发现的是原发性肿瘤或者是转移性肿瘤。总体而言,该研究为开发用于起源预测的大规模弱监督人工智能模型提供了概念证明,并为前瞻性研究和临床试验铺平了道路,以进一步评估使用传统组织学进行基于人工智能的起源预测的功效。

教授介绍

Mahmood博士是哈佛医学院和布莱根妇女医院计算病理学部的病理学助理教授。他在日本冲绳科学技术学院获得生物医学影像博士学位,曾在约翰霍普金斯大学生物医学工程系从事博士后研究。他的研究兴趣包括病理图像分析、形态特征和使用数据融合和多模态分析的生物标志物发现。Mahmood博士是Dana-Farber癌症研究所/哈佛癌症中心的正式成员;哈佛大学和麻省理工学院博德研究所的准会员,以及哈佛生物信息学和综合基因组学教员。


参考文献

Lu MY, Chen TY, Williamson DFK, et al.AI-based pathology predicts origins for cancers of unknown primary. Nature.2021,594(7861):106-110.

你可能感兴趣的:(2021-11-29)