2022-08-31

Cancer Cell | 深度学习AI整合组织学和多组学等诊断多种癌症

原创 图灵基因 图灵基因 2022-08-31 10:13 发表于江苏

收录于合集#前沿生物大数据分析


Brigham and Women's Hospital研究人员的一项研究展示了一种概念验证模型,该模型使用人工智能(AI)结合来自不同来源的多种类型的数据,并预测14种不同类型癌症的患者预后。“这项工作为更大规模的医疗人工智能研究奠定了基础,这些研究综合了来自多个来源的数据。”研究负责人Faisal Mahmood博士说,他是Brigham大学计算病理学系的助理教授,也是哈佛大学和麻省理工学院Broad研究所癌症项目的准成员。“从更广泛的意义上说,我们的研究结果强调需要建立具有更大数据集和下游临床试验的计算病理学预后模型,以建立实用性。”

Mahmood及其同事在《Cancer Cell》上的一篇题为“Pan-cancer integrative histology-genomic analysis via multimodal deep learning”的论文中报告了他们的工作。

人们早就知道,预测癌症患者的预后需要考虑许多不同的因素,例如患者病史、基因和疾病病理学,临床医生努力整合这些信息,以做出有关患者护理的决策。专家依靠多种数据来源,如基因组测序、病理学和患者病史,来诊断和预测不同类型的癌症。虽然现有技术使他们能够利用这些信息来预测结果,但手动整合来自不同来源的数据是一项挑战,专家们经常发现自己在进行主观评估。此外,作者写道,“……组织病理学特征的主观解释已被证明存在较大的观察者间和观察者内变异性,同一等级或阶段的患者在结果上仍存在显著差异。”

Mahmood进一步指出,“专家们分析了许多证据,以预测患者的表现。这些早期检查成为决定是否参加临床试验或特定治疗方案的基础。但这意味着这种多模式预测发生在专家层面。我们正试图通过计算解决这个问题。”

Mahmood和同事们设计了一种方法,通过计算整合多种形式的诊断信息,以产生更准确的结果预测。“为了解决开发可用于癌症预后的联合图像组学生物标志物的挑战,我们提出了一种基于深度学习的多模态融合(MMF)算法,该算法同时使用 H&E WSI(整张幻灯片图像)和分子轮廓特征(突变状态、拷贝数变异、RNA测序[RNAseq]表达)来衡量和解释癌症死亡的相对风险。”他们写道。

他们由此产生的 AI 模型展示了做出预后判断的能力,同时还揭示了用于预测患者风险的特征的预测基础——这一特性可用于发现新的生物标志物。研究人员使用癌症基因组图谱(TCGA)构建了模型,这是一个公开可用的资源,包含许多不同类型癌症的数据。

他们开发了一种基于多模态深度学习的算法,能够从多个数据源中学习预后信息。通过首先为组织学和基因组数据创建单独的模型,他们可以将该技术融合到一个提供关键预后信息的集成实体中。最后,他们通过输入来自14种癌症类型的数据集以及患者组织学和基因组数据来评估该模型的有效性。结果表明,与仅包含单一信息源的模型相比,该模型产生了更准确的患者结果预测。

“在这项研究中,我们提出了一种可解释的、弱监督的多模态深度学习方法,该方法将WSI和分子图谱数据整合到癌症预后中,我们对来自5720名患者的6592个WSI进行了训练和验证,这些WSI具有跨越14种癌症类型的配对分子图谱数据……”他们继续说道。

这项研究强调,使用人工智能整合不同类型的临床信息数据来预测疾病结果是可行的。他们指出:“我们的弱监督、多模态深度学习算法能够融合这些异构模式来预测结果,并发现与不良和良好结果相关的预后特征。”

Mahmood解释说,这些模型可以让研究人员发现结合不同临床因素的生物标志物,并更好地了解诊断不同类型癌症所需的信息类型。研究人员还定量研究了每种诊断模式对单个癌症类型的重要性以及整合多种模式的益处。

AI模型还能够阐明驱动预后预测的病理和基因组特征。研究小组发现,这些模型在没有经过训练的情况下使用患者免疫反应作为预后标志物,这是一个值得注意的发现,因为之前的研究表明,肿瘤引发更强免疫反应的患者往往会获得更好的结果。

Mahmood实验室开发了一个研究工具,即用于综合生存估计的病理学组学研究平台(PORPOISE),作为一个交互式平台,可直接为数千名不同癌症类型的患者生成模型学习的预后标志物。

虽然科学家们的概念验证模型揭示了人工智能技术在癌症治疗中的新作用,但他们的研究只是在临床上实施这些模型的第一步。在临床中应用这些模型将需要整合更大的数据集,并在大型独立测试队列上进行验证。展望未来,Mahmood的目标是整合更多类型的患者信息,例如放射扫描、家族史和电子病历,并最终将该模型带入临床试验。

研究人员总结道:“未来的工作将侧重于通过管理个体疾病模型的更大多模态数据集,使模型适应大型独立多模态测试队列,并使用多模态深度学习预测治疗反应和耐药性,开发更具针对性的预测模型。随着单细胞RNA-seq、质谱流式细胞术和空间转录组学等测序技术的研究进展,这些技术不断成熟并获得临床表型,结合全玻片成像,我们理解分子生物学的方法将变得越来越具有空间分辨率和多模态。”

你可能感兴趣的:(2022-08-31)