Nat Mac Int | 可解释的乳腺癌AI帮助培训影像科医生
原创 图灵基因 图灵基因 2022-01-25 09:20
收录于话题#前沿生物大数据分析
杜克大学的计算机工程师和放射科医生开发了一个人工智能(AI)平台,可以分析乳房X光扫描中潜在的癌性病变,以帮助确定患者是否应该接受侵入性活检。然而,与其他AI平台不同的是,该算法是可解释的,这意味着它可以准确地向医生展示它是如何得出结论的。
研究人员训练了他们可解释的乳腺病变AI算法(IAIA-BL)来定位和评估病变,就像训练真正的放射科医生一样,而不是让它自由地开发自己的程序。他们认为,与“黑匣子”平台相比,这为新平台提供了一些优势,并且可以提供一个有用的培训平台来教学生如何阅读乳房X光检查图像。它还可以帮助世界上人口稀少地区不经常阅读乳房X光扫描的医生做出更好的医疗保健决策。
杜克大学放射学教授Joseph Lo博士说:“如果计算机要帮助做出重要的医疗决策,医生需要相信人工智能是基于有意义的东西得出结论的。我们需要的算法不仅能起作用,还能自我解释,并举例说明他们的结论是基于什么。这样,无论医生是否同意结果,人工智能都能帮助做出更好的决定。”
Lo及其同事在《Nature Machine Intelligence》杂志上发表了一篇题为“A case-based interpretable deep learning model for classification of mass lesions in digital mammography”的论文,报告了AI平台。
读取医学图像的工程AI是一个巨大的产业。已经存在数千种独立算法,FDA已经批准100多种用于临床。正如作者所说,“人工智能正在彻底改变放射学。”然而,他们警告说,无论是读取MRI、CT还是乳房X光扫描,很少有算法使用包含1000多张图像或包含人口统计信息的验证数据集。“……公开可用的乳房X光检查数据集很少,因此许多模型都是针对相对较少的病例进行训练的,而社区缺乏外部验证这些模型的数据集。”信息的匮乏,加上最近几个著名例子的失败,导致许多医生质疑人工智能在关键医疗决策中的应用。
在一个例子中,即使研究人员使用不同设备从不同设施拍摄的图像对其进行训练,人工智能模型还是失败了。AI不再只关注感兴趣的病变,而是学会了使用设备本身引入的细微差异来识别来自癌症病房的图像,并赋予这些病变更高的癌变概率。正如人们所预料的那样,人工智能并没有很好地转移到使用不同设备的其他医院。但是,因为没有人知道算法在做决策时是在看什么,所以没有人知道它在实际应用中注定会失败。
正如作者所指出的,“尽管计算机辅助放射学有望用于乳房X光摄影”,但目前的方法与“严重问题”有关,包括混淆。研究小组补充说,当预测模型使用不正确的信息或推理做出决策时,即使决策是正确的,也会发生混淆。“在以前的研究中,研究人员创建的模型似乎在测试集上表现良好,但在进一步的检查中,他们的决定是基于混淆信息(例如设备类型)而不是医学信息。”
机器学习模型的可解释性对于作者所说的“高风险决策”很重要,例如是否根据乳房X光扫描进行活检。“乳房X光检查提出了其他计算机视觉任务中不存在的重要挑战:数据集很小,存在混淆信息,甚至放射科医生也很难仅根据乳房X光检查在观察等待和活检之间做出决定。”他们写道。
“我们的想法是建立一个系统,说明潜在癌病变的这一特定部分与我以前见过的另一部分非常相似。”杜克大学计算机科学博士研究生、新报告研究的第一作者Alina Barnett说,“如果没有这些明确的细节,如果无法理解为什么它有时会出错,医生就会失去时间和对该系统的信心。”
杜克大学电气与计算机工程和计算机科学教授Cynthia Rudin博士将新AI平台的流程与房地产评估师的流程进行了比较。在该领域占主导地位的黑匣子模型中,评估师会提供一个房屋的价格,而不做任何解释。在一个包含所谓“显著性地图”的模型中,评估师可能会指出,房屋的屋顶和后院是其定价决策的关键因素,但不会提供除此之外的任何细节。
“我们的方法会说你有一个独特的铜屋顶和一个后院游泳池,与你附近的其他房屋相似,这使得它们的价格上涨了这么多。”研究人员说,“这就是医学成像AI的透明度可能看起来的样子,也是医学领域的人员应对任何放射挑战的要求。”
正如作者进一步评论的那样,“为了确保临床接受,人工智能工具需要向人类放射科医生合作者提供其推理过程,以便在这些困难和高风险的决策过程中成为有用的助手。”理想情况下,任何模型的推理过程都将类似于实际放射科医生的推理过程,放射科医生将根据乳腺组织内病变发展的生理学,观察图像中已知重要的特定方面。
研究人员利用从杜克大学卫生系统484名患者身上采集的1136张图像对新AI进行了训练。他们首先教人工智能找到有问题的可疑病变,忽略所有健康组织和其他无关数据。然后,他们聘请放射科医生仔细标记图像,让人工智能关注病变边缘,即潜在肿瘤与健康周围组织的交界处,并将这些边缘与已知癌性和良性结果的图像边缘进行比较。放射线或模糊边缘,医学上称为肿块边缘,是乳腺癌的最佳预测指标,也是放射科医生首先要寻找的。这是因为癌细胞复制和扩张的速度如此之快,以至于不是所有正在发展的肿瘤边缘都能在乳房X光片上看到。
研究人员在他们的论文中指出,“除了预测病变是恶性还是良性之外,我们的工作还旨在遵循放射科医生的推理过程,检测每幅图像的临床相关语义特征,如肿块边缘的特征。该框架包括一种使用基于案例推理的新型可解释神经网络算法用于乳房X光检查。”
“这是一种训练AI如何查看医学图像的独特方法。”研究人员说,“其他人工智能并没有试图模仿放射科医生;他们提出了自己的方法来回答这个问题,这些方法通常没有帮助,或者在某些情况下,依赖于有缺陷的推理过程。”
训练完成后,研究人员对人工智能进行了测试。虽然它的表现并没有超过人类放射科医生,但它的表现与其他黑匣子计算机模型一样出色。重要的是,当新的人工智能出错时,使用它的人将能够认识到它是错误的,以及它出错的原因。“我们的模型是决策辅助工具——而不是决策者——旨在实现更好的整体人机协作。”作者指出,“因此,与旨在取代医生的现有黑匣子系统不同,我们的目标是创建一个IAIA-BL,其明确的推理可以被医生理解和验证……我们新颖的深度学习架构使IAIA-BL能够提供解释,显示每个病例的基本决策过程。”
展望未来,该团队正在努力为AI添加其他物理特征,以便在做出决策时考虑,例如病变的形状,这是放射科医生学习观察的第二个特征。Rudin和Lo最近还获得了Duke MEDx高风险高影响奖,以继续开发该算法,并进行放射科医生读者研究,看看它是否有助于临床表现和/或信心。
“当研究人员第一次开始将AI应用于医学图像时,人们非常兴奋,也许计算机将能够看到人们看不到的东西或发现人们看不到的东西。”杜克放射学研究员、共同作者Fides Schwartz博士说,“在极少数情况下可能会出现这种情况,但在大多数情况下可能并非如此。因此,我们最好确保作为人类的我们了解计算机用来做出决策的信息。”
正如该团队在他们的报告中总结的那样,“该模型的未来工作可能包括读者研究,在该研究中,我们衡量准确性的任何改进,放射科医生报告他们对我们系统的信任。鉴于其他AI帮助对经验不足的读者的好处越来越大,将这个系统的好处与可能只是偶尔被要求做这项工作的次级专家和社区放射科医生进行比较可能是有价值的。”