基于知识图的增强路径推理的可解释性疾病预测

代码地址:

https://github.com/ZJU-BMI/PBXAI

摘要

目的:结合医学知识和医学数据,以可解释的方式预测疾病风险。方法:我们将疾病预测任务表述为沿着知识图谱(KG)的随机游动。具体而言,我们根据经过验证的医学知识建立了一个KG,以记录疾病和危险因素之间的关系。然后,一个数学对象沿着KG走。它开始在患者实体处行走,该患者实体根据患者当前的疾病或风险因素将KG连接起来,并在代表所预测疾病的疾病实体处停止对象产生的轨迹代表给定患者的可解释的疾病进展路径。对象的动态由基于策略的强化学习(RL)模块控制,该模块由电子健康记录(EHR)进行训练。实验:我们利用了两个真实的EHR数据集来评估模型的性能。在疾病预测任务中,在两个数据集中预测53种循环系统疾病时,我们的模型在曲线下的宏区域(AUC)分别达到0.743和0.639。该性能可与医学研究中常用的机器学习(ML)模型相媲美。在定性分析中,我们的临床合作者回顾了我们模型产生的疾病进展路径,并主张其可解释性和可靠性。结论:实验结果验证了该模型在解释性评估和优化疾病预测中的有效性。启示:我们的工作有助于将医学知识和医学数据的潜力共同用于可解释的预测任务。

基于知识图的增强路径推理的可解释性疾病预测_第1张图片

图1知识图上可解释的疾病预测 患者实体根据其疾病或危险因素连接KG。 然后,由RL代理控制的数学对象开始在患者实体处行走,而在疾病实体处停止行走。 终止的疾病实体是预测的疾病,对象的轨迹指示可解释的疾病进展路径

1)我们提出了一种新颖的基于KG的学习模型来预测疾病。 据我们所知,这是第一项通过将经过验证的医学知识整合到数据驱动模型中而可解释地解决疾病预测问题的研究。
2)我们建议为KG配备神经网络,以从大量EHR数据中学习表示形式。 结果证明,生成的知识路径大大改善了疾病预测的可解释性。
3)我们的方法在两个真实的临床数据集中得到了广泛的评估。 实验结果表明,我们的模型与在临床研究中广泛使用的最新机器学习方法一样有效。 专业临床医生还提倡该模型产生的可解释的疾病进展路径的可靠性。

相关工作

可解释医疗模型

从技术角度来看,现有可解释的疾病预测模型可以粗略地分为四个亚型[6]。 1)基于注意力的方法。基于注意力的模型利用神经网络为每个特征分配特定于样本的权重作为解释。例如,Choi等。 [7]和尹等。 [15]采用注意机制和递归神经网络(RNN)分别以可解释的方式预测心力衰竭的发作。 2)模型不可知方法,其中局部可解释模型不可知解释(LIME)[16]和SHapley Additive ExPlanations(SHAP)[17]是两种代表性方法。通过将预测结果重新组织为给定样本特征的线性组合,模型不可知方法能够为任何无法解释的模型赋予解释性。例如Tseng等。利用随机森林预测急性肾损伤,他们采用SHAP将预测解释为给定特征的线性组合[18]。严等。他们使用卷积神经网络(CNN)来预测与年龄相关的黄斑变性,并采用LIME来解释这一预测[19]。 3)知识提炼方法。它利用一种精确但无法解释的方法作为主管来训练一个轻便,可解释的模型。与监督者相比,训练好的轻量级模型可以实现类似的性能,而不会损失可解释性。例如,Das等。 Che等人采用模糊规则的加权和来解释通过无法解释的基于核的方法进行的阿尔茨海默氏病的预测[8],Che等人。利用梯度提升树来解释由RNN进行的死亡率预测[20]。 4)修改本质上可以解释的模型。例如,Brisimi等。 [21]和Bernardini等。 [9]修订SVM分别预测患者的再入院率和糖尿病发作。总而言之,现有基于ML的疾病预测模型的可解释性取决于为每个特征分配特定的重要性权重(或得分),以表明其对预测的贡献。所有这四种类型的方法都是纯数据驱动的,无法利用现有的医学知识来提供可解释的预测。

利用医学知识的预测模型

据我们所知,现有的机器学习研究主要利用医学知识来学习医学概念的有效表示。 所学习的医学概念表示可以改善下游任务的性能,例如疾病风险预测。 例如,Choi等。 提出的GRAM,它利用国际疾病分类(ICD)编码系统的层次结构和注意力机制来学习疾病概念的表示,然后将学习到的表示应用于疾病预测任务中。 三项独立研究的实验结果表明,该方法可以显着提高预测罕见病发作的性能。 张等。 和尹等人。 利用TransE和图注意力网络从一个名为KnowLife的幼稚园学习医学概念的表示[22],他们将学到的表示应用于预测心力衰竭的发作[13],[23]。尽管这些研究证明了引入医学知识的功效,但他们并未提出透明模型,其决策过程对于临床医生而言是可以理解的,我们将在本研究中解决这些模型。

基于路径的可解释推荐器

基于路径的方法是推荐系统中一种新兴的可解释方法[24]。例如,西安等。 [25]和Zhang等。 [26]已经利用这种方法为客户实现了可解释的个性化推荐。基于路径的方法的核心是构建一个大图,称为异构信息网络(HIN),以记录所有客户,产品,评论及其关系。之后,通过沿HIN生成推荐路径来为客户推荐产品。现有的基于路径的方法研究通常利用经过大量购买数据训练的RL代理来生成推荐产品以及推荐路径[27],[28]。因为路径具有明确的语义解释,所以基于路径的方法被视为可解释的方法。
受到基于路径的方法的启发,我们在本研究中建立了一个KG以记录经过验证的医学知识,并根据患者的疾病和危险因素将其连接到KG。之后,我们使用基于路径的方法是推荐系统中一种新兴的可解释方法[24]。例如,西安等。 [25]和Zhang等。 [26]已经利用这种方法为客户实现了可解释的个性化推荐。基于路径的方法的核心是构建一个大图,称为异构信息网络(HIN),以记录所有客户,产品,评论及其关系。之后,通过沿HIN生成推荐路径来为客户推荐产品。现有的基于路径的方法研究通常利用经过大量购买数据训练的RL代理来生成推荐产品以及推荐路径[27],[28]。因为路径具有明确的语义解释,所以基于路径的方法被视为可解释的方法。
受到基于路径的方法的启发,我们在本研究中建立了一个KG,以记录经过验证的医学知识,并根据患者的疾病和危险因素将其连接到KG。之后,我们使用EHR数据来训练RL代理。受过训练的RL代理商可以沿KG生成预测的疾病和疾病进展路径作为解释。值得注意的是,我们不是第一个在医学研究中引入基于路径的方法的人。徐等。首先在疾病预测中利用了基于路径的方法[29]。但是,他们的模型没有利用经过验证的医学知识,也无法为看不见的患者预测疾病。在这项研究中,我们仔细解决了这些缺陷,以确保我们的模型具有在实际临床环境中部署的潜力。

你可能感兴趣的:(可解释性,神经网络,机器学习,人工智能,深度学习,自然语言处理)