【知识图谱论文】具有生物医学知识图谱逻辑规则的神经多跳推理

Article

文献题目:Neural Multi-hop Reasoning with Logical Rules on Biomedical Knowledge Graphs
代码:https://github.com/liu-yushan/PoLo

摘要

  • 生物医学知识图谱允许使用综合计算方法来推理生物系统。生物数据的性质导致图形结构不同于基准数据集中通常遇到的图形结构。为了理解这可能对推理算法的性能产生的影响,我们基于药物再利用的现实世界任务进行了一项实证研究。我们将此任务表述为链接预测问题,其中化合物和疾病都对应于知识图中的实体。为了克服现有算法的明显弱点,我们提出了一种新方法 PoLo,它将基于强化学习的策略引导步行与逻辑规则相结合。这些规则通过使用新的奖励函数集成到算法中。我们将我们的方法应用于 Hetionet,它整合了来自 29 个著名生物信息学数据库的生物医学信息。我们的实验表明,我们的方法在提供可解释性的同时执行了几种最先进的链接预测方法。

引言

  • 低成本高通量测序、数据采集技术和计算范式的进步导致描述生物系统的数据大量激增。 这种可用数据的新格局跨越了多个维度,为生物系统的结构提供了互补的观点。 从历史上看,通过考虑单一维度(即单一类型的数据),研究人员在理解许多重要现象方面取得了进展。 最近,出现了一种开发统计和计算方法的运动,这些方法通过同时考虑多种类型的数据来利用更整体的观点[40]。 为了实现这一目标,基于图的知识表示已经成为一个有前途的方向,因为图的固有灵活性使它们特别适合这个问题设置。
  • 生物医学知识图 (KG) 在个性化医疗、预测诊断和药物发现等任务中变得越来越流行 [9]。 例如,药物发现需要多种生物医学数据类型以及跨不同领域的知识(包括基因-蛋白质结合、化合物和生物途径)。 这些单独类型的数据通常分散在不同的数据源中,针对特定领域的研究问题发布,而不考虑映射到开放标准。 为此,KGs 和语义网技术被应用于对结合知识和集成包含在生物医学数据源中的数据的本体建模,最著名的是 Bio2RDF [2],用于经典的基于查询的问答。
  • 从机器学习的角度来看,由于 KG 的独特结构特征,生物医学 KG 的推理对现有方法提出了新的挑战。== 一个挑战来自生物系统中实体的高度耦合性质,这导致了许多高度实体,它们自身紧密相连。== 例如,如图 1a 所示,基因之间相互作用丰富。 它们涉及多种生物途径和分子功能,并与疾病有许多关联。
    【知识图谱论文】具有生物医学知识图谱逻辑规则的神经多跳推理_第1张图片
  • 图 1. (a) 异构生物医学 KG Hetionet [13] 的可视化。(b) Hetionet 架构:Hetionet 有 11 种不同的实体类型和它们之间的 24 种可能的关系。 来源:https://het.io/about/。
  • ==第二个挑战是推理两个实体之间的关系通常需要二阶邻域之外的信息[13]。==依赖浅节点嵌入的方法(例如,TransE [4]、DistMult [38])通常在这种情况下表现不佳。将整个多跳邻域考虑在内的方法(例如,图卷积网络,R-GCN [30])通常在超过两跳邻域(即,两个以上的卷积层)和高度实体之后的性能下降可以导致聚合操作平滑信号[16]。符号方法(例如,AMIE+ [10]、RuleN [21])学习逻辑规则并在推理过程中使用它们。这些方法可能能够考虑长期依赖关系,但由于许多现实世界 KG 的大规模和多样化的拓扑结构,组合复杂性通常会阻止符号方法的使用 [14]。此外,逻辑推理难以处理数据中的噪声 [24]。
  • 在这些结构条件下,基于路径的方法为在多跳邻域上组合信息提供了一种看似理想的平衡。 关键的挑战是找到有意义的路径,如果搜索不受领域原则的指导,这在计算上可能会很困难。 我们的目标是探索基于路径的方法与替代的最先进的方法相比如何执行,并确定一种克服当前方法中存在的弱点的方法。
  • 我们考虑药物再利用问题,其特点是为现有药物寻找新的治疗目标。 可以利用有关药物疾病相互作用的现有知识来显着降低开发新药的成本和时间。 最近的一个例子是针对新型疾病 COVID-19 重新定位药物瑞德西韦。 我们将此任务表述为链接预测问题,其中化合物和疾病都对应于 KG 中的实体。
  • 我们提出了一种神经符号推理方法,即 PoLo(具有逻辑规则的策略引导游走),它利用了表示学习和逻辑。受现有方法 [5,12,18] 的启发,我们的方法使用强化学习来训练代理在 KG 上进行策略引导的随机游走。作为对基于策略引导步行的方法的修改,我们引入了一种新的奖励函数,它允许代理使用形式化为逻辑规则的背景知识,在训练期间指导代理。代理提取的路径作为预测的解释。我们的研究结果表明,现有方法的设计不足,无法在生物医学数据的独特结构特征中表现理想。我们可以克服现有方法的一些弱点,并展示神经符号方法在生物医学领域的潜力,其中结果的可解释性和透明度与促进领域专家的可访问性高度相关。总之,我们做出以下贡献:
    • 我们提出了神经符号 KG 推理方法 PoLo,它将基于强化学习的策略引导步行与逻辑规则相结合。
    • 我们使用大型生物医学 KG 进行实证研究,将我们的方法与几种最先进的算法进行比较。
    • 结果表明,就 k ∈ { 1 , 3 , 10 } k ∈ \{ 1, 3, 10\} k{1,3,10} 的指标 hits@k 和平均倒数排名而言,我们提出的方法在高度相关的生物医学预测任务(药物再利用)上优于最先进的替代方案。
  • 我们在第 2 节中简要介绍了符号并回顾了相关文献。在第 3 节中,我们描述了我们提出的方法。 第 4 节详细介绍了一项实验研究,我们在第 5 节中得出结论。

背景

知识图谱

  • E E E 表示 KG 中的实体集, R R R 表示二元关系集。 E E E 中的元素对应于生物医学实体,包括,例如: 化合物、疾病和基因。我们假设每个实体都属于 T T T 中的唯一类型,由映射 τ : E → T τ : E → T τ:ET 定义。例如, τ ( A U R K C ) = G e n e τ (AURKC) = Gene τ(AURKC)=Gene 表示实体 A U R K C AURKC AURKC 具有 G e n e Gene Gene 类型。 R R R 中的关系指定实体是如何连接的。我们将 KG 定义为 ( h , r , t ) (h, r, t) (h,r,t) 形式的三元组 K G ⊂ E × R × E KG ⊂ E × R × E KGE×R×E 的集合,它由头实体、关系和尾实体组成。三元组的头和尾也分别称为源和目标。从图形的角度来看,头部和尾部实体对应于图中的节点,而关系表示它们之间的边缘类型。对于任何关系 r ∈ R r ∈ R rR,我们表示与 r − 1 r^{-1} r1 的对应逆关系(即, ( h , r , t ) (h, r, t) (h,r,t) 等价于 ( t , r − 1 , h ) (t, r^{-1} , h) (t,r1,h))。 KG 中的三元组被解释为真实的已知事实。例如,图 2 中的三元组 ( S o r a f e n i b , T r e a t s , L i v e r C a n c e r ) ∈ K G (Sorafenib, Treats, Liver Cancer) ∈ KG (Sorafenib,Treats,LiverCancer)KG 对应于激酶抑制剂药物索拉非尼被批准用于治疗原发性肝癌的已知事实。Treats关系对于这项工作特别重要,因为我们将药物再利用的任务构建为关于类型对待边缘的链接预测问题。治疗的领域由化合物组成,范围由所有疾病的集合给出。
  • 我们进一步区分了两种类型的路径:实例路径和元路径。 KG 上长度为 L ∈ N L ∈ N LN 的实例路径由序列给出
    在这里插入图片描述
  • 其中 ( e i , r i , e i + 1 ) ∈ K G (e_i, r_i , e_{i+1}) ∈ KG (ei,ri,ei+1)KG。 我们称对应的实体类型序列
    在这里插入图片描述
  • 元路径。 例如,
    在这里插入图片描述
  • 构成长度为 2 的实例路径,其中
    在这里插入图片描述
  • 是对应的元路径。

逻辑规则

  • 通常用于 KG 推理的逻辑规则可以写成 h e a d ← b o d y head ← body headbody 的形式。 我们考虑形式的循环规则
    在这里插入图片描述
  • 其中 τ i ∈ T τ_i ∈ T τiT 。 该规则被称为循环规则,因为规则 h e a d head head(不要与三元组中的头实体混淆)连接元路径的源 τ 1 τ_1 τ1 和目标 τ L + 1 τ_{L+1} τL+1
    在这里插入图片描述
    由规则体描述。 目标是找到对应元路径与规则主体匹配的实例路径,以预测实例路径的源实体和目标实体之间的新关系。 对于药物用途任务,我们只考虑规则头是关于治疗关系的三元组的规则。
  • 定义 C t D : = ( C o m p o u n d , t r e a t s , D i s e a s e ) CtD :=(Compound, treats, Disease) CtD:=Compound,treats,Disease)。 然后,通用规则具有以下形式
    在这里插入图片描述
  • 特别地,规则体对应于从化合物开始并在疾病处终止的元路径。 例如(参见图 2),考虑规则
    在这里插入图片描述
  • 实例路径的元路径
    在这里插入图片描述
  • 符合规则体,表明索拉非尼也可以治疗肾癌。

相关工作

  • 尽管现实世界的 KG 包含大量的三元组,但仍预计它们会遭受不完整的影响。 因此,链接预测(也称为 KG 补全)是 KG 上常见的推理任务。 许多经典的人工智能任务,如推荐问题或问答,都可以用链接预测来重新表述。
  • 符号方法在知识获取和推理方面具有深远的传统。 在诸如马尔可夫逻辑网络 (MLN) [28] 或归纳逻辑编程 [25] 等领域已经解决了使用逻辑规则进行推理。 但是,此类技术通常不能很好地扩展到现代的大型 KG。 最近,已经提出了诸如 RuleN [21] 及其继任者 AnyBURL [19,20] 等新方法,它们在流行的基准数据集(如 FB15k-237 [31] 和 WN18RR [7])上实现了最先进的性能。
  • 子符号方法将 KG 中的节点和边映射到称为嵌入的低维向量表示。然后,通过在嵌入空间上运行的分类器来近似缺失三元组的可能性。流行的基于嵌入的方法包括 TransE [4] 等平移方法、DistMult [38] 和 ComplEx [32] 等更通用的方法、ConvE [7] 等多层模型和 RESCAL [26] 等张量分解方法.此外,已经提出了 R-GCN [30] 和 CompGCN [34],它们将图卷积网络 [16] 扩展到多关系图。尽管在链接预测任务上取得了很好的结果,但一个根本问题是它们的不透明性,因为它对用户来说仍然是隐藏的,是什么促成了预测。此外,大多数基于嵌入的方法难以捕获长程依赖关系,因为它们只能最小化直接一阶邻域中的重建误差。特别是长尾实体的表达能力可能由于邻居数量少而低[11]。
  • 神经符号方法结合了亚符号方法的鲁棒学习和可扩展性的优点以及符号表示的推理特性和可解释性。例如,Neural LP [39] 和 Neural Theorem Provers (NTPs) [29] 以可微分的方式将逻辑规则集成到神经网络架构中。方法 pLogicNet [27] 将 MLN 与基于嵌入的模型相结合,并学习三元组上的联合分布,而 Logic Tensor Network [8] 将背景知识以逻辑约束的形式插入到神经网络中。然而,许多神经符号方法受到有限的可迁移性和计算效率低下的影响。 Minervini 等人。已经提出了 NTP 的两个更具可扩展性的扩展,即 Greedy NTP (GNTP) [22],它考虑了最有可能证明目标而不是使用一组固定规则的 top-k 规则,以及 Conditional Theorem Prover ( CTP)[23],它学习了一种用于选择规则的自适应策略。
  • 多跳推理或基于路径的方法基于使用从 KG 中提取的路径作为各种推理任务的特征来推断缺失的知识。 与预测一起,多跳推理方法为用户提供了一个明确的推理链,可以作为预测的依据。 例如,路径排名算法 (PRA) [17] 将链接预测任务构建为基于从 KG 上最近邻随机游走采样的路径的最大似然分类。 Xiong等人, 扩展这个想法并将路径提取的任务表述为强化学习问题(DeepPath [37])。 我们提出的方法是基于路径的方法 MINERVA [5] 的扩展,它训练强化学习代理执行策略引导的随机游走,直到达到输入查询的答案实体。
  • 现有策略引导步行方法的缺点之一是代理可能会收到基于虚假三元组的嘈杂奖励信号,这些信号在训练期间会导致正确答案,但会降低泛化能力。 此外,生物医学知识库通常同时表现出长期依赖和高度节点(见第 4.1 节)。 这两个属性以及 MINERVA 的代理仅在答案实体正确的情况下才会获得奖励的事实使得代理难以在生物医学 KG 上导航并以最有希望的方式扩展路径。 作为一种补救措施,我们建议通过一种新的奖励函数来结合已知的有效逻辑规则。 这有助于对奖励信号进行去噪,并在具有高度节点的长路径上引导代理。

方法

  • 我们将药物再利用的任务作为基于图遍历的链接预测问题。 我们使用的通用马尔可夫决策过程定义最初是在算法 MINERVA [5] 中提出的,我们的主要贡献来自将逻辑规则合并到训练过程中。 以下符号和定义适用于用例。 从查询实体(要重新利用的化合物)开始,代理通过顺序转换到相邻节点来在图上执行遍历。 进行哪个过渡的决定由随机策略决定。 每个后续转换都添加到当前路径并扩展推理链。 随机游走过程迭代直到进行了有限数量的转换。 形式上,学习任务是通过下面概述的固定水平马尔可夫决策过程建模的。
  • 环境 状态空间 S S S E 3 E^3 E3 给出。直观地说,我们希望状态对步骤 l ∈ N l ∈ N lN、源实体 e c e_c ec 和目标实体 e d e_d ed 的代理位置 e l e_l el 进行编码,分别对应于我们旨在重新利用的化合物和目标疾病。因此,步骤 l ∈ N l ∈ N lN 的状态 S l ∈ S S_l ∈ S SlS 表示为 S l : = ( e l , e c , e d ) S_l := (e_l , e_c, e_d) Sl:=(el,ec,ed)。代理没有获得有关目标疾病的信息,因此状态空间的观察部分由 ( e l , e c ) ∈ E 2 (e_l , e_c) ∈ E^2 (el,ec)E2 给出。来自状态 S l S_l Sl 的可用动作集由 A S l A_{S_l} ASl 表示。它包含来自节点 e l e_l el 的所有出边和相应的尾节点。我们还包括每个节点的自循环,以便代理有可能留在当前节点。更正式地说, A S l : = { ( r , e ) ∈ R × E : ( e l , r , e ) ∈ K G } ∪ { ( ∅ , e l ) } A_{S_l} := \{ (r, e) ∈ R × E : (e_l , r, e) ∈ KG\} ∪ \{ (∅, e_l)\} ASl:={(r,e)R×E:(el,r,e)KG}{(,el)}。此外,我们用 A l ∈ A S l A_l ∈ A_{S_l} AlASl 表示代理在步骤 l l l 中执行的动作。通过根据先前的操作更新状态,环境确定性地演变。转换函数由 δ ( S l , A l ) : = ( e l + 1 , e c , e d ) δ(S_l , A_l) := (e_{l+1}, e_c, e_d) δ(Sl,Al):=(el+1,ec,ed) 给出,其中 S l = ( e l , e c , e d ) S_l = (e_l , e_c, e_d) Sl=(el,ec,ed) A l = ( r l , e l + 1 ) A_l = (r_l, e_{l+1}) Al=(rl,el+1)
  • 策略 我们用 H l : = ( H l − 1 , A l − 1 ) H_l := (H_{l−1}, A_{l−1}) Hl:=(Hl1,Al1) 表示代理到步骤 l l l 的历史,其中 l ≥ 1 l ≥ 1 l1 H 0 : = e c H_0 := e_c H0:=ec A 0 : = ∅ A_0 := ∅ A0:=。 代理通过 LSTM 通过以下方式对转换历史进行编码
    在这里插入图片描述
  • 其中 a l − 1 : = [ r l − 1 ; e l ] ∈ R 2 d a_{l−1} := [r_{l−1}; e_l] ∈ R^{2d} al1:=[rl1;el]R2d 对应于前一个动作的向量空间嵌入(或 a 0 a_0 a0 的零向量),其中 r l − 1 r_{l-1} rl1 e l e_l el 分别表示关系和尾实体在 R d R^d Rd 中的嵌入。 历史相关动作分布由下式给出
    在这里插入图片描述
  • 其中 A l ∈ R ∣ A S l ∣ × 2 d A_l ∈ R^{|A_{S_l}|×2d} AlRASl×2d 的行包含来自 S l S_l Sl 的所有可接受动作的潜在表示。 矩阵 W 1 W_1 W1 W 2 W_2 W2 是可学习的权重矩阵。动作 A l ∈ A S l A_l ∈ A_{S_l} AlASl 是根据
    在这里插入图片描述
  • 对于每个过渡步骤,重复方程 (1)-(3)。 总共采样了 L 个转换,其中 L 是确定最大路径长度的超参数,导致路径表示为
    在这里插入图片描述
  • 对于每一步 l ∈ { 1 , 2 , . . . , L } l ∈ \{1, 2, . . . , L\} l{1,2,...,L},代理也可以选择留在当前位置,不延长推理路径。
  • 等式 (1) 和 (2) 定义了从历史空间到所有可接受行为的分布空间的映射。 因此,包括等式 (3),随机策略 π θ π_θ πθ 被引入,其中 θ θ θ 表示等式 (1) 和 (2) 中所有可训练参数的集合。
  • 元路径 考虑一组元路径 M = { M 1 , M 2 , . . . , M m } M = \{M_1, M_2, . . . , M_m\} M={M1,M2,...,Mm},其中每个元素对应于以 C t D CtD CtD 为规则头的循环规则的主体。 对于每个元路径 M M M,我们用 s ( M ) ∈ R > 0 s(M) ∈ R>0 s(M)R>0 表示一个分数,该分数表示相应规则的质量度量,例如关于做出正确预测的置信度或支持度。 此外,对于路径 P P P,我们用 P ~ \tilde{P} P~ 表示相应的元路径。
  • 奖励和优化 在训练过程中,智能体到达最终位置后,根据
    在这里插入图片描述
  • 第一项表示药剂 是否达到了化合物 e c e_c ec 可以治疗的正确目标疾病。 这意味着代理会因正确的预测而获得 1 的奖励。 第二项表示提取的元路径是否对应于规则的主体并相应地添加到奖励中。 超参数 b b b 可以是 1。 即,只要元路径对应于规则的主体,奖励总是增加,或者 b b b 可以设置为 1 { e L + 1 = e d } 1_{\{ e_{L+1}=e_d\}} 1{eL+1=ed}。例如,仅当预测也正确时才应用额外奖励。 启发式地讲,我们想要奖励代理提取与高分规则体相对应的元路径。 超参数 λ ≥ 0 λ ≥ 0 λ0 平衡了奖励的两个组成部分。 对于 λ = 0 λ = 0 λ=0,我们恢复算法 MINERVA。
  • 我们采用 REINFORCE [35] 来最大化预期回报。 因此,代理的最大化问题由下式给出
    在这里插入图片描述
  • 其中 D D D 表示 ( e c , T r e a t s , e d ) (e_c, Treats, e_d) (ec,Treats,ed)-三元组的真实基础分布。 在训练期间,我们用训练集上的经验平均值代替等式(5)中的第一个期望。 第二个期望是通过对每个训练样本的多个 rollout 的平均老化来近似的。

实验

数据集

  • Hetionet [13] 是一个生物医学知识库,它整合了来自 29 个享有盛誉和被引用的公共数据库的信息,包括统一医学语言系统 (UMLS) [3]、基因本体论 [1] 和 DrugBank [36]。 它由具有 11 种不同类型的 47,031 个实体和具有 24 种不同类型的 2,250,197 条边组成。 图 1b 说明了架构并显示了不同类型的实体以及它们之间可能的关系。
  • Hetionet 在许多方面与 KG 推理文献中通常使用的标准基准数据集不同。 表 1 总结了 Hetionet 的基本统计数据以及流行的基准数据集 FB15k-237 [31] 和 WN18RR [7]。 Hetionet 和其他两个基准数据集之间的主要区别之一是三元组的密度。即,Hetionet 中的平均节点度明显高于其他两个 KG。 Anatomy 类型的实体是密集连接的枢纽节点,此外,Gene 类型的实体的平均度数约为 123。这对我们的应用程序起着至关重要的作用,因为连接 Compound 和 Disease 的许多相关路径会遍历 Gene 类型的实体(参见 图 1b 和表 2)。 根据每种实体类型的总计数和平均节点度显示在附录 A 中。我们将在第 4.5 节进一步讨论 Hetionet 的特殊性如何对现有的 KG 推理方法带来挑战。
    【知识图谱论文】具有生物医学知识图谱逻辑规则的神经多跳推理_第2张图片
    【知识图谱论文】具有生物医学知识图谱逻辑规则的神经多跳推理_第3张图片
  • 我们的目标是预测与化合物和疾病相对应的实体之间的类型处理的边缘,以便根据在新的治疗应用中成功重新利用药物的可能性进行候选排名。 Hetionet 中有 1552 种化合物和 137 种疾病,在化合物和疾病之间观察到 775 种类型治疗的联系。 我们将这 755 个三元组随机分成训练、验证和测试集,其中训练集包含 483 个三元组,验证集包含 121 个三元组,测试集包含 151 个三元组。

元路径作为背景信息

  • Himmelstein 等人 [13] 评估了 1206 个元路径,这些元路径将化合物类型的实体与疾病类型的实体连接起来,它们对应于各种药理功效机制。他们确定了 27 个有效的元路径,作为逻辑回归模型的特征,该模型输出化合物对疾病的治疗概率。在这些元路径中,我们选择 10 个元路径作为背景信息,它们的路径长度最多为 3 并且表现出正回归系数,这表明它们对于预测药物疗效的重要性。我们使用元路径作为规则体,使用规则的置信度作为质量分数(参见第 3 节)。规则的置信度定义为规则支持除以数据中的主体支持。我们通过对 5,000 个元路径对应于规则主体的路径进行采样,然后计算规则头持有的频率来估计每个规则的置信度分数。表 2 中给出了 10 个元路径及其分数的概述。

实验装置

  • 我们将我们的 PoLo 方法应用于 Hetionet,并计算 hits@1、hits@3、hits@10 的值以及链接预测任务的平均倒数排名 (MRR)。 论文中的所有指标都经过过滤 [4] 并针对尾部预测进行评估。 在推理过程中,进行波束搜索以找到最有希望的路径,并根据目标实体对应路径的概率对目标实体进行排名。 此外,我们考虑了另一种评估方案(PoLo(修剪)),该方案仅从测试部署中检索和排名与表 2 中的一个元路径相对应的那些路径。排名中不考虑所有其他提取的路径。
  • 我们将 PoLo 与以下基线方法进行比较。 基于规则的方法 AnyBURL [19,20] 基于路径采样挖掘逻辑规则并将其用于推理。 TransE [4]、DistMult [38]、ComplEx [32]、ConvE [6] 和 RESCAL [26] 方法是流行的基于嵌入的模型,我们使用 LibKGE 库中的实现。 为了涵盖基于图的机器学习的最新范式,我们包括了图卷积方法 R-GCN [30] 和 CompGCN [34]。 我们还将我们的方法与神经符号方法 pLogicNet [27] 进行了比较。 这两种神经符号方法 NTP [29] 和 Neural LP [39] 在较小的数据集上产生了良好的性能,但不能扩展到像 Hetionet 这样的大型数据集。 我们还对 NTP 的两个更可扩展的扩展(GNTP [22] 和 CTP [23])进行了实验,但两者都无法在合理的时间内产生结果。 更多实验细节可以在附录 B 中找到。

结果

  • 表 3 显示了在 Hetionet 上的实验结果。 PoLo 和 MINERVA 的报告值对应于五次独立训练运行的平均值。 报告指标的标准误差在 0.006 到 0.018 之间。 PoLo 在所有评估指标方面都优于所有基线方法。
    【知识图谱论文】具有生物医学知识图谱逻辑规则的神经多跳推理_第4张图片
  • 应用修改后的排名方案,我们的方法在最佳性能基线方面产生了 27.7% 的 hits@1、14.9% 的 hits@3、8.1% 的 hits@10 和 16.2% 的 MRR。
  • 图 3a 显示了规则的准确性, 例如,对于 PoLo 和 MINERVA 在训练期间,遵循规则元路径的提取路径的正确目标实体的百分比。 两条线在开始时表现相似,但与 MINERVA 相比,PoLo 的规则准确度在 epoch 20 左右显着提高。 似乎给代理提取规则的额外奖励也提高了在应用规则时到达正确目标实体的概率。 我们还比较了在训练期间评估验证集的指标 hits@1(剪枝)(见图 3b)。 在 epoch 20 左右,PoLo 的规则准确性与 MINERVA 相比有所提高,hits@1(修剪)也有所增加,而 MINERVA 则有所降低。 提取规则路径的额外奖励可以看作是一种正则化,可以减轻过度拟合,并允许进行更长时间的训练以改善结果。
    【知识图谱论文】具有生物医学知识图谱逻辑规则的神经多跳推理_第5张图片
  • PoLo 在测试期间最常提取的元路径是
    在这里插入图片描述
  • 测试过程中有 37.3% 的路径遵循此规则,其中 16.9% 以正确的实体结束。
  • 在测试期间,PoLo 在 41.7% 的部署中提取了与规则对应的元路径,而 MINERVA 仅在 36.9% 的情况下提取了规则路径。 规则的准确性, 例如,当遵循规则路径时,正确目标实体的百分比对于 PoLo 为 19.0%,对于 MINERVA 为 17.6%。

讨论

  • 我们通过新的奖励机制将逻辑规则作为背景信息集成到多跳推理方法MINERVA 中。 随机策略包含在训练期间呈现给代理的一组规则。 我们的方法不仅限于 MINERVA,还可以作为一种通用机制,将领域知识注入到基于强化学习的 KG 推理方法中[18,37]。 虽然我们采用以数据驱动方式提取的规则,但我们的方法对背景信息的来源是不可知的。
  • 提取规则路径的额外奖励可以被认为是一种正则化,它诱导代理沿着元路径行走,这些元路径泛化到未见过的实例。 特别是,对于 PoLo(剪枝),我们只考虑与逻辑规则相对应的提取路径。 然而,结果候选答案的排名不是基于规则的全局质量度量(例如,置信度)。 相反,排名由代理的策略给出(即,更有可能被提取的元路径排名更高),这创建了对提取的规则进行自适应重新加权,将各个实例路径考虑在内。
  • 多跳推理方法通过提供显式推理路径包含自然透明机制。这些路径允许领域专家评估和监控预测。通常,可解释性和性能之间存在固有的权衡,但令人惊讶的是,我们的实验结果表明,基于路径的推理方法在药物再利用任务上优于现有的黑盒方法。具体来说,我们将我们的方法与基于嵌入的方法 TransE、DistMult、ComplEx、ConvE 和 RESCAL 进行了比较。这些方法经过训练以最小化直接一阶邻域中的重建误差,同时丢弃高阶邻域。然而,药物再利用环境中的大多数解释性元路径的长度为 2 或更长 [13]。虽然 MINERVA 和 PoLo 可以明确地对多跳进行推理,但我们的结果表明,适合低阶近似的基于嵌入的方法似乎不适合药物再利用任务,而且生物医学 KG 上的其他推理任务可能导致类似的结果。
  • R-CGN 和 CompGCN 通过聚合来自相邻节点的传入消息并将此信息与节点自己的嵌入相结合来学习节点嵌入。 这些方法原则上能够对长期依赖关系进行建模。 由于感受野包含多跳邻域中的整个节点集,因此聚合和组合步骤本质上充当输入信号的低通滤波器。 这在存在许多高度节点的情况下可能会出现问题,例如在 Hetionet 中,其中中心节点接收到平滑邻域嵌入的无信息信号。
  • pLogicNet 和 AnyBURL 方法都涉及规则的学习,并在 Hetionet 上产生类似的性能,这比 PoLo 差。 最有可能的是,Hetionet 中大量的高度节点使得逻辑规则的学习和应用更加困难。 其他神经符号方法,如 NTP、其扩展和神经 LP,无法扩展到 Hetionet。
  • 为了说明我们方法的适用性,请考虑以治疗肝癌、肾癌和甲状腺癌而闻名的化合物索拉非尼(见图 2)的例子。 我们的模型对新目标疾病的最高预测包括胰腺癌、乳腺癌和血液系统癌症。 这个结果似乎是合理的,因为索拉非尼已经治疗了其他三种癌症类型。 数据库 ClinicalTrials.gov [33] 列出了 16 项测试索拉非尼对胰腺癌作用的临床研究、33 项乳腺癌研究和 6 项血液癌研究,表明预测的疾病是进一步研究的有意义的目标 . 附录 C 中提供了在 Hetionet 上进行药物再利用的另一个示例。

其他数据集的实验

  • 我们还对基准数据集 FB15k-237 和 WN18RR 进行了实验,并将 PoLo 与其他基线方法进行了比较。 由于我们还没有可用的逻辑规则,我们使用 AnyBURL 学习的规则。 我们只能对 PoLo 应用循环规则,因此我们也与仅使用 AnyBURL 学习和应用循环规则的设置进行比较。
  • 我们的方法在两个数据集上的性能大多优于 MINERVA 和 Neural LP。 对于 FB15k-237,PoLo 的性能比 AnyBURL 和大多数基于嵌入的方法差,这可能是因为与其他数据集相比,在图中多次出现的唯一元路径的数量较低 [5]。 这使得 PoLo 难以提取足够多的十个元路径以进行良好的泛化。 pLogicNet 在 FB15k-237 上的性能优于 PoLo,但在 WN18RR 上的性能较差。 FB15k-237 和 WN18RR 上的 AnyBURL 仅使用循环规则时的结果比还包括非循环规则时差。 似乎非循环规则对预测也很重要,但 PoLo 不能利用这些规则。 两个数据集的详细结果可以在附录 D 中找到。

结论

  • 生物医学知识图对学习算法提出了挑战,这些挑战未反映在通用基准数据集中。 我们的实验结果表明,现有的知识图推理方法在 Hetionet 上面临困难,Hetionet 是一种生物医学知识图,同时表现出远程依赖关系和大量高度节点。 我们提出了利用表示学习和逻辑的神经符号方法 PoLo。 具体来说,我们通过新的奖励机制将逻辑规则集成到基于强化学习的多跳推理方法中。 我们将我们的方法应用于药物再利用的高度相关任务,并将我们的方法与基于嵌入、基于逻辑和神经符号的方法进行比较。 结果表明,与流行的最先进方法相比,PoLo 的性能更好。 此外,PoLo 还通过提取用作预测解释的推理路径来提供可解释性。

你可能感兴趣的:(医疗人工智能,深度强化学习,知识图谱文献阅读,知识图谱,人工智能,数据挖掘)