知识图谱赵军学习笔记(九)--知识推理

知识图谱中的推理任务

知识推理是人工智能应用迈向更高级认知智能的重要技术。包括知识补全和知识问答。

知识补全

面向知识库或者知识图谱的事实补全
如图谱中给出了出生地但没有国籍,即可以通过推理的方法把实体或关系预测出来。称为链接预测。
它是利用已知知识预测未知的隐含知识,利于完善现有知识图谱。
包含两个评测任务:

  • 三元组分类
    判断是否正确 比如
    首都(北京,中国)
    首都(成都,中国)是错的,二分类问题,
    过程是补全时可以选一条边连接任意两个实体,构成新的三元组,判断是否正确。
  • 链接预测
    预测三元组的头实体或尾实体
    能预测出则能加关系。

知识问答

  • 简单推理
    将问题转化为图谱上三元组的查询或者三元组序的查询。对于缺失的需要使用推理,例如唐朝开国皇帝是谁,若开国皇帝(唐朝,李渊)是缺失的。通过前文的链接预测开国皇帝(唐朝,X)。若问开国皇帝的父亲是谁,推理开国皇帝(唐朝,李渊),再对父亲(李渊,x)进行查询和推理。
  • 复杂推理
    表示成多个链接组成的非链式或有嵌套的复杂结构时,需要推理。
    桃花开花后结果,问开花的目的是什么
    答案是吸引蜜蜂采蜜,就是一个推理问题。

知识推理分类

归纳推理和演绎推理

  • 归纳推理
    从特殊到一般的过程。根据部分对象具有的性质,推出一类事物中所有对象都具有的这类性质的推理方式。
    • 对资料进行观察、分析和归纳整理
    • 得出规律性的结论,即猜想
    • 检验猜想
      例如<蓝鲸,可以喷射,水柱>
      <抹香鲸,可以喷射,水柱>
      观察整理得:

      检验猜想:
      <齿鲸,是一种,鲸鱼>
      <齿鲸,可以喷射,水柱>
  • 演绎推理
    从一般到特殊
    大前提,小前提,结论
    大前提:
    虎鲸背部有背鳍
    小前提:
    背部有背鳍的鲸鱼都属于海豚科
    结论:
    虎鲸属于海豚科

确定性推理与不确定性推理

  • 确定性逻辑推理
    逻辑推理,具有完备的推理过程和充分的表达能力
  • 不确定性推理
    根据以往的经验和分析,结合专家先验知识构建概率模型,并利用统计计数、最大化后验概率等统计学习的手段对推理假设进行验证或推测。
    • 概率图模型
      有向图的贝叶斯网络以及无向图的马尔科夫网络
      NP难题 主要的改进有:
      1. 基于和积变量消除的方法,通过对一个变量求和,并和其他因子相乘以消除变量,简化
      2. 基于概率图结构的置信传播或期望传播的方法,将原有的推理问题转为优化问题,优化 的方式设计好的能力函数或势函数求解概率最大以达到推理的目的
      3. 从所有实例触发,都其进行统计或采样以估计推理目标概率,如蒙特卡洛采样等
        只对具有直接概率依赖的实例级元素,并没有对更高层次的语义框架进行抽象,但需要大量的重复的概率依赖关系,需要大量计算。
    • 概率逻辑推理
      弥补了概率图模型中缺乏可复用规则的特点。
      结构学习又可以称为概率逻辑推理模型下的规则自动挖掘。迭代局部搜索代替全局搜素。
    • 关联规则挖掘
      路径排序算法是基于图模型上随机游走的启发式方法,通过枚举或抽样图上的两个节点间的路径,递归地计算两个点间的到达概率,对每个路径进行打分。

符号推理和数值推理

传统的逻辑推理。特点是在知识图谱中的实体和符号上直接进行推理了操作。

基于符号演算的推理

归纳推理:学习推理规则

有三大方法

  • 频繁子图挖掘
    父亲(x,y)^母亲(y,z)->奶奶(x,z)
    频繁子图规则挖掘是一个相反的过程,它是搜索知识图谱的规则实例,再将规则实例中的实体替换成变量,加约束,确定规则的实用性。
    计算路径 剪枝
    AMIE算法:

    • 增加悬挂边
    • 增加具体边
    • 增加闭合边
  • 归纳逻辑编程
    更重视没有没有出现在图谱中的负三元组,认为 正例+负例+背景知识->假设。

  • 结构学习方法
    挑选整体概率最大的加入到推理模型中。 + 定义目标函数

  • 创建逻辑规则结构

  • 搜索逻辑规则的策略

  • 提速方法

演绎推理:推理具体事实

  • 确定性推理:λ推理
    λ程序语言设计的模型。
    λ三种操作:
    • α-置换
    • β-归约
    • η-变换
  • 不确定性推理:马尔科夫逻辑网和概率软逻辑
    马尔科夫逻辑是被看成一种通过为逻辑规则绑定权重的方式将一阶逻辑向概率逻辑进行扩展的方法,当权重调整到无限大时,为一阶逻辑。
    软逻辑是一种基于一阶逻辑谓词和马尔科夫逻辑网络的统计学习关系票框架。

基于数值计算的推理

将离散的符号表示成低维实数向量或矩阵以捕捉元素之间隐式关联的一种技术手段。
映射可以带来如下好处:

  • 减少维度灾难
  • 减少数据稀疏
    通过数值计算填充了稀疏矩阵,在一定程度上解决了数据稀疏性问题。
  • 使符号直接参与计算且计算速度非常快
    有如下方法:

基于张量分解

矩阵分解的基本思想是用多个低维的矩阵或张量的积代替原始的关系矩阵,从而用少量的参数代替稀疏而大量的原始数据。

基于能量函数

目标不是恢复出原始的关系矩阵和张量,而是根据任务的不同,自定义能量函数使得三元组能量低,不成立的能量高,计算能量函数对事实是否成立进行推理。

符号演算和数值计算的融合推理

常识知识推理

你可能感兴趣的:(NLP)