知识图谱构建技术综述

摘要

*知识图谱为实现语义化智能搜索以及知识互联打下了基础,。,
*随着知识的发展,传统的基于模板和规则构建的知识图谱已经被深度学习所替代。

  • 知识组织得原则中:知识的充分性、有序性和标准化规则。
  • 深度学习的效果在很大程度上依赖大规模的样本、缺乏先验知识。导致某些结果可能背离人类知识和先验知识
  • 深度学习不具备因果推理性,缺乏可解释性。
  • 端到端学习,人们无法清楚的解释每一个参数的意义。
  • 知识图谱用于深度学习时候的可解释性、因果推断性、指导性

知识图谱的定义和架构

  • 知识图谱旨在从多种类型的复杂数据中抽取概念、实体和关系。是事物关系的可计算模型。
    知识图谱构建技术综述_第1张图片
    知识图谱构建技术综述_第2张图片

知识图谱的体系架构

  • 第一部分:源数据的获取:即在各个类型的数据中获取最有用的资源信息。
  • 第二部分:知识融合:用于关联多数据源的知识,扩大知识范围。
  • 第三部分:知识的计算和知识的应用。
  • 知识图谱构建技术综述_第3张图片

知识图谱的构建技术

  • 知识图谱从多种数据源中提取知识并存入知识图谱,是构建大规模知识图谱的基础。
  • 知识融合可以解决不同知识图谱异构问题。
  • 知识计算是知识图谱的主要输出能力。

知识抽取

  • 命名实体识别
  • 关系抽取
  • 知识图谱构建技术综述_第4张图片
  • 知识图谱构建技术综述_第5张图片
  • 知识图谱构建技术综述_第6张图片
  • 知识图谱构建技术综述_第7张图片
  • 知识图谱构建技术综述_第8张图片

关系抽取

  • 基于传统规则和模板的方法
  • 基于传统机器学习的方法
    • 有监督
    • 半监督
    • 无监督三类。
  • 基于深度学习的方法
    • 流水线方法:CNN、RNN及其改进模型
    • 实体关系联合抽取
      • 基于参数共享的实体关系联合抽取
      • 基于序列标注的实体关系联合抽取。
      • 知识图谱构建技术综述_第9张图片
        知识图谱构建技术综述_第10张图片
        知识图谱构建技术综述_第11张图片
        在这里插入图片描述

    知识融合

    • 本体融合
      • 本体集成和本体映射两大类。
        知识图谱构建技术综述_第12张图片

本体映射

  • 基于NLP的方法

  • 基于结构的方法

  • 基于实例的方法

  • 综合方法

    • 数据融合
      • 实体合并
      • 实体对齐
      • 实体属性融合等方面
  • 知识图谱的对齐算法可以分为3类:

    • 成对实体对齐
    • 局部实体对齐
    • 全局实体对齐。

知识推理

  • 知识推理根据已经有得实体关系信息来推断新得事实结论,从而进一步丰富知识图谱,满足上游任务得需求。
  • 基于逻辑规则的推理
    • 谓词逻辑推理
    • 本体推理
    • 随机推理
  • 本体寻路算法: 该算法通过一系列并行优化技术实现大规模的知识图谱
  • 双层随机游走算法:利用无向图来表示知识图谱
    • 全局模式和局部模式2中角度下对路径特征进行评估。提高了算法的准确率和召回率。
  • 基于分布式特征表示的推理
    • 基于翻译模型的知识推
    • 基于张量分解的知识推理
    • 基于语义匹配模型的知识推理
      • 提出 DistMult模型
  • 基于深度学习的推理。
    知识图谱构建技术综述_第13张图片

深度学习指导

知识图谱构建技术综述_第14张图片

深度学习推理

  • 图网络相对于普通的神经网络具有归纳推广和组合概括能力

存在困难和挑战

  • 对于知识抽取技术,现有的实体关系联合抽
    取技术并未解决关系重叠问题
    ,算法准确率和召回率都较低。
  • 基于开放域的关系抽取还处于初级阶段多语种、大范围的多元实体关系抽取是当前面临的主要困难之一
  • 无监督关系抽取具有较高的可移植性,和泛化性,为开发域关系抽取任务提供了新的思路。
  • 对于知识融合技术,实体对齐是最主要的手段,如何实现高质量的实体对齐、共指消解是一项巨大的挑战,开放领域下的实体对齐、共指消解以多源数据库融合是当前主要的研究重点
  • ,如何在短文本情况下准确地将实体链接到知识库中亟需解决
  • 小样本学习应用到实体对齐是重要的研究方向
  • 对于知识推理技术,现有的知识推理技术大多只关注静态数据,忽略了时间信息,知识图谱的信息应该随着时间的推移而变化,因此,动态知识图谱推理还需要进行研究探索
  • ,将知识图谱应用于深度学习还处于起步阶段

结束语

经验

到此为止,慢慢的沿着综述将各种模型都给建立一波,并将其全部都搞通搞精通,完全理解透彻。

  • 经验,找到解决关系重叠有没有好的方法,根据啥进行重叠以下都行的样子与打算。
    • 给代码敲打熟悉,然后给综述性文章看个四五篇,然后开始自己找两三个自己现成的方法,自己搞研究,将其全部都搞定都行啦的样子域打算。

自己研究

可以先将动态知识图谱作为自己的研究方向。

你可能感兴趣的:(知识图谱,知识图谱,人工智能)