知识图谱的发展与构建 阅读笔记

原文:http://kns.cnki.net/KCMS/detail/detail.aspx?dbcode=CJFQ&dbname=CJFDLAST2017&filename=NJLG201701004&uid=WEEvREcwSlJHSldRa1FhdkJkVG1COGxoY2VsV0ozMXdSd3JLQmNkTXFvTT0=$9A4hF_YAuvQ5obgVAqNKPCYcEjKensW4IQMovwHtwkF4VYPoHbKxJw!!&v=MzIxMjg3RGgxVDNxVHJXTTFGckNVUkxPZlplZG5GeW5oVzc3T0t5ZkhhYkc0SDliTXJvOUZZSVI4ZVgxTHV4WVM=

  • 20 世纪中叶,普赖斯等人提出使用引文网 络来研究当代科学发展脉络的方法,首次提出了知 识图谱的概念。
  • 1977 年,知识工程的概念在第五 届国际人工智能大会上被提出,以专家系统为代表 的知识库系统开始被广泛研究和应用。
  • 20 世 纪90 年代,机构知识库的概念被提出

期望以更加智能 的方式组织互联网上的资源,期望可以更加快速、 准确、智能地获取到自己需要的信息 —— 知识图谱

1 知识图谱的发展历程
1.1 起源:知识图谱(Mapping Knowledge Domain)

  • 1955 年,加菲尔德发表了一篇题为《Citation Indexes for Science: A New Dimension in Docu-mentation through Association of Ideas》的论文,提出 了将引文索引应用于检索文献的思想。
  • 1965 年, 普赖斯在《Networks of Scientific Papers》一文[1]中 指出,引证网络———科学文献之间的引证关系,类 似于当代科学发展的“地形图”,从此分析引文网 络开始成为一种研究当代科学发展脉络的常用方 法,进而形成了知识图谱( Mapping Knowledge Domain) 的概念[10]。
    1.2 发展:知识库( Knowledge Base)
  • 1977 年,在第五届国际人工智能会议上,美国计算机科学家 B.A.Feigenbaum 首次提出知识 工程的概念。
    最典型 和成功的知识工程的应用是专家系统
    对于知识库的研究首先需要讨论的是知识的 表达和组织的基本问题。
    目前,较通用的知 识表示框架通常采用面向对象的思想,将知识拆 解成实体、实体属性以及实体之间的关系。
    1.3 形成:知识图谱( Knowledge Graph)
  • 2012 年,Google 率先提出知识图谱 ( Knowledge Graph) 的概念。
    知识图谱是一个更大 的、包含世界上所有机构知识库的知识集合
    知识图谱的发展与构建 阅读笔记_第1张图片
    知识图谱作为一种知 识管理的新思路,已经不再仅仅局限在搜索引擎 应用,在各种智能系统( 如 IBM Watson) ,以及数 据存储( 如 graph database, neo4j) 领域也已崭露 头角。
    2 知识图谱的数据来源
    2.1 网页数据
    以维基百科为代表的百科类网站
    深网数据
    2.2 数据库
    搜索日志
    3 知识图谱的构建
    知识图谱的构建过程可以分为自顶向下和自 底向上两种方式。自顶向下的构建过程如图2 所 示,首先从数据源中学习本体,得到术语、顶层的 概念、同义和层次关系以及相关规则,然后进行实 体学习的过程,将实体纳入前面的概念体系中。 自底向上的构建过程与此相反,从归纳实体开始, 进一步进行抽象,逐步形成分层的概念体系。在 实际的构造过程中,可以先后混合使用两种方式, 来提高实体抽取的准确度。
    知识图谱的发展与构建 阅读笔记_第2张图片
    3.1 本体学习
    本体学习的 过程主要包括术语、同义词、概念、分类关系以及 公理和规则抽取。
    3.1.1 术语抽取
    术语抽取的实现方法有多种,主 要包括下面几类。
  • 基于字典的方法通过定义一些 包含术语的字典,从待处理文本查找字典中定义 的术语
  • 基于规则的方法则通过定义术语在语法上的一些规则,从待处理文本中找到匹配规则的 术语;
  • 基于统计的方法一般是通过统计术语出现 的次数来对待处理文本中的潜在术语进行预测;
  • 基于机器学习的方法可以对术语的语法规则或者 上下文的特征进行学习,从而实现对待处理文本 的术语抽取。
    3.1.2 同义关系抽取
    3.1.3 概念抽取
    3.1.4 分类学关系抽取
  • 基于词法模式的原理,根据语句构成成分之 间的语义关系,预测语句整体的意义。
  • 基于开放链接数据和基于在线百 科的方法
    3.1.5 公理和规则学习

3.2 实体学习
3.2.1 实体对齐
3.2.2 实体填充
4 知识图谱上的挖掘
4.1 知识推理
4.2 用户搜索意图的挖掘
5 知识图谱的更新和维护
5.1 数据模式层的更新
5.2 数据层的更新
6 结束语

这篇论文值得再读

你可能感兴趣的:(知识图谱的发展与构建 阅读笔记)