《知识图谱》赵军 阅读笔记(一)——第一章 概述

第一章 概述 阅读笔记

  • 1.1 什么是知识图谱
  • 1.2 知识图谱发展历程
  • 1.3 知识图谱类型
  • 1.4 知识图谱生命周期
    • 1.4.1 知识体系构建
    • 1.4.2 知识获取
    • 1.4.3 知识融合
    • 1.4.4 知识存储
    • 1.4.5 知识推理
    • 1.4.6 知识应用
  • 1.5 知识图谱与深度学习

2020.3.1 补充:本学期选修了赵老师的知识图谱相关课程,根据赵老师讲述内容对本篇进行补充。

1.1 什么是知识图谱

根据维基百科的描述,知识图谱是谷歌公司用来知识从语义角度组织网络数据,从而提供智能搜索服务的知识库。
知识图谱使用结构化三元组的形式存储现实世界中的实体以及实体关系。

1.2 知识图谱发展历程

知识图谱的发展历程可以从两个领域追溯,一个是人工智能,另一个是语义网。

对于人工智能领域来说,知识图谱其实是伴随着人工智能技术发展而发展的。由于人工智能中对于在信息获取、分析、理解的需要,知识工程这一概念首先被提出。之后的研究者使用各种表示方法构建知识库,这就是知识图谱。
《知识图谱》赵军 阅读笔记(一)——第一章 概述_第1张图片
对于语义网来说,万维网现在采用的超文本标记语言HTML,是面向人的存储和共享信息的媒介,Web上的内容是提供给人而不是机器来理解和浏览的。由于Web内容没有采用形式化的表示方式,并且缺乏明确的语义信息,故而计算机“看到的”Web内容只是普通的二进制数据,对其内容无法进行识别。如果机器不能充分理解网页内容的含义,就无法实现Web内容的自动处理。
另外,万维网是根据网页的地址,而非内容的语义来定位信息资源的(缺少语义联接),网上所有信息都是由不同的网站发布的,相同主题的信息分散在全球众多不同的服务器上,又缺少有效工具能将不同来源的相关信息综合起来,因此形成了一个个信息孤岛(其中有大量重复),查找自己所需的信息就像大海捞针一样困难。
语义网就是以Web数据的内容(即数据的语义)为核心,用机器能够理解和处理的方式链接起来的海量分布式数据库。语义网是对现有Web增加了语义支持,它是现有万维网的延伸与变革,其目标是帮助机器在一定程度上理解Web信息的含义,使得高效的信息共享和机器智能协同成为可能。语义网将会为用户提供动态、主动的服务,从而更便于机器和机器、人和机器之间的对话及协同工作。

1.3 知识图谱类型

知识图谱分类可以按照以下几个方式分类。
根据知识的主客观性,分为下面两种:

  1. 事实性(客观性)知识:指那些确定性的、不随状态变化而改变的知识。
  2. 主观性知识:指某个人或者群体性感知的知识。

根据知识的变化性质,已有的知识可以分为静态知识和动态知识。
另外,还可以分为领域知识、百科知识、场景知识、语言知识、常识知识等等。

而目前已经构建的、比较有名的知识图谱有以下几个,其他的知识图谱还有很多,如影视知识图谱IMDB等。想要了解具体相关内容可以自己百度。

类别 名称 简介
人工构建 Cyc/OpenCyc 一个高质量英文电子词典和语言本体
WordNet 一个人工撰写的常识知识库
基于维基百科 DBPedia 一个部分结构化的Wikipedia,社区人工构建Taxonomy
YAGO 一个部分结构化的Wikipedia,Taxonomy:WordNet+WikipediaCategories
WikiTaxonomy
Freebase 一个大规模协同构建知识库,整合Wikipedia,WordNet以及多个百科知识库
BabelNet
开放知识抽取 KnowItAll
NELL 一个基于文本信息抽取技术持续不断更新的知识库
Probase
企业知识图谱 百度知心,搜狗知立方
MS sotor,Google KG

1.4 知识图谱生命周期

知识图谱的生命体系是指知识图谱从无到有,从构建到应用的过程。其主要的过程如下所示

知识体系,即建模领域知识结构
知识获取,即获取领域内的事实知识
知识集成,即估计知识的可信度,将碎片知识组装成知识网络
知识服务,即知识存储/查询/应用

1.4.1 知识体系构建

即知识建模,指用什么样的方式表达知识和形式构建一个本体对目标知识进行描述。目前流行的表示方法是使用RDF(资源描述框架)进行描述。其基本数据结构包含了三种类型:资源谓词以及陈述

1.4.2 知识获取

目前知识图谱中的数据主要来源有各种各样的结构化数据、半结构化数据以及非结构化文本数据。
工业界主要是从结构化数据、半结构化数据中抽取知识来构建知识图谱
而学术界主要是通过非结构化文本数据中抽取三元组来构建知识图谱。

1.4.3 知识融合

即利用各种各样的知识和对已有的知识图谱进行补充。

1.4.4 知识存储

即研究如何对获取的知识进行存储。目前主要有两种形式,一种是RDF格式存储另一种是图格式存储。

1.4.5 知识推理

利用推理手段发现已有知识中的隐藏知识。

1.4.6 知识应用

目前常用的知识图谱的应用领域主要包括智能搜索、自动问答、智能推荐、决策支持等领域。

1.5 知识图谱与深度学习

目前,在知识图谱构建和应用的各个环节中,越来越多的任务采用深度神经网络建模,并取得了一定的效果。

你可能感兴趣的:(知识图谱学习)