【人工智能】4.知识图谱初步

(来源:北航王岩老师ppt)

一、什么是知识?

1.知识

1)知识定义
Feigenbaum: 知识是经过消减、塑造、解释和转换的信息
Bernstein:知识是由特定领域的描述、关系和过程组成的。
知识库的观点:知识是某领域中所涉及的各有关方面的一种符号表示。
2)知识分类
事实性知识:又称为叙述性知识,是用来描述问题或事物的概念、属性、状态、环境及条件等情况的知识。
过程性知识:描述做某件事的过程,问题解决所要进行的操作。
行为性知识:不直接给出事实本身,只给出它在某方面的行为,表现。
元知识:有关知识的知识。或超知识,是关于如何运用已有知识进行问题求解的知识。
3)知识的要素
事实:事物的分类。属性、事物间关系、科学事实、客观事实等。(最底层知识)
规则:事物的行动、动作和联系的因果关系知识。(启发式规则)
控制:当有多个动作同时被激活时,选择哪一个动作来执行的知识。
元知识:怎样使用规则、解释规则、校验规则、解释程序结构等知识。(高层知识)

2.知识表示

谓词逻辑法、产生式规则表示法、语义网络表示法框架表示法、脚本表示法、面向对象表示法、过程表示等。

二、两种结构化知识表示方法

1.框架表示法

明斯基于1975年在其论文“A Framework for Representing Knowledge”中提出,框架理论认为,我们对世间事物的认识都是以类似框架的结构存储在记忆中的。当遇到一个新事物就从记忆中找出一个合适的框架,并根据新的情况对齐细节加以修改、补充,从而形成对这个新事物的认识。
1)基本结构
框架通常有描述事物各个方面的若干(slot)组成,每一个槽也可以根据实际情况拥有若干个侧面(aspect),每一个侧面又可以拥有若干个(value)。槽值或侧面值既可以是数值、字符串、布尔值,也可以是一个在满足给定条件时要执行的动作或过程,它还可以是另一个框架的名字。
【人工智能】4.知识图谱初步_第1张图片
2)框架表示
当框架比较复杂时,需要多个框架互相联系组成框架系统。
基本结构:横向或纵向联系。
横向联系:一个框架的槽值或侧面值可以是另外一个框架的名字,即对另一个框架的调用
纵向联系:具有继承关系的框架之间构成纵向联系。
框架之间的纵向联系:纵向联系是通过定义槽名AKO、ISA来实现的。
框架之间的横向联系:一个框架的槽值或侧面值可以是另外一个框架的名字,这就在框架之间建立了横向联系。
3)例子
例如硕士框架可以用学生框架和新的硕士框架来表示,其中新的这个硕士框架是学生框架的子框架。
学生框架描述所有学生的共性,硕士框架描述硕士生的个性,并继承学生框架的所有属性
学生框架中的地址槽值是另一个框架,这样就是一种横行的调用关系。
【人工智能】4.知识图谱初步_第2张图片
【人工智能】4.知识图谱初步_第3张图片
4)框架表示法的求解过程继承 匹配
①将待求解问题表示成框架,待求解答案的槽值或侧面值为空。
②在框架系统中寻找与求解问题框架匹配的框架。
③通过匹配框架的槽值或侧面值推出问题答案。
推理过程是以继承槽(AKO,Instance,ISA等)的层次结构为基础,按照一定的搜索策略,不断寻找可匹配的框架进行填槽的过程。

2.语义网络表示法

1)语义网络的概念
①语义网络是一种用结点来表达实体之间语义关系的有向图
②节点:表示实体,表示各种事物、概念、情况、属性、状态、事件、动作等。
③弧:代表语义关系,表示它所连接的两个实体之间的语义联系。
节点和弧都必须有标志,用来说明它所代表的实体或语义
④语义基元:有向图表示的三元组(结点1,弧,结点2)是最基本的语义单元。

2)基本语义关系
①实例关系:即一个事物是另一个事物的具体例子。ISA
【人工智能】4.知识图谱初步_第4张图片
②分类关系(泛化关系):表示一个事物是另一个事物的一个成员。AKO
【人工智能】4.知识图谱初步_第5张图片
③成员关系:体现个体与集体的关系,表示一个事物是另一个事物的成员型。A-Member-of
【人工智能】4.知识图谱初步_第6张图片
①、②、③是具有继承属性的。
④属性关系:是指事物与其行为、能力、状态、特征等属性之间的关系,因此属性关系可以有许多种。Have Can…
⑤包含关系(聚类关系):是指具有组织或结构特征的“部分与整体”之间的关系。Part-of
⑥时间关系:表示时间上的先后次序关系。Before After
⑦位置关系:是指不同的事物在位置方面的关系。Located-on
3)语义网络表示方法
一元关系的语义网络表示、二元关系的语义网络表示、多元关系的语义网络表示:一元和二元都是最简单的,多元关系通常还会增加关系节点、动作节点、事件节点、情况节点等,附有这类节点的主体和客体,例如:
【人工智能】4.知识图谱初步_第7张图片
分块语义网络:
【人工智能】4.知识图谱初步_第8张图片
4)推理求解过程
继承:指把对事物的描述从抽象结点传递到具体结点。
(1)建立一个结点表,用来存放待求解结点和所有以继承弧与此结点相连的那些结点。初始情况下,表中只有待求解结点。
(2)检查表中的第一个结点是否有继承弧。如果有,就把该弧所指的所有结点放入结点表的末尾,记录这些结点的所有属性,并从结点表中删除第一个结点。如果没有,仅从结点表中删除第一个结点。
(3)重复(2),直到结点表为空。此时,记录下来的所有属性都是待
求解结点继承来的属性。
匹配:在知识库的语义网络中寻找与待求解问题相符的语义网络模式。
(1)根据待求解问题的要求构造一个网络片断,该网络片断中有些结点或弧的标识是空的,称为询问处,它反映的是待求解的问题。
(2)根据该语义片断到知识库中去寻找所需要的信息。
(3)当待求解问题的网络片断与知识库中的某语义网络片断相匹配时,则与询问处相匹配的事实就是该问题的解。

三、知识图谱简介

1.概述

知识图谱作为一种语义网络,是大数据时代知识表示的重要方式之一;知识图谱作为一种技术体系,是大数据时代知识工程的代表性进展

2.定义

知识图谱中的节点表示概念和实体,概念是抽象出来的事物,实体是具体的事物;表示事物的关系和属性,事物的内部特征用属性来表示,外部联系用关系来表示。

知识图谱是由一些相互连接的实体以及它们的属性构成的。知识图谱由一条条知识组成,每条知识可以表示为一个SPO三元组(Subject-Predicate-Object)。

3.历史

KG的前世今生

4.本质

Web视角 像建立文本之间的超链接一样,建立数据之间的语义链接,并支持语义搜索
NLP视角 怎样从文本中抽取语义和结构化数据
KR视角 怎样利用计算机符号来表示和处理知识
AI视角 怎样利用知识库来辅助理解人的语言

5.与深度学习的关系

人工智能的进展突出体现在以知识图谱为代表的知识工程以及以深度学习为代表的机器学习等相关领域;蕴含人类大量先验知识的知识图谱尚未被深度学习有效利用;以知识图谱为代表的符号主义,和以深度学习为代表的联结主义。知识图谱+人工智能=新型网络信息体系。
深度学习:聪明的AI–感知 识别 判断
知识图谱:有学识的AI–思考 语言 推理

6.构建过程

知识图谱的大致构建过程:知识抽取、知识融合、模型构建、知识推理、质量评估,循环往复,迭代更新,知识图谱不是一次性生成。
1)知识图谱构建中的数据类型:
结构化数据(Structed Data):关系数据库
半结构化数据(Semi-Structed Data):XML、JSON、百科
非结构化数据(UnStructed Data):图片、音频、视频、文本
2)知识抽取:
从半结构化和无结构数据中抽取实体、关系以及实体属性等结构化信息实体抽取、关系抽取和属性抽取
方法主要有知识工程的方法(正则表达式、模板匹配、规则约束),基于本体的抽取(基于图的抽取),基于模型的抽取(SVM、LSTM、监督学习、聚类)
3)知识融合:
不同数据集(知识库)中找出同一个实体的描述记录;对不同知识库中的实体知识进行互补融合,形成全面、准确、完整的实体描述实体对齐,关系对齐,属性对齐。
4)知识推理:
推理是指基于已知事实推出未知的事实的计算过程。目前主要是基于描述逻辑、规则、概率逻辑的推理。还有基于表示学习与神经网络的推理。

你可能感兴趣的:(人工智能/机器学习,知识图谱,人工智能)