畅谈知识表示与知识图谱

一、知识表示的概念

        知识表示是把知识符号化,转送给计算机,这是 知识工程的核心领域。通过知识的有效表示,使人工智能程序能利用这些知识做出决策、制定计划、识别状况、分析事件以及获取结论等。知识表示不仅是人工智能的重要研究内容,而且己经形成了一个独立的子领域(知识工程)。

畅谈知识表示与知识图谱_第1张图片

图1 知识图谱与知识表示 

知识:是人们在改造客观世界的实践中积累起来的认识和经验。

认识:对事物现象、本质、属性、状态、关系、联系和运动等的认识。

经验:解决问题的微观方法(如:步骤、操作、规则、过程、技巧等)和宏观方法(如战略、战术、计谋、策略等)。

二、知识表示方法

1、一阶谓词

是命题逻辑的扩充和发展。它将一个原子命题分解成客体和谓词两个组成部分。是数理逻辑的基本形式,是基于谓词分析的一种形式化(数学)语言。人工智能中的谓词逻辑法是指用一阶谓词来描述问题求解和定理证明。

谓词是指个体(客体)所具有的性质或者若干个体之间的关系。用大写字母来表示。 个体是可以具体的(如,小张、杨老师、5)也可以是抽象的(如,x, y)。

  1. 产生式

系统构成:知识库、总数据库、一个推理引擎

知识库

 (1)知识元:即事实,证据,断言,数据, …是不能分解的最小知识片,知识元集 = 知识库(KB)中所有产生式包含的 知识元的全体;

(2) 规则:也称为知识片,每条规则(或称每个产生式)指明 了知识元之间的关系;

 (2)元知识:控制策略。如何使用规则的知识(例如,规则匹 配的先后次序,匹配冲突的解决等)。

总数据库:综合数据库、上下文、黑板

一个推理引擎(Engine):

负责整个产生式系统的运行,包括:规则左部与DB匹配;从匹配成功的规则中,选出一条将在下一步执行的规则,执行右部规定的动作;

畅谈知识表示与知识图谱_第2张图片

图2 产生式系统

  1. 框架

框架是一种描述所讨论对象(事物、事件、概念等)属性和行为的数据结构。

一般可以把框架看成是一个节点和关系组成的网络。框架的最高层次是固定的,并且它描述对于假定情况总是正确的事物,在框架的较低层次上有许多终端--被称为槽(Slots)。在槽中填入具体值,就可以得到一个描述具体事务的框架,每一个槽都可以有一些附加说明--被称为侧面(Facet),其作用是指出槽的取值范围和求值方法等。

畅谈知识表示与知识图谱_第3张图片

 

图3 框架表示法

  1. 语义网络

语义网络(semantic network)是一种用图来表示知识的结构化方式。在一个语义网络中,信息被表达为一组结点,结点通过一组带标记的有向直线彼此相连,用于表示结点间的关系。

畅谈知识表示与知识图谱_第4张图片

 

图4 语义网络案例

 5、其他(剧本、神经网络、自然语言等)

三、知识图谱的符号表示

在属性图的术语中,属性图是由顶点(Vertex)、边(Edge)、标签(Label)、关系类型和属性(Property)组成的有向图。顶点也称为节点(Node),边也称为关系(Relationship)。如图是由多个顶点、边、标签组成的知识图谱。

畅谈知识表示与知识图谱_第5张图片

图5 知识图谱的符号表示


早在1972年的文献中就出现了"知识图谱"这个术语,2012年5月,谷歌公司明确地提出了知识图谱的概念并构建了一个大规模的知识图谱,开知识图谱研究之先河.知识图谱用结点表示语义符号,用边表示符号与符号之间的语义关系,构成了一种通用的语义知识形式化的描述,成为了自然语言处理的重要资源.

知识图谱的向量表示


表示学习在知识图谱推理中有着重要的研究价值,将知识库中的实体和关系用连续低维向量进行表示,可实现知识的可计算.基于向量投影距离的知识表示学习模型在面对复杂关系时有较好的知识表达能力,但在处理一对一简单关系时容易受到无关信息的干扰,并且在一对多,多对一和多对多等复杂关系上存在性能提升空间.

下面使用自制的农作物知识图谱生成器AIM来介绍展示这一部分内容。

畅谈知识表示与知识图谱_第6张图片

图6 知识图谱向量节点的添加

畅谈知识表示与知识图谱_第7张图片

图7 知识图谱的向量节点生成结果


        知识图谱是一种大规模的语义网络,以三元组(实体,关系,实体)的形式表示知识,在信息检索,智能问答,推荐系统等领域广为应用.知识图谱表示学习旨在将实体和关系表示为低维实值向量,这一研究能有效缓解大规模知识图谱的数据稀疏问题,降低计算复杂度,对知识图谱补全,知识推理等具有重要意义. 目前,知识图谱表示学习的典型模型是以TransE为代表的翻译模型,通过学习三元组结构信息得到实体和关系的向量表示.同时,知识图谱中的每个实体对应一段阐述其具体含义的描述,包含丰富的语义信息.实体描述作为三元组结构信息的补充,可有效提升知识图谱表示学习的性能.现有融入实体描述的知识图谱表示学习的研究如DKRL等模型,多采用词袋模型和卷积神经网络等方式学习实体基于描述的表示,未能利用实体描述的上下文信息.另外,现有研究在学习实体基于描述的表示时未能与关系联系起来,但是实体在不同的关系下常表现不同的语义,学习实体基于描述的表示时应根据不同关系有所区别. 

来源:各教材及网上资料、参考文献和个人理解

参考文献:

  1. 杨晓慧, 万睿, 张海滨,等. 基于符号语义映射的知识图谱表示学习算法[J]. 计算机研究与发展, 2018, 55(8):12.
  2. 冯志伟. 自然语言处理的重要资源:"知识图谱"[J]. 外语学刊, 2021(005):000.
  3. 李鑫超, 李培峰, 朱巧明. 一种基于改进向量投影距离的知识图谱表示方法[J]. 计算机科学, 2020, 47(4):5.
  4. 靳京. 基于深度学习融入实体描述的知识图谱表示学习研究[D]. 北京交通大学, 2018.

你可能感兴趣的:(知识图谱,人工智能)