知识图谱基本概念

近来学习知识图谱相关技术,此文为阅读肖仰华博士《知识图谱 概念与技术》读书笔记,方便以后查阅巩固。

知识图谱的基本概念

知识图谱的狭义概念

狭义的知识图谱特指一类知识的表示,本质上是一种大规模语义网络,包含 实体 (Entity)、概念(Concept)及其之间的各种语义关系。

知识图谱作为语义网络的内涵

理解知识图谱的概念,要掌握两个要点:第一,其是语义网络,这是知识图谱的本质;第二,其是大规模的,这是知识图谱与传统语义网络的根本区别。
语义网络中的可以是实体、概念和值(Value);可以分为属性(Property)与关系(Relation)两类。
图谱中的点:
(1)实体 实体有时也被称为对象(Object)或实例(Instance)。实体是属性赖以存在的基础,并且必须是自在的,即独立的、不依附于其他东西而存在的。比如身高,仅说身高是没有意义的,说“哲学家”这个类别的身高也没有意义,必须说某个具体的哲学家的身高,这才是有明确所指且有意义的。
(2)概念 概念又被称为类别(Type)、类(Category或Class)等。概念所对应的动词是“概念化”或者“范畴化”。概念化一般指识别文本中的相关概念的过程;范畴化在一些场景下指实体形成类别的过程。
(3) 每个实体都有一定的属性值。
图谱中的边:
(1)属性 属性描述实体某方面的特性,如人的身高、体重等。属性是人们认知世界、描述世界的基础。
(2)关系 关系可以认为是一类特殊的属性,当实体的某个属性值也是一个实体时,这个属性实质上就是关系。
关系对于知识图谱上的多步遍历以及沿着语义关系的长程推理十分重要。知识图谱上的推理操作一旦遇到一个属性,就意味着推理结束。
语义网中的边按照其两端节点的类型可以分为概念之间的子类(subclassOf)关系实体与概念之间的实例(instanceOf)关系,以及实体之间的各种属性与关系,如下图所示。

语义网络的组成

知识图谱与传统语义网络的区别

知识图谱与传统语义网络最明显的区别体现在规模上:知识图谱规模巨大,此外还体现在其语义丰富质量精良结构友好等特性上。
事物都有两面性,知识图谱的优点与缺点相伴而生。知识图谱构建与应用的挑战为:
(1)高质量模式缺失。模式定义不完善或缺失对知识图谱中的数据语义理解以及数据质量控制提出了挑战。
(2)封闭世界假设不再成立。传统数据库的应用建立在封闭世界假设(Closed World Assumption,CWA)上,即数据库或知识库中不存在(或未观察到)的事实即为不成立的事实。不遵循CWA给知识图谱的应用带来了巨大的挑战。
(3)大规模自动化知识获取成为前提。大规模自动化知识获取是知识图谱与传统语义网络的根本区别之一。

知识图谱与本体的区别

计算机领域的本体侧重于表达认知的概念框架,表达概念之间的语义关系,往往也伴随着刻画概念的公理系统。
本体刻画了人们认知一个领域的基本框架。没有框架,无法支撑计算机对于世界或特定领域的理解,为机器定义本体,就好比将我们的世界观传递给机器。在建设知识图谱的初期,模式(Schema)定义实质上是在完成本体定义的任务。

知识图谱的广义概念

广义的知识图谱是大数据时代知识工程一系列技术的总称,在一定程度上指代大数据知识工程这一新兴学科。
在整个知识工程的分支下,知识表示是一个非常重要的任务,是发展知识工程最关键的问题之一。而知识表示的一个重要方式就是知识图谱,它侧重于用关联方式表达实体与概念之间的语义关系。除了语义网络外,谓词逻辑、产生式规则、本体、框架、决策树、贝叶斯网络、马尔科夫逻辑网等都可以被认为是知识表示的形式。
参考资料:
[1]: 《知识图谱概念与技术 》
————————————————
版权声明:本文为CSDN博主「Mengxy15」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/Mengxy15/article/details/106005696

你可能感兴趣的:(知识图谱基本概念)