知识图谱入门

一、知识图谱的概念

1、知识图谱(Knowledge Graph)以结构化的形式描述客观世界中概念、实体及其之间的关系,可以认为是一种语义网络。

        从发展的过程来看,知识图谱是在NLP的基础上发展而来的。知识图谱和自然语言处理NLP有着紧密的联系,知识图谱可以用来更高的查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。

2、知识图谱基本知识

        三元组就是“实体—关系—实体”,以及实体及其相关属性—值对,实体间通过关系相互联结,构成网状的知识结构。

eg:“我爱你”,我和你是实体,爱是关系。

知识图谱入门_第1张图片

3、常见的知识图谱示意图主要包含:实体(节点point)、关系(边edge)、属性。

1)实体指的是具有可区别性且独立存在的某种事物,实体是知识图谱中的最基本元素,不同的实体间存在不同的关系。

eg:某一个人、某一座城市、某一种植物、某一件商品等等,世界万物由具体事物组成,此指实体。

2)在知识图谱中,边表示知识图谱中的关系,用来表示不同实体间的某种联系。

eg:爱是关系。

3)知识图谱中的实体和关系都可以有各自的属性。如果属性值对应的是概念或实体,则属性描述两个实体之间的关系,称为对象属性;如果属性值是具体的数值,则称为数据属性。

eg:

a.我(实体)的属性:女,18岁...

b.爱(关系)的属性:   2022年6月30相爱,持续至今...

4、知识图谱实例:

知识图谱入门_第2张图片

1)实体为:小秦,大理,小明等。

2)关系为:属于,住在。

3)属性未标明:"小明"的属性可以有男,出生于2010年、"住在"的属性可以有:2012年开始住....

二、知识图谱分类

知识图谱按照功能和应用场景可以分为通用知识图谱和领域知识图谱。

1)通用知识图谱面向的是通用领域,强调知识的广度,形态通常为结构化的百科知识,针对的使用者主要为普通用户。

2)领域知识图谱则面向某一特定领域,强调知识的深度,通常需要基于该行业的数据库进行构建,针对的使用者为行业内的从业人员以及潜在的业内人士等。

三、知识图谱构建流程

1、构建流程图知识图谱入门_第3张图片

 2、知识抽取  主要针对非结构数据,方法主要包括:实体识别、关系抽取、属性抽取等。

1)数据类型

a、结构化数据:目前结构化的数据时最主要的知识来源。针对结构化的数据,知识图谱通常可以直接利用和转化,形成基础数据集,再利用知识图谱补全技术进一步扩展知识图谱。

b、非结构化数据:针对文本型数据这种非结构化数据,知识获取的方式主要包括实体识别、关系抽取、属性抽取等。具体的方法又包括基于特征模版的方法、基于核函数的监督学习方法、基于深度学习的方法等。

2)数据分类方法

a、实体识别

实体识别指在一段文本中识别哪些词代表实体,并打上标签(进行分类)。

eg:“我爱你”这句话中,“我”和“你”就是两个实体,将他们识别出来之后会分别给“我”打上“男人”的标签,给“你”打上“女人”的标签。

b、关系抽取

识别文本(或其他数据)中实体之间的关系。

eg:“我爱你”这句话中,“爱”为“男人:我”与“女人:你”之间的关系。

3、知识融合
        当我们想建立一个知识图谱,需要从多个来源获取数据,这些来源不同的数据可能会存在交叉、重叠,同一个概念、实体可能会反复出现,知识融合的目的就是把表示相同概念的实体进行合并,把来源不同的知识融合为一个知识库。

       知识融合的主要任务包括实体消歧和指代消解,它们都用来判断知识库中的同名实体是代表同一含义、是否有其他实体也表示相同含义。

4、知识推理

        知识推理是知识图谱中很重要的一部分,主要用于推理暗含的知识(丰富知识图谱),检查知识库的不一致(知识清洗)

你可能感兴趣的:(毕业论文,知识图谱,人工智能,nlp,深度学习)