【无标题】

知识图谱学习第一天

最近有个项目要做某个领域的知识图谱,现阶段作者是小白,需要补很多东西。本人定位是该领域的专家,需要配合技术人员构建schema。但是也得补知识图谱的知识,从今天开始吧

一、知识图谱概念

知识图谱的概念很多人都讲过,csdn、知乎和书本都有,大家可以自己搜索和查看,这里推荐浙江大学陈华钧老师的公开课和书《知识图谱导论》,前面讲了知识图谱的一些基本概念,后面在构建技术方面列举了大量对口的论文,而且都是最新的顶会论文,当然书是2021年出版的,论文也到2021年,2022年的只能大家自己找了。

知识图谱是将知识表示成图、谱的形式,是一种知识的表示方式,因此知识图谱的书一般都首先介绍知识表示。

一、知识表示

知识表示,早期都是符号主义的表示方法,包括一阶谓词逻辑、Horn子句和Horn逻辑、语义网络、框架、描述逻辑,后来是语义网时代的RDF、OWL,还有现在深度学习时代的基于向量的知识表示。

  1. 一阶逻辑。一阶逻辑(First-order Logic)是一种形式系统(Formal System),即形式符号推理系统,也叫一阶谓词演算、低阶谓词演算(Predicate Calculus)、限量词(Quantifier)理论,也有人称其为“谓词逻辑”。一阶逻辑的逻辑表达式:∃x(Math(x)) → Prof(x)。Math(x)的意思代表”x是数学家“,而谓词“Prof(x)”表示”x是教授“。那么,上述整个逻辑表达式的意思是:有一个(或存在一个)数学家x是教授,在严格意义上就是:如果x是数学家,那么,他必定是教授。还有二阶逻辑;
  2. Horn子句。霍恩子句得名于逻辑学家Alfred Horn, 1951 年他在文章《On sentences which are true of direct unions of algebras》中首先提及。霍恩公式 由 三种霍恩原子组成, 可以由如下的 BNF 表示 :;
  3. 语义网络 。名字和语义网很像,但不是同一种语言。语义网络又称联想网络,它在形式上是一个带标识的有向图。语义网络利用节点和带标记的边结构的有向图描述事件、概念、状况、动作及客体之间的关系。每个节点可以带有若干属性,一般用框架或元组表示。节点与节点间的连接弧(联想弧)用以表示各种语义联系、动作。语义网络的单元是三元组(节点1,联想弧,节点2)。例如(小明,类型,学生)。由于所有的节点均通过联想弧彼此相连,语义网络可以通过图上的操作进行知识推理。此外节点还可以是一个语义子网络,形成一个多层次的嵌套结构。
  4. 框架 。框架表示法是明斯基于1975年提出来的,其最突出的特点是善于表示结构性知识,能够把知识的内部结构关系以及知识之间的特殊关系表示出来,并把与某个实体或实体集的相关特性都集中在一起。基本思想是:认为人们对现实世界中各种事物的认识都以一种类似于框架的结构存储在记忆中。当面临一个新事物时,就从记忆中找出一个合适的框架,并根据实际情况对其细节加以修改、补充,从而形成对当前事物的认识。

框架是一种描述对象(事物、事件或概念等)属性的数据结构。在框架理论中,类是知识表示的基本单位,每个类有一些草,每个槽又可分为若干侧面,一个槽用于表示描述对象的一个属性,而一个侧面用于表示槽属性的一个方面,槽和侧面都可以有属性值,分别称为槽值和侧面值。除此之外,框架还允许给属性设默认值,以及设立触发器以维护框架。示例如下:
【无标题】_第1张图片

  1. 描述逻辑 (Description Logics)。为什么使用DL呢,由于RDFS并不满足于所有的任务,有些内容无法被表达或推断。
    描述逻辑是一阶逻辑的一个可判定子集。描述逻辑可以被看成是利用一阶逻辑对语义网络和框架进行形式化后的产物。描述逻辑一般支持常量、一元谓词和二元谓词。一元谓词称为类,二元谓词称为关系。描述逻辑的重要特征是同时具有很强的表达能力和可判定性。描述逻辑限制了可以使用的谓词类型;
  2. RDF 。资源描述框架(Resource Description Framework, RDF),R代表页面,图片、视频等任何具有URI标识符,D标识属性、特征和资源之间的关系,F标识模型、语言和这些描述的语法。在RDF中,知识总是以三元组的形式出现,即每一份知识都可以被分解为:(subject, predicate, object)。RDF的主语是一个个体(Individual),个体是类的实例。宾语是一个个体或者一个数据类型的实例。谓语是一个属性,属性可以连接两个个体或者链接一个个体和一个数据类型的实例。在RDF中,三元朱中的主谓宾都有一个全局URI,该URI可以简化为前缀URI
    RDF用到了类以及属性描述个体之间的关系。这些类和属性由模式(schema)定义。RDF Schema(RDF模式,简称RDFS)提供了对雷和属性的简单描述,从而给RDF数据提供词汇建模的语言。

RDF提供了最基本的对类和属性的描述原语:

rdf:type:用于指定个体的类

rdfs:subClassOf:用于指定类的父类

rdfs:subPropertyOf:用于指定属性的父属性

rdfs:domain:用于指定属性的定义域

rdfs:range:用于指定属性的值域
  1. OWL 。W3C于2002年7月31日发布了OWL Web本体语言(OWL Web Ontology Language)工作草案的细节其目的是为了更好地开发语义网。OWL有三个子语言:OWL Lite、OWL DL、OWL Full。OWL与RDF的关系
OWL Full可以看成是RDF的扩展;
OWL Lite和OWL Full可以看成是一个约束化的RDF的扩展;
所有的OWL文档 (Lite,DL,Full)都是一个RDF文档;
所有的RDF文档都是一个OWL Full文档;
只有一些RDF文档是一个合法的OWL Lite和OWL DL文档。在Protege操作中,OWL就是在RDFS的基础上,添加了很多描述类别、属性之间关系的定义或约束。,如两个类是否不相交这样的类属性。

参考

1https://iamzero.blog.csdn.net/article/details/89473681?spm=1001.2101.3001.6661.1&utm_medium=distribute.pc_relevant_t0.none-task-blog-2%7Edefault%7ECTRLIST%7ERate-1-89473681-blog-122272202.pc_relevant_multi_platform_whitelistv4&depth_1-utm_source=distribute.pc_relevant_t0.none-task-blog-2%7Edefault%7ECTRLIST%7ERate-1-89473681-blog-122272202.pc_relevant_multi_platform_whitelistv4&utm_relevant_index=1
2https://blog.csdn.net/pelhans/article/details/80020067?spm=1001.2101.3001.6650.2&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7ERate-2-80020067-blog-95078052.pc_relevant_3mothn_strategy_and_data_recovery&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7ERate-2-80020067-blog-95078052.pc_relevant_3mothn_strategy_and_data_recovery&utm_relevant_index=3
3https://blog.csdn.net/qq_29798939/article/details/117001123

你可能感兴趣的:(知识图谱,人工智能)