知识图谱:知识表示

0. 引言

知识图谱中,知识的结构化表示主要有符号表示向量表示两类方法。早期,常用一阶谓词逻辑(First Order Logic)、语义网络(semantic network)、描述逻辑(Description Logic)和框架系统(Frame System)等基于符号逻辑的知识表示方法。而当前,主要使用基于图数据结构的三元组形式(头实体,关系,尾实体)来符号化地表示知识。

1. 基于图的符号化知识表示

基于图的符号化知识表示,最常用的有属性图(Property Graph)和RDF图(Resource Description Framework,资源描述框架)两种。

  • 属性图(Property Graph)是工业界最常用的知识图谱建模方法,它的优点是允许为实体(entity)或关系(relation)添加属性(property1),表达方式非常灵活、非常便于表示多元关系,且属性图的存储(使用图数据库 Neo4j)充分利用图结构特点做了性能优化,在查询计算方面具有较大优势;但存在不足的是属性图缺乏工业标准规范的支持,且也不能支持符号逻辑推理。

  • RDF(Resource Description Framework2,资源描述框架)是 W3C(国际万维网联盟)推动的语义数据交换标准与规范3,其基本组成单元是三元组(即:(头实体,关系,尾实体)),它有更严格的语义逻辑基础,支持逻辑推理,且兼容语义表示能力更丰富(也更复杂)的本体表示语言OWL。

  • 需要补充说明的是:实际中,RDF 图是使用 RDFS 建立的。RDF 用到了类和属性来描述实体之间的关系,这些类与属性由模式(Schema)来定义。RDFS(Resource Description Framework Schema,RDF模式)是在 RDF 基础上提供了对类和属性的简单描述,从而给 RDF 数据提供了标准的词汇建模的语言。

  • OWL(Ontology Wed Language,网络本体语言)作为一种完备的本体表示语言,它在三元组无法满足语义表示需要时,提供了更多可供选择的语义表达构件。

2. 向量化知识表示

在完成了基于图的知识的符号表示的基础上,还可以通过学习图的特征,为图谱中的每一个实体和关系得到一个向量表示;并利用向量、矩阵或张量间的计算,实现高效地(知识)推理计算。

知识的向量化表示,是目前的研究热点。


  1. 属性(property)是指实体或关系的定、状、补语等描述性信息。 ↩︎

  2. Resource:页面、图片、视频等任何具有 URL 标识符的资源;
    Description:属性、特征和资源之间的关系;
    Framework:模型、语言和这些描述的语法。 ↩︎

  3. 因为早期 Web(即:Web 2.0)的标准语言 HTML 和 XML 无法适应语义网对知识表示的需求,所以 W3C 提出来新的标准语言 RDF、RDFS 和 OWL,来表示语义网的知识体系。 ↩︎

你可能感兴趣的:(#,自然语言处理,知识图谱,人工智能)