知识图谱·概念与技术--第1章学习笔记--知识图谱概述--知识图谱的概念,与传统语义网络的区别

知识图谱·概念与技术--第1章学习笔记--知识图谱概述--知识图谱的概念,与传统语义网络的区别

    • 知识图谱的概念,与传统语义网络的区别
      • 狭义概念
        • 作为语义网络的内涵
        • 与传统语义网络的区别
          • 优点
          • 缺点
        • 与本体的区别
      • 广义概念

记录章末思考题答案

知识图谱的概念,与传统语义网络的区别

狭义概念

特指一类知识表示形式,本质上是一种大规模语义网络。

作为语义网络的内涵

包含实体(entity)、概念(concept)及其之间的各种语义关系。
本质:语义网络,区别:大规模
语义网络以图形化(Graphic)形式通过点和边表达知识的方式,基本组成元素是点和边。语义网络中的点可以是实体、概念和值(Value)。

  • 实体
    也可称作对象(Object)或实例(Instance)。在哲学范畴还没有统一的定义,黑格尔《小逻辑》:“能够独立存在的,作为一切属性的基础和万物本原的东西”。即实体是属性赖以存在的基础,是自在的,独立的,不依附于其他东西存在的。
  • 概念
    也可称为类别(Type)、类(Category或Class)等。如“哲学家”不是指特定的某个哲学家,而是指一类人。

  • 实体的属性值。可以是常见的数值类型、日期类型或者文本类型。

属性与关系
可以分为属性(Property)与关系(Relation)两类。
属性描述实体某方面的特性,如出生日期、身高、体重等。
关系可以认为是一类特殊的属性,当实体的某个属性值也是一个实体时,这个属性实质上就是关系。

关系对于知识图谱的多步遍历以及沿着语义关系的长程推理十分重要。知识图谱的推理一旦遇到一个属性,就意味着推理结束。

语义网络中的边按其两端节点的类型可以分为概念之间的子类(SubclassOf)关系、实体与概念之间的实例(instanceOf)关系,以及实体之间的各种属性与关系。

与传统语义网络的区别

优点
  1. 规模巨大
    点、边的数量巨大。知识图谱强调对实体的覆盖。Google在2012年发布的知识图谱含近5亿个实体和10亿多条关系。
    因为规模巨大而被认为是大知识(Big Knowledge)的典型代表。
  2. 语义丰富
  • 富含各类语义关系
    如DBpedia包含1000多种常见的语义关系。
  • 语义关系的建模多样
    一个语义关系可以被赋予权重或概率,从而更精准地表达语义。
    如柏拉图的作品,按知名度《理想国》的关系可以比《对话录》赋更高的权重。
  1. 质量精良
    知识图谱是典型的大数据时代的产物。大数据的多源特性使得我们可以通过多个来源验证简单事实。如果大部分来源支持其一事实,基本就可以推断这一事实为真。
  2. 结构友好
    知识图谱通常可以表示为三元组,这是典型的图结构。三元组也可以借助RDF(Resource Description Framework)进行表示。
缺点
  1. 高质量模式缺失
    为了让更多的知识入库,要适当地放宽对于知识质量的要求。
    几乎所有的严格定义都会遇到特例。如身高范围定义为0.5-2.3m,可能有2.31m的人存在;“妻子”作为一条关系通常只有单一取值,但在古代和某个偏远部落则未必如此。
    因此知识图谱在设计模式时通常会采取一种“经济”“务实”的做法:允许模式(Schema)定义不完善,甚至缺失。模式定义不完善或缺失对知识图谱中的数据语义理解以及数据质量控制提出了挑战。
  2. 封闭世界假设不再成立
    传统数据库与知识库的应用通常建立在封装世界假设(Closed World Assumption,CWA)基础之上。CWA假定数据库或知识库中不存在(或未观察到)的事实即不成立。这个假设较强,只适用于封装领域。如图谱中可以缺失柏拉图父母的信息,但常识告诉我们柏拉图一定有父母。不遵守CWA给知识图谱上的应用带来了巨大的挑战。
  3. 大规模自动化知识获取成为前提
    知识图谱规模巨大,依靠传统专家方式难以完成。大规模自动化知识获取是知识图谱与传统语义网络的根本区别之一。
    大规模自动化知识获取的方式
  • 文本中自动抽取
  • 基于大规模众包平台的知识标注
  • 多种方式混合

与本体的区别

本体(Ontology)侧重于对存在进行规定和刻画。人工智能领域提出本体的一个重要动机是知识的共享与复用,以及数据的互联与互通。不同的自治系统(如不同的网站、不同的机器)只有遵循相同的“世界观”才有可能形成类似的“理解”。语义网(Semantic Web)领域发展出了很多本体定义语言与资源交换标准。因此,计算机领域的本体侧重于表达认知的概念框架,表达概念之间的语义关系,往往也伴随着刻画概念的公理系统。
本体刻画了人们认知一个领域的基本框架。框架与实例之间的关系好比人的骨骼与血肉的关系。

广义概念

是大数据时代知识工程一系列技术的总称,在一定程度上指代大数据知识工程(Big Data Knowledge Engineering,BigKE)这一新兴学科,是传统知识工程在大数据时代的延续。
知识图谱·概念与技术--第1章学习笔记--知识图谱概述--知识图谱的概念,与传统语义网络的区别_第1张图片
人工智能->符号主义->知识工程,知识工程核心内容是建立专家系统,旨在让机器能够利用专家知识以及推理能力解决实际问题。
知识表示,在计算机中合理地表示知识,知识图谱是一个重要形式。知识图谱侧重于用关联方式表达实体与概念之间的语义关系。
知识表示和形式还有语义网络、谓词逻辑、产生式规则、本体、框架、决策树、贝叶斯网络、马尔可夫逻辑网等。

你可能感兴趣的:(知识图谱·概念与技术)