知识图谱:【知识图谱基础理论(六)】——知识融合

通过信息抽取得到的信息中可能存在着冗余和错误信息,数据间的关系扁平化,缺乏层次性和逻辑性。知识融合对这些数据进行清理和整合,确保知识质量。包括:实体链接和知识合并。

实体链接

指对于从文本中抽取得到的实体对象,将其链接到知识库中对应的正确实体对象的操作:

实体链接的一般流程

  • 从文本中通过实体抽取得到实体指称项。
  • 进行实体消歧和共指消解,判断知识库中的同名实体与之是否代表不同的含义以及知识库中是否存在其他命名实体与之表示相同的含义。
  • 在确认知识库中对应的正确实体对象后,将该实体指称项链接到知识库中对应实体。

实体消歧

  • 实体消歧用于解决同名实体产生歧义问题的技术,通过实体消歧,就可以根据当前的语境, 准确建立实体链接。
  • 实体消歧主要采用聚类法:指以实体对象为聚类中心,将所有指向同一目标实体对象的指称项聚集到以该对象为中心的类别下。
  • 聚类法消歧的关键问题是如何定义实体对象与指称项之间的相似度,主要有四种方法:
    a)空间向量模型(词袋模型)
    b)语义模型
    c) 社会网络模型
    d) 百科知识模型

共指消解

  • 对于多个指称项(比如president Obama, the president, he)指向同一个实体对象(奥巴马),共指消解可以将这些指称项关联(合并)到正确的实体对象。
  • 除了将共指消解问题视为分类问题之外,还可以将其作为聚类问题来求解。基本思想:以实 体指称项为中心,通过实体聚类实现指称项与实体对象的匹配。其关键问题是如何定义实体 间的相似性测度。

知识合并:

在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入

  • 合并外部的知识库
    a)数据层的融合
    b)模式层的融合
  • 合并关系数据库
  • 其他半结构化方式(XML,CSV,JSON)存储的历史数据

你可能感兴趣的:(python,基础理论,自然语言处理,知识图谱,人工智能)