知识图谱构建流程详解

知识图谱构建

1. 主要流程

知识图谱构建流程详解_第1张图片

2. 层次划分

知识图谱建设是一项系统工程,从模块划分角度,可划分为如下层次:

知识图谱构建流程详解_第2张图片

  • 数据获取:通过爬虫,内部CP等数据源获取数据,涉及到主要技术有网页抓取技术,包括结构化数据和非结构化数据抽取以及一些列爬虫相关工具链,产出的结果为原始数据
  • 知识获取:旨在把原始数据变为领域知识的过程,本层涉及到的技术有schema建设,信息抽取技术如yago的三元组抽取技术。本层产出的结果为结构化的知识(实体以及其属性值,实体可能的关联等),本层工具链建设包含:schema管理工具(schema完备性一致性检查工具),知识抽取算法,知识对齐等
  • 知识融合:第二层更多从领域的角度获取知识,本层更多从全局的角度出发,把相关的领域知识融合在一起,做到实体消歧,实体对齐,本层会在知识层面上输出一个图谱,工具链建设有实体消歧融合算法,schema融合算法等
  • 知识服务:提供知识图谱可视化服务,存储查询,包括如何把知识图谱对外提供服务以及一些线上交互工具
  • 应用技术:基于知识图谱的应用,包括知识推理、知识问答、实体链接等。每一块都是NLP领域的难点

五大模块从逻辑上比较独立,每层的评价标准不同工作量不同

可以加微信讨论:crazy042438

你可能感兴趣的:(知识图谱)