知识图谱 第一章 (中)

国内外典型的知识图谱项目

  上一篇一直在说知识图谱多么多么好,那么有哪些具体的项目呢?
  下面主要从早期的知识库项目、互联网时代的知识图谱、中文开放知识图谱和垂直领域知识图谱进行介绍。
   * 早期的知识图谱
    (1)Cys (https://en.wikipedia.org/wiki/Cyc)
       Cyc知识库主要由术语(Term)和断言(Assertion)组成。术语包括概念、关系和实体的定义。断言用来建立术语之间的关系,既包括事实(Fact)描述,也   包括规则(Rule)描述。--(知识图谱:方法、实践与应用(博文视点出品))
       cyc的主要特点是基于形式化的知识表示方法刻画知识。那么形式化的优点可以支持复杂的推理,但是过度的形式化也会导致知识库的扩展性和应用的灵活性不够。(就像是适度的爱刚刚好,但是溺爱就不是那么好了,过满则溢)
    (2)WordNet(https://wordnet.princeton.edu/)
        一个来自普林斯顿大学的著名词典知识库,定义了名词、动词、形容词和副词之间的语义关系。
  名词,动词,形容词和副词被分为多组认知同义词(同义词),每组表达不同的概念。同义词集通过概念语义和词汇关系相互关联。可以使用浏览器浏览由此产生的有意义的相关词语和概念网络 (链接是外部的)。
       例如名词之间的上下位关系,如“猫科动物“是“猫“的上位词
   * 互联网时代的知识图谱
      互联网的发展为知识工程提供了新的机遇,帮助传统知识工程突破了在知识获取方面的瓶颈。
     Q:咳咳 又有新的名词了  知识工程又是啥呀??
     A:94年图灵奖获得者、知识工程的创建者费根鲍姆给出的知识工程定义--将知识集成到计算机系统从而完成只有特定领域专家才能完成的复杂任务。(中国中文信息学会:2018知识图谱发展报告)
     在大数据时代,知识工程是从大数据中自动或半自动获取知识,建立基于知识的系统,提供互联网智能的知识服务。
     Q:那么问题又来了,知识工程和知识图谱有什么关系呢?
     A:知识图谱属于人工智能的重要研究领域--知识工程的研究范畴,是利用知识工程建立大规模知识资源的一个杀手锏应用。
 这类知识库的建立方法可以分为三类:互联网众包、专家协作和互联网挖掘。
 这类知识图谱真的好多呀,就说具体说两个吧
  (1)Wikidata(https://www.wikidata.org/wiki/Wikidata:Main_Page)
 Wikidata是一个免费且开放的知识库,人类和机器均可读取和编辑。

Wikidata充当其Wikimedia姐妹项目(包括Wikipedia,Wikivoyage,Wiktionary,Wikisource等)的结构化数据的中央存储。
(2)NELL(http://rtw.ml.cmu.edu/)
给定一个初始的本体(少量类和关系的定义)和少量样本,让机器能够通过自我学习的方式不断地从web中学习和抽取新的知识。(是不是感觉挺聪明的)

  • 中文开放知识图谱
    OpenKG(http://www.openkg.cn/)
    知识图谱 第一章 (中)_第1张图片
    是一个面向中文域开放知识图谱的社区项目,主要目的是促进中文领域知识图谱数据的开放和互联。

  • 垂直领域知识图谱
    面向特定领域的知识图谱,如电商、金融、医疗等。
    (1)电商领域知识图谱
    阿里巴巴!!大家应该都挺熟悉的。
    以阿里巴巴电商知识图谱为例,广泛支持商品搜索、商品导购、天猫精灵等产品的智能问答、平台的治理和管控、销售趋势的预测分析等多个应用场景。
    (2)金融领域知识图谱
    Kensho采用知识图谱辅助投资顾问和投资研究。
    (3)医疗领域的知识图谱
    背景:随着医疗大数据时代的到来,知识互联受到了广泛的关注,如何从海量的数据中提取有用的医学知识,是医疗大数据分析的关键。
    解决:知识图谱提供了一种从海量文本和图像中抽取结构化知识的手段,在医疗领域拥有广阔的应用前景。
    Linked Life Data(http://linkedlifedata.com/)是一个数据即时服务平台,可以通过一个访问点访问25个公共生物医学数据库。该平台可以回答复杂的生物信息学问题,只需要浏览信息或者导出所有信息里的一部分子集,例如“所有获批的药物及其品牌名"来获取自己的需求信息。

  • 看到这里,是不是感觉知识图谱好厉害呀!是不是特别想自己弄一个玩一玩,那么知识图谱需要哪些技术流程呢?

知识图谱的技术流程

一般流程为:确定知识表示模型–根据数据来源选择不同的知识获取手段导入知识–综合利用知识推理、知识融合、知识挖掘等技术对构建的知识图谱进行质量提升–根据场景需求设计不同的知识访问与呈现方法,如语义搜索、问答交互、图谱可视化分析等。

  • 知识来源
    可以从多种来源获取知识图谱数据,包括文本、结构化数据库、多媒体数据、传感器数据和人工众包等。
    (https://zhuanlan.zhihu.com/p/139485679)
  • 知识表示
    知识表示是指利用计算机符号描述和表示人脑中的知识,以支持机器模拟人的心智进行推理的方法和技术。
  • 知识抽取
    知识图谱 第一章 (中)_第2张图片
    知识图谱 第一章 (中)_第3张图片
    知识图谱 第一章 (中)_第4张图片
    在这里插入图片描述
    关系要保持更新状态!!!

知识图谱 第一章 (中)_第5张图片

  • 知识融合
    即合并两个知识图谱(本体),基本的问题都是研究怎样将来自多个来源的关于同一个实体或概念的描述信息融合起来。
  • 知识图谱补全与推理
    常见的知识图谱补全方法有:基于本体推理的补全方法、基于图结构和关系路径特征的方法、基于表示学习和知识图谱嵌入的链接预测、文本信息。
    知识图谱 第一章 (中)_第6张图片
  • 知识检索与知识分析
    基于知识图谱的知识检索的实现形式主要包括语义检索和智能问答。不同的计算性数据分析主要以建立各种数据分析模型,如深度神经网络,描述性数据分析突出预先抽取数据的语义,建立数据之间的逻辑,并依靠逻辑推理的方法(如DataLog)实现数据分析(Boris Motik,Yavor Nenov,Robert Piro,et al.Incremental Update of Datalog Materialisation:The Backward/Forward Algorithm in AAAI 2015,2015.)。

你可能感兴趣的:(知识图谱学习笔记,知识图谱)