Geoscience knowledge graph in the big data era

Geoscience knowledge graph in the big data era

记录我的学习心得,如有不妥,联系删除

Information

作者包括Chenghu ZHOU, Hua WANG, Chengshan WANG等人,发表在《SCIENCE CHINA Earth Sciences》64卷,第1105页(2021年)[第1页]。

原文地址

Abstract

  1. 新的地球科学知识系统:21世纪初以来,地球科学研究在建立新的知识系统和利用大数据的推动下,从传统的百科全书式知识体系转向计算机可理解和操作的知识图,标志着知识发现的革命性转变。
  2. 地球科学知识图的构建:作者采用了一般知识表示的图形模式,并将地球科学的独特时空特性及包括地图、文本和数字在内的知识元素集成其中,形成了全域地球科学知识表示模型。
  3. 全球协作的知识图构建方法:作者开发了一种基于联合和群体智能的协作方法,实现了与全球地球科学家的协作,共同构建高质量的专业知识图。
  4. 动态知识图的构建:基于深度文本分析,从大量的地球科学文献中提取知识,构建了最新、最完整的动态地球科学知识图。
  5. 应用及研究创新:全面系统的地球科学知识图不仅能加深对地球科学大数据的分析,而且也能推动高精度地质时间尺度的建立、智能地图的编制,以及地球科学知识演变和推理分析等。这将进一步推动地球科学、信息科学、数据科学的交叉研究,实现理论创新并在时空大数据研究中取得重大突破。

1. Introduction

这段内容概括了新一轮的科技革命和工业转型所带来的挑战与机遇,重点关注了大数据、云计算、人工智能、区块链和物联网的综合发展。以下是这段内容的主要要点:

  1. 科技革命与工业转型:我们正处在大数据、云计算、人工智能、区块链和物联网综合发展的新科技时代。第二代人工智能,基于大数据和深度学习,已在图像识别、语言翻译等领域得到广泛成功的应用。
  2. 大数据驱动的科学研究:大数据不仅正在改变人类的生活、生产和思考方式,而且正在引导科学研究从实验、理论和模拟的科学范式转向大数据驱动的第四种科学研究范式。
  3. 地球科学的大数据时代:现代地球观测系统实现了小时级的全球监控,各种自动观测站网络可以连续观测地球系统的全球降水、生物量等元素,数字出版可以随时随地访问。然而,地球科学作为一种典型的数据密集型科学,面临着数据整合和共享、数据挖掘和知识发现等方面的挑战。
  4. 地球科学知识图的构建:为了解决这些挑战,有急切的需求来发展地球科学中的知识驱动的大数据分析理论和方法。构建全域地球科学知识图(GKG)和探索地球科学知识演化是当前地球科学知识发现研究的前沿领域和战略焦点。
  5. 人工智能和知识图在大数据中的价值:人工智能是挖掘和提升大数据价值的关键,而知识图是人工智能的重要基石,也是统计表示和物理表示整合的核心基础。
  6. 未来研究方向:本文阐述并讨论了面向地球科学大数据分析的地球科学知识图研究的关键科学问题和前沿方向,并展望了地球科学时空大数据分析和知识发现的未来研究。

2. Geoscience knowledge representation model

  1. 地球系统的特征:地球系统是一个复杂庞大的系统,跨越亿万年的时间和数百万英里的空间。
  2. 构建地球科学知识系统:地球科学家致力于构建一个完整的地球科学知识系统,这是一个系统性的知识项目和持续不断的追求。
  3. 地球科学知识的一般性质:地球科学知识遵循一般知识的特征,例如经济合作与发展组织(OECD)和本杰明·布卢姆等的分类方法。
  4. 知识工程的基础:已有的与知识工程相关的研究成果将成为构建地球科学知识系统的基础。这些成果为构建全面的地球科学知识图提供了有益的借鉴。

2.1 Geoscience knowledge system and knowledge graph

  1. 地球科学是一个复杂的巨型系统:地球科学研究涵盖广阔的时空范围,探索地球各个层面的形成、演化和相互作用。建立完整的地球科学知识系统是地球科学家的持续追求。
  2. 地球科学知识图的核心:地球科学知识图是一种计算机可理解和可计算的知识系统,通过结构化的图形模式有效组织相关知识。它将一般知识分类系统与地图、文本和数字等信息载体的时空特征相结合,构建开放且可扩展的地球科学知识框架。
  3. 知识图的历史与应用:地球科学知识图的概念和原型源自上世纪60年代,已广泛应用于图书馆和信息科学领域。谷歌的“知识图谱引擎”等项目是知识图技术在实际应用中的代表。
  4. 地球科学知识图的挑战与实践:地球科学领域面临着多尺度时空特征的挑战,同时涉及多种观测和分析方法。因此,构建地球科学知识图的核心和创新在于发展开放且可扩展的知识框架。近年来,一些实践项目如Deep Time Knowledge Graph和“人类知识族谱建设项目”正在推进地球科学知识图的研究和应用,有望为该领域的发展做出重要贡献。

​总结:地球科学知识图是地球科学研究中的重要方向,其核心在于将一般知识分类系统与地球科学的多尺度时空特征相结合,构建计算机可理解和可计算的知识系统。通过实践项目和不断的探索,地球科学知识图的发展将有助于推动地球科学领域的进步和创新。

2.2 Self-adaptive representation model of all-domain geoscience knowledge graph

​这段内容主要强调了知识表示是构建计算机可理解和可计算的知识图的基础,并在知识传播过程中扮演着重要角色。常见的知识表示方式包括自然语言、结构化表格、图形和图像等。然而,这些方式在描述地球科学实体之间的复杂时空关系方面存在局限性,因此需要开发一种全面的形式化表示语言。

​作者提出了一种基本模型,即自适应表示所有领域的地球科学知识图。该模型由复杂的时空信息表示模型(实体对象表示模型)和地球科学实体之间的关系(边)构成,采用资源描述框架(RDF)的三元组形式。该模型还包含了三个方面的扩展:在节点上包含时空特征、在边关系中包含复杂模型、以及对地球科学场景进行智能识别和概念对齐。

​总结:地球科学知识图的基本模型是自适应表示所有领域的地球科学知识的基础。该模型通过复杂的时空信息表示和地球科学实体之间的关系来构建全面的地球科学知识图。这种模型能够更好地描述地球科学中的复杂时空特征和关系,并实现对地球科学知识的智能识别和概念对齐。

你可能感兴趣的:(知识图谱文献阅读修炼手册,知识图谱,大数据,人工智能)