知识图谱-智慧园区的核心大脑

                智慧园区现状

        智慧园区是园区运用大数据、物联网、信息管理等技术,打造智慧互联的园区,目前主要涉及的有管理平台、运营平台、园区平台、企业、用户等等,

                      知识图谱

                    知识图谱的概念

        知识图谱(Knowledge Graph)于2012年由谷歌提出并成功应用于搜索引擎当中。它以结构化的形式描述客观世界中概念、实体及其之间的关系,将互联网的信息表达成更接近人类认知世界的形式,提供了一种更好地组织、管理和理解互联网海量信息的能力。

知识图谱-智慧园区的核心大脑_第1张图片

                  知识图谱的分类

        知识图谱主要分为两类:通用知识图谱和行业知识图谱。

        通用知识图谱:我们日常见到的都是通用知识图谱,主要应用于面向互联网的搜索、推荐、问答等业务场景。

知识图谱-智慧园区的核心大脑_第2张图片

        行业知识图谱:行业知识图谱指面向特定领域的知识图谱,用户目标对象需要考虑行业中各级别的人员,不同人员对应的操作和业务场景不同,因而需要一定的深度与完备性,行业知识图谱对准确度要求非常高,通常用于辅助各种复杂的分析应用或决策支持,有严格与丰富的数据模式,行业知识图谱中的实体通常属性比较多且具有行业意义。

知识图谱-智慧园区的核心大脑_第3张图片

            批量结构化数据处理

        行业知识图谱的核心实体、属性、关系和事件多来源于行业内部的结构化数据。由于各种历史原因,这些系统中的数据通常存在数据质量差、数据标准不统一、元数据描述缺乏、数据字典不全、数据一致性不完备等问题。批量结构化数据知识图谱构建的挑战主要来自于如何做到工程化。越来越多的系统需要一整套完整的工程化的方案解决批式和流式的知识构建过程,通过数据探查、数据理解、数据清洗、数据标准化、数据映射、数据关联、数据融合等几个阶段的工作,完成从质量不一的原始结构化数据到最终知识图谱的过程。

            实体识别与关系抽取

        实体识别与链接是知识图谱构建与知识应用的核心技术。

        实体识别是利用非结构化数据构建知识图谱的关键步骤。实体识别后需要进行实体链接。实体链接是识别出实体与已有知识库中对应实体进行链接,以补充知识图谱的内容。

                  构建隐性关系

        在构建领域知识图谱的过程中,可以将关系分为显性关系和隐性关系。显性关系是指通过原始数据直接可以抽取出的关系,隐性关系是指需要通过复杂计算和数据挖掘计算出来的动态关系。在很多领域中,隐性关系的构建很大程度上决定了整个图谱对智能应用支撑的好坏,对提升图谱的分析、推理和挖掘效率起到关键作用。隐性关系可以有很多种,构建方法针对行业数据的特点有所不同,但多会涉及到使用行业规则,关系挖掘算法、图计算等技术手段。

        在一些领域知识图谱构建的过程中,隐性关系的构建是最为至关重要的一步。如果把知识库比做大脑,那隐性关系构建就像是大脑在通过思考不断学到新的知识的过程。在设计知识图谱整体系统架构时,可以将构建隐性关系的过程服务化,提升最终知识图谱的质量。

            不断产生新知识数据

        知识图谱与数据挖掘的关系往往是相辅相成的。知识图谱不仅汇总经过治理的知识数据,还应该将产生的知识进一步应用到机器学习算法中,不断产生新的知识反哺知识库,就像大脑在不断学习的过程一样。下图展示了通过知识增强机器学习的过程来不断丰富知识图谱的内容,最终使应用更加智能。

                        目标

通过知识图谱打造智慧园区

你可能感兴趣的:(知识图谱-智慧园区的核心大脑)