2017年2月15日国脉发布了数据基因系统,旨在为政府建立数据管理体系提供便捷、可靠的工具支撑,帮助政府梳理数据资产清单、统一数据口径、建立数据标准、定位数据资源、分析资源关系、设计管理模型,从而更加有效的提升数据资产管理能级,实现数据驱动服务创新。
那么该如何理解数据基因?数据基因系统能解决哪些问题?价值究竟在哪里?本文从概念到问题再到实际应用场景,为大家详细介绍数据基因系统。
一、如何理解数据基因
DIKW体系认为数据(Data)、信息(Information)、知识(Knowledge)和智慧(Wisdom)之间是层层递进的关系,从数据里挖到信息,从信息里得到知识,从知识里获取智慧。
表1. 数据、信息、知识、智慧四者比较
在这个金字塔体系中,我们认为数据基因位于数据层和信息层,它赋予数据特定的含义,与数据一起构成了我们认知信息的基础。
图1.数据基因在DIKW体系中的位置
实际上,我们认为数据基因系统是管理系统的系统,从业务出发,到应用系统、再到数据库、数据表,甚至到驱动服务,是数据大管家,实现从管网络、系统到管数据的跃迁。
二、解决哪些问题
➤缺乏完整、统一的信息资源体系
目前各个地方开展信息资源目录体系建设工作,往往存在部门提供什么梳理什么,部门中很少存在某个人员完全掌握该部门信息资源,需不同科室之间进行调研、梳理,通常存在不清楚自己部门到底有哪些、不清楚其他部门有哪些信息资源,缺乏完整、统一的信息资源体系。
➤应用系统建设分散、数据关系混杂
各级地方政府和部门在开展信息化建设时往往各自为政,各自建设应用系统,没有构建统一的基础信息平台,形成了许多信息孤岛。由于缺乏统一的信息系统建设标准,造成各个信息系统的数据口径不一致,系统、数据之间的关系不清楚,使整个信息系统构架中数据的采集、存储、交换、加工、利用等各部分间不能循环互动,系统中的数据无法有效共享,造成了信息资源利用率低。
➤数据不一致、不准确
在以数据交换共享时,遇到的最大问题就是数据不一致和不准确,举几个实际例子:
某系统个人信息的姓名是20位,另一系统的姓名是30位,在数据同步的时候就会出现无法同步的问题;
一个系统数字0代表男、数字1代码女、数字2是未知,另一个系统字母M代表男、字母F代码女,这是一个代码不一致问题;
在不同系统中存在“机构名称”、“单位名称”、“公司名称”,不知道是否为同一个含义;
如果是同一个企业,某个系统里面编码是0001,另一个系统里是0002,其实代表的是同一条数据。
➤数据标准管理框架缺失
目前很多部门的应用系统一般是建立在数据仓库或基础数据库基础上,数据积累已有一定的规模。但由于缺乏统一的数据标准规范,同时缺乏数据基于业务的理解,导致新建或改造升级的系统建设缺乏标准先行的原则,难以实现数据标准“循序渐进、不断完善”的要求。
三、数据基因系统的价值在哪里
➤快速建立信息资源体系
数据基因系统对比筛选出城市核心业务部门的核心业务的信息资源建立整个信息资源体系建设的模板库,通过模板库城市各单位可直接查阅相关数据元、信息资源模板,以直接沿用或是自定义修改的方式对模板进行选择性的编目,达到各部门政务信息资源快速梳理、信息资源体系快速架构的目标。
➤建立数据资产地图
数据基因系统通过对城市机房、服务器、应用系统、数据库等数据资产的梳理,建立部门数据资产清单,通过系统建立之间的相互关系,理清楚系统与系统之间、系统与数据库、表之间、数据与数据之间的关系,实现数据—数据表—数据库—应用系统—服务器—机房(云)的关系展现,建立部门数据资产地图。
➤辅助数据质量问题分析
通过数据基因系统数据元池的建立,梳理分析各部门、各应用系统中出现的相同的、近义的数据字段,通过分析其频率、数据定义及数据相互之间关系(数据来源、数据流向等),了解各应用系统之间数据标准体系的建设情况,辅助数据质量问题分析。
➤辅助数据标准的落地
通过对各部门、各应用系统数据元池的清洗比对,筛选出各部门共性、关键的主数据,建立涉及核心数据的标准字段池,对字段的命名、格式、长度等属性进行规范,依托标准数据元池进行信息资源信息项的编目,严格控制新增字段,实现共性数据元的统一标准规范,推动数据规范的落地执行,建立数据模型标准化定义映射,推进数据标准化规范的落地实施。
➤辅助系统开发运维
数据基因系统提供相关数据库、基础库、主题的模型设计功能,实现不同系统建设需求、应用场景下,通过标准数据元池、信息资源的组合构建应用模型,围绕构建的模型可以实现快速构建应用系统数据表结构设计。当各部门新增需求或者系统上线维护后提出修改时,可通过数据基因系统查看现有系统的结构,设计新的数据结构或修改数据结构来辅助系统开发运维。
总结
目前随着政务大数据的发展,政府对数据标准化管理的需求正日益增加,未来数据基因系统将是连接业务、数据、系统与服务的核心基础设施,可扩展的数据基因系统将能够产生更多更有价值的应用场景。
作者:国脉海洋信息发展有限公司副总经理、高级咨询师,国脉信息资源研发中心副主任王路燕
来源:国脉电子政务网(www.echinagov.com)