数据治理之数据标准

数据治理是指将数据作为组织资产而展开的一系列的 具体化工作,是对数据的全生命周期管理。

数据治理体系是指从组织架构、管理制度、操作规范、IT应用技术、绩效考核支持等多个维度对组织的数据模型、 数据架构、数据质量、数据安全、数据生命周期等各方面进 行全面的梳理、建设以及持续改进的体系。

数据标准是集团单位建立的一套符合自身实际,涵盖定 义、操作、应用多层次数据的标准化体系。

数据标准的建立是集团单位信息化、数字化建设的一项 重要工作,行业的各类数据必须遵循一个统一的标准进行组 织,才能构成一个可流通、可共享的信息平台。

数据治理对标准的需求可以划分为两类,即基础性标准 和应用性标准。前者主要用于在不同系统间,形成信息的一 致理解和统一的坐标参照系统,是信息汇集、交换以及应用 的基础,包括数据分类与编码、数据字典、数字地图标准; 后者是为平台功能发挥所涉及的各个环节,提供一定的标准规 范,以保证信息的高效汇集和交换,包括元数据标准、数据 交换技术规范、数据传输协议、数据质量标准等。

1数据分类与编码

数据分类与编码标准是信息化建设中标准化的一项基础工作,该类标准规定平台汇集、交换相关信息统一的分类 系统和排列顺序以及编码规则,目的是在不同系统和用户之 间建立交通数据的一致参照,对提高数据采集、处理和数据 交换效率具有重要作用。数据分类与编码标准的制定将有力 推进平台标准化及交通信息化建设标准化的进程。

2) 数据字典

针对实际需求,定义数据集,建立各个领域的数据字典, 规范数据概念和数据定义。在此基础上,形成完备的集团单 位数据集和数据字典。

3) 元数据标准

元数据标准是描述数据资源的具体对象时所有规则的 集合,它包括了完整描述一个具体数据对象时所需要的数据 项集合。针对各种信息资源分别制定适当的元数据标准,可 为信息的管理、发现和获取提供一种实际而简便的方法,从 而提高数据交换效率。

4) 数据交换标准

为了保证数据共享和交换的顺利实现,必须明确定义和 规范数据交换的相关标准。数据交换的标准规范是集团单位 综合信息平台的核心标准。其中应当包括数据交换内容、数 据交换格式、数据传输方式、各类中心间数据接口的标准化 等方面。

5) 数据质量标准

由于数据采集任务通常由其他二级平台完成,数据治理 平台的标准方法主要集中在数据的加工和管理上。应该重点 开发的一个领域是数据质量控制方法。应当从三个方面对数 据质量方法进行研究:“坏数据”或“不可靠数据”的识别, 错误数据的编辑方法,以及缺少值的处理。

你可能感兴趣的:(人工智能,大数据,运维)