人工智能,数据先行——浅谈人工智能时代数据治理的必要性

党的十九届四中全会《决定》在“优化政府职责体系”中,提出要“建立健全运用互联网、大数据、人工智能等技术手段进行行政管理的制度规则”。而互联网、大数据、人工智能等技术手段应用的基础就是数据。

在国家政策支持和行业实际需求增长的情况下,政府部门、军队军工和大型企业通过搭建一系列的大数据系统、大数据平台,来提高自身的组织管理能力。由于系统和平台建设趋于稳定,数据量也与日俱增,但是数据的质量却无法保证,要想进一步实现组织管理能力的智能化、智慧化,数据治理势在必行。

什么是数据治理?

(内容来源:《数据治理技术》吴信东,董丙冰,堵新政,杨威)

至今为止,数据治理还没有统一标准的定义。IBM对于数据治理的定义是,数据治理是一种质量控制规程,用于在管理、使用、改进和保护组织信息的过程中添加新的严谨性和纪律性。DGI则认为,数据治理是指在企业数据管理中分配决策权和相关职责。

数据治理的目标,总体来说就是提高数据质量,在降低企业风险的同时,实现数据资产价值的最大化,包括:

• 构筑适配灵活、标准化、模块化的多源异构数据资源接入体系;

• 建设规范化、流程化、智能化的数据处理体系;

• 打造数据精细化治理体系、组织的数据资源融合分类体系;

• 构建统一调度、精准服务、安全可用的信息共享服务体系。

其次,我们还需理解数据治理的职能——数据治理提供了将数据作为资产进行管理所需的指导。最后,我们要把握数据治理的核心——数据资产管理的决策权分配和职责分工。

由此,数据治理从本质上看就是对一个机构(企业或政府部门)的数据从收集融合到分析管理和利用进行评估、指导和监督(EDM)的过程,通过提供不断创新的数据服务,为企业创造价值。

数据治理的现状

信息协同受到阻碍:大部分组织的数据基础薄弱,存在数据标准混乱、数据质量参差不齐、各条块之间数据孤岛问题严重,对数据信息的共享,业务的有效协同形成阻碍。

智慧场景严重缺失:智慧场景受限于数据规模和数据源种类的丰富程度,多数组织的数据应用刚刚起步,主要集中在舆情感知、辅助决策等有限场景,应用深度不够,应用场景缺失严重。

数据治理认知模糊:大部分组织拥有庞大的数据量,由于数据治理认知模糊,未能建立起一个有效管理和应用数据的模式,在数据服务和数据应用方面也缺乏合规性的指导,难以找到一条释放数据价值的“最优路径”。

数博数据治理平台

平台利用多源异构业务数据的采集融合、存储组织和分析挖掘等技术,满足政府部门、军队军工和大型企业的组织业务信息管理需求,为后续深入数据分析和业务决策提供基础支撑。通过组织级的主数据及数据资源管理,构建领域概念体系、持续融合不同版本、不同结构、不同编码体系的数据、形成统一的覆盖全业务领域全部数据的数据中心,解决信息孤岛问题。

人工智能,数据先行——浅谈人工智能时代数据治理的必要性_第1张图片

 

  1. 支持特征
  • 支持企业数据标准的开发和管理
  • 元数据管理和数据资源架构管理
  • 多源异构的数据资源采集
  • 大规模结构化和非结构化数据资源的存储组织
  • 基于主题的数据资源融合;基于规则的数据质量管理
  • 非结构化数据管理
  • 多级权限管理和全生命周期数据监控
  1. 应用场景
  • 数据共享交换

由于各行业信息化发展速度过快,流转数据的类型多、数量多、目标地多、采集端多,对数据的安全性、完整性、准确性和鲜活性提出了较高要求。政府部门、军队军工和大型企业依托基础信息库数据内、外部流转,融合形成的数据可以通过数据共享交换为数据资源中心赋能,利用订阅、接口访问等方式将高质量、高权威的数据分发到应用部门内部或部门间的应用系统中。实现一对多、多对一、多对多等各类数据开放请求,确保数据在业务系统、外部政府机关、外部社会机构和基础信息库间传递的及时、准确、可靠。

  • 数据资产中心建设

为满足国家和地方关于发挥大数据技术在政府治理、服务公众方面的工作要求,通过建设数据资产中心,采集、归纳、学习、分析各类业务数据,实现相关业务部门数据资源的传递、共享与交换,使数据资产中心的数据资源不断壮大,利用数据资产中心数据资源统计分析后的成果,形成以数据为支撑的社会治理能力,打通各业务系统间的数据壁垒,在实现数据统筹、业务协同、整合联动的基础上,为其他政府单位、社会公众和产业部门提供信息共享、数据开放等各类数据服务。

  • 多源异构数据集成

根据数据中心的建设需求,利用丰富的采集系统适配多样化的数据采集接口,将不同来源的数据采集到原始数据库。针对所需数据采用合适的安全技术和清洗规则,确保数据安全,提升数据质量。最终实现将不同来源的数据统一采集到数据中心技术平台的原始数据存储库,实现多源异构数据的连接汇聚。

  • 数据资产盘点

数据资产盘点是一个循序渐进、迭代上升的过程。旨在对数据资产进行分门别类的盘点、找出价值数据、过滤掉垃圾数据,制定数据资产管理应用方法,从而快速建立数据模型、响应前端应用需求;对数据标准进行有效管理,使数据保持一致性和统一性,以便进行有效的数据服务共享、提高数据质量,发挥出数据资产的最大价值,为政府部门、军队军工和大型企业决策分析提供有力支撑。

“人工智能,数据先行”人工智能时代的魅力在于能够使产品和服务的价值最大化,但前提是需要利用庞大且宝贵的数据资产来挖掘其中的价值,而数据治理则可以减少数据挖掘所需要的时间,合理的数据治理能够建立规范且统一的数据标准,提高数据质量,实现数据资源在各组织机构部门的共享,推进数据资源的整合与服务,从而提升政府部门、军队军工和大型企业的信息化、智能化水平。

你可能感兴趣的:(大数据治理)