数据工程师及业务人员在数据分析及数据应用开发过程中,经常处在空有亿万海量数据,却找不到实际需要的数据、难以理解数据的真实含义、无法接受数据不可信的局面。
如何打破这种局面,你知道吗?
小黄是企业设备维保部门的职员,计划对发货设备进行维保服务,需要查找所有设备信息、维保记录、过保设备信息等多重数据。
但是,数据应该从哪里获取?获取哪些数据?数据是否完整、正确?面对这些无法厘清的数据与问题,小黄不知所措,更无从下手!
诸如此类的场景,在公司日常运营的各个环节司空见惯,严重阻碍业务高效开展。
究其原因,无非是企业数字化转型过程中,数据治理层面缺少对元数据的有效管理。
1
元数据到底是什么?
元数据是什么?它是描述数据的数据,可以通俗理解为数据的“说明书”,通过元数据可以更准确理解数据来源、数据结构、上下文等信息,进而可以对数据进行分类、编目,最终实现数据的快速检索和应用。
❖ 元数据示例:
各种类型的元数据
❖ 元数据属性:
对数据指标体系化的汇总,使得某一业务域横向、纵向的指标体系化,汇总并明确指标的口径、维度、指标取数逻辑等信息,从而快速、准确地获取指标的相关信息。
例如,销售主题的指标体系如下所示,通常包含业务、技术和管理三部分属性内容:
①业务元数据:业务元数据定义数据的业务含义、业务规则等;消除数据二义性,让用户对数据有一致的业务认知,为数据分析和应用提供有力支撑;
②技术元数据:技术元数据明确数据的存储、结构,为应用开发和系统集成奠定基础;通过技术元数据厘清数据关系,支持数据血缘追溯和影响分析;
③管理元数据:管理元数据定义数据的操作属性,包括管理部门、管理责任人等;有利于将数据管理责任落实到部门和个人,是数据安全管理的基础。
❖ 元数据管理:
如以上所述,我们已经认识到元数据管理对于企业的重要性,但目前大部分企业对元数据管理通常面临以下困境:
①很多企业的元数据管理是基于局部的数据治理之上,缺少企业级的元数据管理,导致元数据信息不完整;
②很多企业在元数据的管理过程中偏重技术元数据的管理,容易忽略业务元数据、管理元数据;导致无法准确理解数据的业务含义;
③很多企业缺少统一的元数据管理平台,导致元数据的梳理、定义、采集、管理维护等工作,通常由人工手动处理,工作量大、易出错,无法确保元数据管理的及时性、准确性、可靠性。
元数据管理面临的问题
2
元数据的管理目标
举个例子,将图书馆的图书类比为数据资产:元数据管理的工作是创建图书目录、索引和用户指南,辅助读者进行书籍快速查找和数据阅读。
目前很多企业没有完整的数据治理规划,导致关键信息缺失,元数据的获取比较困难等,因此需要对元数据管理进行整体规划,以更好实现元数据的获取和管理。
企业元数据管理需要以业务需求为目标,主要包含:
❖ 元数据治理:实现企业元数据的统一治理,为企业的数据应用开发提供可复用的数据模型和元数据标准。
❖ 数据治理提升:统一的元数据管理为数据稽查、数据质量管理打下良好的基础,实现数据治理能力和质效的提升。
❖ 数据资产编目:基于元数据管理实现数据资产分布和数据关系的梳理,快速形成企业数据资产编目;提高数据资产管理效率及应用能力。
元数据管理的目标
3
元数据管理的主要内容
企业数据治理及数据资产流转过程中都会涉及到元数据的管理,包括对数据源、数据湖、数据仓库、数据资产、应用层、BI展示层所对应的元数据进行统一的管理。
企业在确立了元数据管理的目标之后,进行元数据规划以及元数据管理策略的制定。主要包括以下内容:
元数据管理的主要内容
❖ 元数据管理的基本策略:
①坚持以易用、实用、易理解、准确为基本原则;
②支持异构系统之间元数据标准统一,支持互操作;
③面对复杂多变数据环境支持元数据管理的扩展性。
❖ 元数据的梳理:
根据不同分类框架对元数据进行梳理,通常有以下两种方式,在实际的元数据管理过程中,企业通常需要根据业务需求,两种梳理方式相结合,来构建企业级的元数据地图。
①站在业务视角梳理:基于企业的业务域或管理域、从业务主题、实体、数据模型等逐层递进分解梳理,形成企业数据目录,通过这种方式形成的元数据易于业务人员理解和使用;
②站在技术视角梳理:通过对数据源对应的IT系统、数据表、数据结构进行分析和梳理,形成企业数据目录;通过这种方式形成的元数据便于IT技术人员理解和使用。
❖ 元数据的定义:对元数据的业务属性、技术属性、管理属性进行标准的定义,主要是描述元数据各属性内容:例如名称、用途、存储位置、历史数据、更新时间等。
❖ 元数据的采集:通过元数据管理平台中自动化采集能力,对元数据进行识别和获取,包括缺乏原始元数据信息的老旧系统,通过人工进行元数据的补充后,实现统一管理。
❖ 元数据的管理:在完成对分散在各业务系统中的元数据采集、梳理后,建立技术元数据、业务元数据、管理元数据的映射,形成企业级元数据地图并支持多版本管理。
❖ 元数据的应用:支持元数据查询、元数据报表以及元数据分析,通过元数据管理平台对相关用户分配相应的元数据使用权限。
❖ 元数据的变更:各业务系统数据源等信息会随时发生变化,企业可以采用自动识别和主动申请元数据变更两种方式,来落实元数据的变更与新版本的发布。
4
元数据的管理体系
企业基于数据治理整体框架,建立元数据管理体系,需要从组织保障、运营制度、业务流程、管理平台等方面确保元数据的落地和持久化运营,帮助企业管理好元数据,使用好元数据。
❖ 组织保障:组织保障:建立高层支持、中层管理、基础执行三层级专业化数据治理组织,为元数据管理工作提供组织保障。
❖ 运营制度:元数据管理是企业数据治理基础,需制定配套的管理制度、奖罚措施进行日常运营管理,这是元数据管理持续推进的动力之一。
❖ 业务流程:确立元数据从产生、定义、发布、变更维护等全过程管理流程,确保元数据管理持续高效推进。
❖ 管理平台:搭建统一的元数据管理平台,实现企业级元数据集中管控,支持元数据采集、元数据管理、元数据共享等,为元数据管理提供技术保障。
5
元数据的管理平台
OceanMind海睿思元数据管理平台,提供从元数据的识别、采集、管理到应用的全过程管理能力。
通过元数据管理,企业可以方便掌握元数据全貌,快速掌握数据源头、了解数据流向,对元数据的血缘、影响、质量等进行分析。
平台提供以下核心能力:
❖ 元数据采集:支持从不同的数据源采集所需的元数据信息,并监控采集任务执行情况。采集方式支持手动采集,也支持设置定时策略进行自动采集。
元数据采集任务创建
❖ 元数据管理:按照数据源名称分类展示元数据列表。支持导入本地元数据文件、导出元数据。支持对元数据进行版本管理,记录版本变更和详情。
元数据管理详情
❖ 元模型管理:支持定义不同元数据类型的存储格式,元数据类型可以支持系统、表、存储过程、脚本、接口等。
元模型管理
6
元数据的管理价值
元数据管理之于企业数字化转型大的价值主要表现在:
❖ 建立完备的数据解释体系:解决用户对业务和数据理解的需求,通过数据资源目录和业务元数据等,告诉我们目前企业有哪些数据?数据对应的业务含义和归口部门等信息。业务人员可以通过元数据管理快速获取所需的数据,提高数据应用的效率。
❖ 打造全流程的数据溯源基础:基于元数据管理,我们可以清晰地洞察数据的来龙去脉、处理过程、结果等,通过对数据的血缘分析、影响分析,实现数据全链路分析和溯源,为企业实现业务全生命周期管理奠定良好基础。
❖ 提高全域数据治理能力:通过元数据管理,实现对分散在各业务系统中的数据分门别类、统一管理;并制定对应质量管理规则、业务稽核规则,高效实现数据完整性、准确性核验;提高了企业数据治理能力和效率。为企业的数据分析挖掘、数据应用、业务开展提供了高质量的数据保障。
OceanMind海睿思 长期致力于帮助企业构建一站式数据治理能力,加速企业数字化转型进程,为企业健康运营提质增效,做您身边的数字化转型专家!