原文链接:数据资产为王,解析企业数字化转型与数据资产管理的关系
视频回顾:点击这里
课件获取:点击这里
随着企业数字化转型的深入,数据体量爆炸式增长,如何控制数据生产成本、发现有价值的数据,提高数据ROI,成了企业数字化转型中后期的关键任务,这也是数据资产管理的终极目标。
而在数字化转型过程中并不是一帆风顺,往往会遇到很多问题。如何控制生产成本、发现恶性成本因素、量化生产成本?如何发现价值数据、梳理数据分布、分析数据价值?这都是企业是实现企业数字化转型路上需要思考的问题。
如何解决上述问题,关键点在于利用方法论+工具思路构建数据资产管理平台。
那么如何给予方法论进行数据资产管理呢?我们可以从以下几个方面入手:
在梳理数据之前,我们首先要明确三个目标:
目标一:明确有哪些数据
目标二:理解这些数据的作用
目标三:便捷统一的查询入口
明确完目标后,根据元数据管理五步法,我们来进行数据梳理:
第一步:采集元数据
第二步:定义元模型
第三步:维护元数据
第四步:元数据质量
第五步:元数据查询
元数据采集上来之后,要做的第二个事情就是数据标准和数据模型,这个步骤和元数据管理并没有非常明确的切分,但在一般企业做数据资产管理时一般会先做元数据管理,因为见效比较快。
传统的数据开发方式会出现许多问题,例如:表名缺乏约束规范,无法直观的从表名判断出输出层级、数据含义;字段缺乏注释;字段名不严谨,status等于状态,不等于订单状态;没有定义数据生命周期lifecycle等。
而规范方式在底层对数仓分层、主题域等进行规范设计,建立数据标准然后统一进行模型设计,之后进行模型审核然后模型发布,提升整体的数据规范性。
技术部门与业务部门共同确定数据质量提升场景,从业务场景出发,从上至下建设,不能由开发人员想到什么临时校验什么,包括:
从业务场景出发,解决实际的业务数据问题,明确建设目标,保障执行策略无偏差
线下调研、收集、整理数据问题,按业务目标进行分类管理
根据业务分类进行规则集管理,根据数据质量反馈不断优化、沉淀规则集
量化数据价值从两个方向入手,一个是数据成本,一个是数据价值。
数据成本包括建设成本及资源成本两块,建设成本无法单算,只能根据项目成本(中台建设、交付实施等项目)、人力成本进行估算;而资源成本则可以量化,也是我们需要重点关注的部分,包括存储单价、计算单价等。
数据价值直接收益和间接收益,直接收益是指对于部分跨集团数据共享、数据封装对外销售的场景,可直接量化收入;间接收益是指大部分数据是服务企业内的业务开展,无法直接进行量化收益,只能间接从这两个维度分析价值:数据使用热度、数据上下游依赖。
通过数据成本和数据价值的合理测算,我们就能量化数据价值。
上面我们为大家讲了很多方法论的内容,那么有没有一款产品能够切实解决企业问题,帮助企业搭建数据资产管理平台呢?在这里我们为大家介绍袋鼠云数栈的数据资产产品——湖仓数据资产(DataAssets)。
湖仓数据资产管理平台(DataAssets),通过元数据管理、数据标准规范设计、数据质量提升、数据热度和成本计算,优化数据生产成本、量化数据收益价值,广泛应用于湖仓建设的中后期阶段。
湖仓数据资产管理平台的产品特点是通过统一平台以达到治理闭环的效果。
产品主要包含以下几个功能:
同时产品具备以下价值
全面采集、管理、盘点数据,让大家知道并理解企业有哪些数据
建设数据标准体系,通过数据模型的自动引入,完成规范的模型设计
通过事前规则配置、事中规则执行、事后质量报告,及时发现问题数据,有效避免问题的影响扩散
通过分析数据的成本、收益,合理评估每份数据的价值
接下来我们分享三个使用客户的实际案例,为大家介绍数据资产管理平台如何切实的帮助客户解决问题。
原文来源:VX公众号“数栈研习社” 袋鼠云开源框架钉钉技术交流群(30537511),欢迎对大数据开源项目有兴趣的同学加入交流最新技术信息,开源项目库地址:https://github.com/DTStack