为什么要构建指标中台?数据指标的问题

1、综合内部实践和外部交流,指标使用问题主要集中在以下六大方面:

  • 指标口径不一致:常规数据质量问题统计中,约有 31% 涉及指标口径问题;

  • 指标入口不统一:缺少一个企业级的统一消费入口,不知道从哪去找,拿到了不知道口径是否一致、是否可信;

  • 指标价值难以量化:难以跟踪和量化指标的使用,报表开发成本涉及存储资源、计算资源、开发资源等多方投入,如果长时间无人访问,就是一种浪费;

  • 指标开发效率低:指标开发涉及多部门、多角色协同,业务人员无法独立完成,数据分析团队成为指标开发的瓶颈;

  • 重复计算大量消耗资源:大量的中间表计算冗余、复用度低等,涉及到分层设计加工;

  • 指标质量差:问题溯源难度大,排查效率低;因为加工路径长,开发引入的问题占比超 60%,而且其中 90% 由业务先发现。

2、针对指标应用的服务模式,商业客户方提出:

  • 物化到业务库:由于 Hive 源数据和下游应用库分属不同团队管理,客户期望将指标中台的加工结果,物化到下游业务系统库;

  • 指标目标管理:在指标计算的基础上,客户关注指标目标达成情况的在线查看、关联指标的进展查看等,需要考虑指标业务目标的管理能力;

  • 统一调度引擎:企业内部已有成熟的调度平台,如 Apache DolphinScheduler 等,采用统一的调度平台可以方便指标上下游任务统一管理,使计算依赖管理成为可能,加快指标生产。

为什么要构建指标中台?数据指标的问题_第1张图片

你可能感兴趣的:(大数据)