数仓建模—元数据管理

元数据管理

元数据在数据仓库中远比操作型环境中更加重要,因为数据仓库是一个不断迭代升级并且数据量也是远远大于操作型数据库的,所以我们需要元数据进行更好的监控和管理。

  • 元数据通常定义为"关于数据的数据",在数据仓库中是定义和描述DW/BI系统的结构,操作和内容的所有信息。元数据贯穿了数据仓库的整个生命周期,使用元数据驱动数据仓库的开发,使数据仓库自动化,可视化,管理这些附加MetaData信息的目的,一方面是为了让用户能够更高效的挖掘和使用数据,另一方面是为了让平台管理人员能更加有效的做好系统的维护管理工作。

  • 元数据可以帮助数据平台解决"有哪些数据"、“数据存储有多少”、“数据流中的血缘关系”、“如何找到我需要的数据”、“如何使用数据"和"数据的生产进度”,并对上游线上业务库的同步进度和元信息变更进行监控,及时进行影响分析及预警。

  • 元数据管理系统为大数据平台绘制数据地图、统一数据口径、标明数据方位、分析数据关系、管理模型变更及精确到字段级别的影响分析打通上下游数据继承关系断层,为数据质量维护和业务逻辑可视化打下坚实基础

  • 其实当我们的数据体系达到一定的量级之后,我们能否做到数据推荐的效果,例如我们可以为用户推荐他感兴趣的数据

元数据定义

  • 元数据MetaData狭义的解释是用来描述数据的数据,广义的来看,除了业务逻辑直接读写处理的那些业务数据,所有其它用来维持整个系统运转所需的信息/数据都可以叫作元数据。比如数据表格的Schema信息,任务的血缘关系,用户和脚

你可能感兴趣的:(#,数仓建模,数据仓库,数据治理,数仓建模,元数据)