数仓(八):数据建模:如何判断一个数据模型的好坏?数据仓库的 KPI 怎么定?

 一、数仓模型优化-如何判断一个数据模型的好坏

在这里插入图片描述

 1.完善度

汇总数据能直接满足多少查询需求,即应用层访问汇总层数据的查询比例

跨层引用率:ODS层直接被DWS/ADS/DM层引用的表,占所有ODS层表比例

可以快速响应业务方的需求

比较好的模型,使用方式是可以直接从该模型获取所有想要的数据的,如果DWS,ADS,DM层直接引用ODS层的表比例太大,即跨层引用率太高,则该模型不是最优,可以继续优化

2.复用度

模型引用系数:模型被读取并产出下游模型的平均数量

3.规范度

主题域归属
分层信息
脚本及任务命名规范
表命名符合规范(清晰、一致,见名知意)
字段命名是依赖于词根

4.稳定性

能否保证日常的sla(时效保障)

5.扩展性

新增加的模型是否和老的模型出现冲突,增加新的模型,在老模型上增加字段,能否可行

你可能感兴趣的:(数仓&数据中台,big,data,数据库)