数据中台建设方法论

1、数仓的概念和了解--业务的痛点

产生的痛点:数据资产比较模糊、数据的质量比较低、重复建设、代码的耦合性比较强。

2、数据仓库中的常见的模型:
1、心型模型:中间是一张事实表,周围都是维度表。

数据中台建设方法论_第1张图片

对于心型模型的主要的特点:

非正规化、不存在渐变维度、有冗余数据、查询的效率比较高、不用过多的考虑正规化因素,设计维护是比较简单。

2、雪花模型:指的是在心型模型的基础上,在维度表上面还存在维度表。

数据中台建设方法论_第2张图片

主要的特点:

正规化、数据冗余比较少,有些数据需要连接才能获取,效率会比较低,规范化操作比较复杂,导致设计后期的维护比较困难 。在实际的应用中会将雪花模型和心型模型结合使用。

3、维度表的设计的方法:

选择维度、 确定维表、梳理维度关系、定义维度属性

4、事实表的设计流程:

数据中台建设方法论_第3张图片

 5、ONE  DATA数据模型
1、one data  一种元素只出现一次,在数仓中只能被定义一次。
2、逻辑架构:

数据域:是指一类数据的,比如说在在一个公司中包含不同的部门,每一个部门就类似一个域,例如业务部门可以称为业务域。

数据中台建设方法论_第4张图片 

你可能感兴趣的:(数据仓库,大数据)