数据仓库建设一(核心概念)

核心概念与步骤

维度模型:

1.雪花模型:事实表-join-维度1-join-维度2-join-..

一个实事表关联多级维度表

2.星型模型:事实表-join-维度表

一个实事表关联维度表,维度表没有级联关联

3.星座模型:事实表-join-维度表-join事实表

一个维度表被多个事实表关联

数据分层(公司的业务需求,一般):

ods:用于保存同步的业务库与应用日志数据,一般采用snappy或者gz压缩,格式采用orc

dwd:事实表,维度表

dws:主题域表,以维度为核心,观察业务过程

ads:应用报表层

维度建模的四个步骤:

1.业务过程选定:与业务方式商讨他们关注的业务过程(在公司目前没有报表数据时;当公司有报表时,你做的数据仓库建设时,就需要能够支撑现有的业务,还要有更强的功能)

2.粒度确定:能代表业务一条数据

3.维度选定:这个业务涉及到哪些维度,这个维度的确定要根据你的业务库的ER图去确定

4.度量的选定:关注的业务的业务库中包含的可相加的指标与不可相加的指标

你可能感兴趣的:(数据仓库,大数据,数据仓库)