维度建模(星型、雪花、星座)

整理不易,转发请注明出处,请勿直接剽窃!
点赞、关注、不迷路!

摘要: 事实表、维度表、维度模型、核心四步骤

事实表:度量(数值)、维度表的主键作为事实表的外键。
事务表分类:
事务事实表:最细粒度,承载事务数据。如产品交易事实表。
周期快照事实表:按一定时间周期的业务累计数据,粒度粗。如账户盈亏月表。
累计快照事实表:记录整个过程的信息,少见。
维度表:包含事件发生的实际存在的文本环境,比如产品、地区、日期等各个维度表。
维度表可以分为两类:一般维度表和固定维度表
一般维度表的数据是不断增加和变化的
固定维度表的数据是不变的

事实表的设计是以 能够正确记录历史信息 为准则,维度表的设计是以 能够用合适的角度来聚合主题内容 为准则

维度模型

雪花和星型模型都是基于一张事实表通过外键关联维表进行扩展,生成一份能够支撑可预知查询需求的模型宽表。

星型模型

维度表围绕事实表,一个事实多个维度,维表地位相同。
维度模型(星型模型)比较简单,而且适于变化,各个维度的地位相同。可根据业务情况进行新增或者修改(只要维度的单一值已经存在事实表中),查询效率高。
维度建模(星型、雪花、星座)_第1张图片

雪花模型(性能低)

有些维表不与事实表直接关联,而是通过其他维表关联到事实表,可以看作是对维表的拆分,一般符合3范式,但查询效率低。
维度建模(星型、雪花、星座)_第2张图片

星座模型(较多采用)

多个事实表相组合,维表是公共的。
维度建模(星型、雪花、星座)_第3张图片

维度建模四个步骤

1.选择业务过程
表示的是业务执行的活动,产生一系列事实表。
2.声明粒度
粒度是事实表的度量细节级别。通常从原子级别粒度开始设计,这样可以支持上卷,也支持下钻细节,能够承受各种用户查询。
3.确认维度
文本属性,用来修饰事实表。
4.确认事实
是维度建模的核心。
不同粒度的度量要放在不同的事实表中。
通过外键关联相关维度。
查询操作是基于事实表开展计算和聚合。

你可能感兴趣的:(阅读,大数据,数据仓库)