Kimball 维度建模理论

一、维度建模分为两种表
  1. 事实表
    存在这样一些数据,如行为记录,操作记录,订单,日志等,都可以作为事实表
    特点:每条数据都有一个唯一键,数据通常来说不会更新,随着时间的增加而增加
  2. 维度表
    维度表是分析数据角度的信息表,如商家信息,地区信息,用户信息为角度存储的表,适合经常更新,一般和事实的关系是一对多
二、维度建模三种模型:
  1. 星型模型
  2. 雪花模型
  3. 星座模型
说明:

1). 星型模型
以事实表为中心,所有的维度表直接连在事实表上,比较常用的一种形式。这样维度加事实的结构即便于维度数据(少数据量)更新,又能够满足自由组合满足不同的分析维度
Kimball 维度建模理论_第1张图片
如上图所示:

  1. 产品表与部门表,会存在更新现象,而事实表,一般只存储部门ID,产品ID,在需要的时候再进行关联
  2. 这样的结构能够以部门的维度做数据分析,如统计某部门的销售金额,亦能够以产品的角度分析某个产品的销售总额,能够灵活的以不同角度分析和查看数据

2). 雪花模型
雪花模型指的是在星型模型的基础上,维度表再关联维度表,这种结构应该在OLTP场景下会用这样的结构,在数仓下基本没人使用。如果业务数据存储为这样的结构,常常将数据打平,即合并成一张维度表,这样它将会上级为星型模型。之所以如此是为了减少表连接查询的性能开销和维护的复杂程度,雪花模型如下:
Kimball 维度建模理论_第2张图片
2). 星座模型
在实际业务中,星座模型才是数仓建设的最终归属,它也是建立在星型模式下,不同的是只是和其他事实表共享了维度表,即存在多张事实表,共享一张维度表的情况
Kimball 维度建模理论_第3张图片

kimball 维度建模,星型和星座 模型核心在于将事实表(过程数据通常不变的数据)与主体信息表(常更新的数据,有维度信息)逻辑进行拆分。 实现任意维度分析的需求下,减少表连接查询的深度,这也是市面上常见的数仓建设理论

你可能感兴趣的:(数据中台,数据挖掘,人工智能)