数据仓库工具箱-维度建模

1 维度建模初步

 事实表--一行必须有一个度量--最好是可加的度量事实。

事实表粒度归属于:1事务2周期快照3积累快照。

事实表是不同维度表的多对多关系。

数据生产源中的字段是作为度量值还是维度属性?经常改变的-->度量值:不经常改变的-->维度属性。

 

 2 零售营销

 维度设计的四步:1选取要建模的业务处理过程,例如选择以销售结果为要建模的过程?2定义业务处理力度,例如从pos机上结账这一粒度?3选定每个事实表的维度。4选定每个事实表的数字型事实。

选取的维度及其属性:1日期维度,若以天为单位,可以穷举;若要以分钟为单位,可以再建立一个24X60的分钟维度表。

2产品维度。3商场维度。4促销维度,若要知道哪些促销的商品没卖出去,需要另一个事实表,粒度为所有促销活动的商品。

最好不要出现雪花处理,和维度过多(15个以上)

市场篮子分析:为找出哪些商品时一块销售出去的。避免出现组合爆炸,使用修剪算法。具体怎么做?

总结:维度划分主要还是按时间维度,类别维度,空间维度,以其其他?还是需要对实际业务的属性来选取维度和维度的属性。市场篮子分析选择组合的相关性和数量的最小值也需要对业务的经验。

 

3 库存

 周期快照,不可加

 

4 订单

流水快照,共同的维度组成维度总线

你可能感兴趣的:(read,notes)