DW Design

1. 数据类型
如果某PK是很多表的FK,也就是说该表是很多表的父表,那么在设计这种顶层的表的时候,一般要考虑到将来的变更可能带来的问题,所以一般在设计这种表的时候要尽量放宽标准,比如列长要宽、约束要小等等

2. ETL process flow
应当按照数据源(source host)进行归类,而不应该按照DW的主题表进行归类。
EX LD TR应当放在一个大的container下面(按照 source host)

3. Surrogate Key

Surrogate Key, 对于多个源系统集成到统一的一个表中的时候,Surrogate Key应当具有一定的编码规则,这可能与理论上Surrogate Key是一个identity有悖,但是我们的实践证明,SurrogateKey应当具有编码规范, 就像邮政编码或者C++中的namespace的概念一样。

DW Design_第1张图片

你可能感兴趣的:(c)