数据建模理论小结:Inmon和Kimball

看了这么多数仓模型的对比文章,我想把我总结的一些东西记录下来。

 

说到数仓建模,那么肯定离不开两种方式:范式建模(Inmon)和维度建模(kim ball)。这两种方式各有适用的地方,需要根据具体应用场景进行选择。当然还有一种独立数据集市的方法,不过这种方法容易造成很多数据烟囱以及数据孤岛(没有一致性维度和一致性事实的支持,是无法支持支持多主题区域,并且使得各个数据集市成为信息孤岛,缺乏兼容性。),无法广泛性的运用,这里就不讨论了。

Inmon

Inmon建模的方式是自下而上的,那么什么是自下而上呢?我的理解是先打好广而全的数据基础,考虑当下业务场景中的所有可能,基于范式建模的理念去设计数据仓库,然后基于各种业务场景去开发数据集市以及BI应用。

 

Kimball

而kimball的方式是自上而下的,这种方式就不用考虑很大的框架,针对某一个数据域或者业务进行维度建模,得到最细粒度的事实表和维度表,形成适用于某一个数据域、业务的数据集市之后,再集成各个数据集市为数据仓库。这其中的要点就是保持各集市之间的一致性维度和一致性事实,不然在集成为数据仓库的时候很麻烦,会无法确认各个集市之间的数据具有关联性、通用性。kimball的这种范式就是开发速度比较快,相对比较省事,但是后续维护会比较麻烦。

 

在这里引用一张图,相信大家就能比较清楚的了解kimball和Inmon的区别了。

图片来自来源网址,和下面第一篇参考网址一样

名词解释:

数据仓库收集了整个组织的主题信息,因此它是企业范围的。数据集市(data mart)是数据仓库的一个部门子集,它聚焦在选定的主题上,是部门范围的

数据仓库是一个从多个数据源收集的信息储存库,存放在一个一致的模式下,并且通常驻留在单个站点。数据仓库通过数据清理、数据变换、数据集成、数据装入和定期数据刷新过程来构造。

 

 

 

关于建模理论的书籍我比较推荐:inmon的《数据仓库》,kimball的《数据仓库工具箱》以及阿里的《大数据之路》。通过阅读这几本数据的相关章节再加上实战,相信对建模理论会有更深的理解。

 

---未完待续

 

参考文献:

1.https://segmentfault.com/a/1190000006255954?utm_source=tag-newest(强烈推荐!!!)

2.https://blog.csdn.net/kingzone_2008/article/details/8140951

3.https://blog.csdn.net/maenlai0086/article/details/86759984

4.https://blog.csdn.net/weixin_43334198/article/details/82936232

5.https://blog.csdn.net/NextAction/article/details/78928033

 

你可能感兴趣的:(数据建模)