数据仓库建模理论——总结

四种模型:

  • ER模型
  • 维度模型
  • Data Vault模型
  • Anthor模型

以上四种模型,当前最流行建模方法为:ER模型、维度模型

ER模型

ER模型常用于OLTP数据库建模,应用到构建数仓时更偏重数据整合,站在企业整体考虑,将各个系统的数据按相关性一致性、合并梳理,为数据分析、决策服务,但并不便于直接用来支持分析。

ER模型的问题:
  • 需要全面梳理企业所有的业务和数据流。
  • 实施周期长
  • 对建模人员要求高

维度模型

唯独见面是面向分析场景而生的,针对分析场景构建数仓模型;重点关注快速、灵活的解决分析需求,同时能够提供大规模数据的快速响应性能。针对性强,主要应用于数据仓库构建和OLAP引擎底层数据模型。

  • 不需要完整的梳理企业业务流程和数据。
  • 实施周期根据主题边界而定,容易快速实现demo。

CIF层次架构

  • 数仓模型的选择是灵活的,不局限于某一种模型方法。
  • 数仓模型的设计也是灵活的,以实际需求场景为导向。
  • 模型设计要兼顾灵活性、可扩展,而对终端用户透明性。
  • 模型设计要考虑技术可靠性和实现成本。

你可能感兴趣的:(数据仓库建模理论——总结)