数据建模.

数据建模

  1. 什么是数据建模
  2. 为什么要进行数据建模
  3. 怎么进行数据建模

1. 为什么要进行数据建模?

提高

  1. 效率/性能: 计算机的的吞吐率,减少I/O的时间,提高用户使用数据的效率。
  2. 开销:减少数据的冗余,从而节省存储空间
  3. 质量:统一数据的口径,减少数据计算错误的可能性。

2. 怎么进行数据建模?

  1. OLTP系统和OLAP系统的区别。

一个是联机事务(业务)处理系统,另一个是联机分析处理系统。两个系统的关注点不一样,所以需要进行不同的数据建模。

业务处理系统,关注事务的一致性,所以主要采用3NF的E-R模型进行存储,从而解决事务的冗余和一致性问题。

联机分析系统,主要关注数据的批量读写的性能,因此需要采用不同的数据建模方法。

  1. 数据库广义的划分为事务处理和决策支持系统,就是对应着上面的两种系统。OLAP和OLTP只是一种手段而已。
  2. 数据仓库的概念:

数据仓库是将从多个数据源中收集来的信息以统一的模式存储在单个站点上的仓库。数据仓库提了一个单独的、统一的数据接口,易于决策支持和查询书写。而且,通过从数据仓库里访问用于支持决策的信息,决策者可以保证在线事务处理不受决策支持负载的影响。

数据仓库需要解决哪些技术问题?

数据建模._第1张图片

总结1:从这个角度来说,数据仓库就是决策系统的数据库。区别于事务处理系统的数据库。

总结2: 从这个角度来说,大数据的分析就是为IT系统做决策所使用的系统。数据仓库也就是对应着大数据开发中的第4、5步业务建模,考虑IT系统怎么使用决策系统的输出进行工作。

总结3:数据建模就是为了数据仓库建立而设计模型的过程,或者为事务系统数据库建立设计模型的过程。

  1. 怎么进行数据建模

综上的一些概念,需要对不同种类的系统进行不同的建模分析。根据上面不同系统各自的特点进行不同的模型建立。

3. 经典的数据仓库建模方法论

  1. E-R模型
  2. 维度模型
  3. Data Vault模型
  4. Anchor模型
  5. 阿里巴巴数据模型实践综述

4. 参考文献博客

《数据库系统概念》

大数据实践之数据建模

你可能感兴趣的:(数据库,数据仓库)