2020.8.4

一、文章主题

本文主要讲解数据仓库的一个重要环节:如何设计数据分层!其它关于数据仓库的内容可参考之前的文章。

 

本文对数据分层的讨论适合下面一些场景,超过该范围场景 or 数据仓库经验丰富的大神就不必浪费时间看了。

  • 数据建设刚起步,大部分的数据经过粗暴的数据接入后就直接对接业务。
  • 数据建设发展到一定阶段,发现数据的使用杂乱无章,各种业务都是从原始数据直接计算而得。
  • 各种重复计算,严重浪费了计算资源,需要优化性能。

二、文章结构

最初在做数据仓库的时候遇到了很多坑,由于自身资源有限,接触数据仓库的时候,感觉在互联网行业里面的数据仓库成功经验很少,网上很难找到实践性比较强的资料。而那几本经典书籍里面又过于理论,折腾起来真是生不如死。还好现在过去了那个坎,因此多花一些时间整理自己的思路,帮助其他的小伙伴少踩一些坑。文章的结构如下:

  • 为什么要分层?这个问题被好几个同学质疑过。因此分层的价值还是要说清楚的。
  • 分享一下经典的数据分层模型,以及每一层的数据的作用和如何加工得来。
  • 分享两个数据分层的设计,通过这两个实际的例子来说明每一层该怎么存数据。
  • 给出一些建议,不是***的,但是可以做参考。

你可能感兴趣的:(数据仓库)