为什么企业需要数据仓库?

对于第一次踏入数据仓库领域的同学来说,可能会想,为什么企业需要数据仓库。

一、什么是数据仓库?

数据仓库是一个

    面向主题的(Subject Oriented)、

    集成的(Integrate)、

    相对稳定的(Non-Volatile)、

    反映历史变化(Time Variant)

    的数据集合,它用于支持企业或组织的决策分析处理。

二、为什么需要数据仓库?

我们来举个例子,假设2018年有一家电商公司A,刚刚成立,总共就两三个人,在2022年,该公司经过发展,已经很壮大了,那么该公司的架构的发展历程可能是这样的:

为什么企业需要数据仓库?_第1张图片

那么在2018年这个阶段,A公司的业务量不是特别大,所以公司人员比较少,公司业务也比较单一,那么这个时候,老板更关心的可能是:

  • 今天我卖了多少单?
  • 今天净利润是多少?

这些比较基本的问题,那么在这个时期,由于业务体量小,业务发生过程中产生的数据量也少,其实用传统的关系型数据库,来处理这种简单的分析就就足够了,甚至excel表格就可以比较完美的解决这些问题了。

到了2022年的阶段,公司扩大,业务体量也越来越大,架构体系也更加完善,还有了各个不同的部门,各个部门下面还有部门员工。此时,各个部门关心的问题也不尽相同,但是,公司的终极目标还是要增加营收。这么多的业务量,就会产生很大体量的数据。

此时,老板就会考虑,是否可以基于以往的经验来做未来的决策,那么此时老板关心的问题可能依旧是:

  • 今天我卖了多少单?
  • 今天净利润是多少?

但是对于各个部门来讲,可能关心的问题就有很大的区别,比如采购部就会关心: 

  • 最近半年某个类目销售了多少单?接下来一个月需要采购多少该类目商品才比较合理?

那么,这个时候传统的关系型数据库局限性就体现出来了,因为数据库是针对事务设计的,存放的数据往往只有当前的最新的状态的数据,并且各个业务之间的数据可能并没有考虑到后期需要进行数据分析的场景,且传统数据库提供的大多是行式存储,对于需要进行大规模数据分析和垂直度较高的分析查询语句并没有很好的优化。所以需要进行数据库升级,大多数公司就会将单一的传统数据库升级成为 传统数据库+数据仓库 的形式,传统数据库依旧用来存放事务(OLTP)数据,数据仓库用来存放分析(OLAP)数据。

这么做的好处在于

  • 整合多源数据,使得零散的,孤立的数据可以有效的整合起来,使数据变得有价值,易用
  • 将业务数据和分析数据进行隔离,业务数据的历史变更可以完全记录下来
  • 将历史数据进行分析后可以反哺业务,使得业务开展更加精准,运营活动更加高效

你可能感兴趣的:(数据之路,数据仓库)