数仓--Theory--对OLAP的理解及分析方法

OLAP概述

  • OLAP(联机分析处理)是针对特定问题的联机数据访问和分析。通过对信息(维数据)的多种可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察。
  • OLAP技术主要通过多维的方式来对数据进行分析、查询和生成报表,它不同于传统的OLTP处理应用。OLTP应用主要是用来完成用户的事务处理,如民航订票系统和银行的储蓄系统等,通常要进行大量的更新操作,同时对响应的时间要求比较高。而OLAP系统的应用主要是对用户当前的及历史数据进行分析,扶助领导决策,其典型的应拥有对银行信用卡风险的分析与预测和公司市场营销策略的制定等,主要是进行大量的查询操作,亦有快速响应的机制要求;

OLAP多维分析方法

  • 多维分析可以对以多维形式组织起来的数据进行上卷(Roll Up)、下钻(Drill Down)、切片(Slice)、切块(Dice)、转轴(pivot or rotate)等各种分析操作,以便剖析数据,使分析者、决策者能从多个角度、多个侧面观察数据库中的数据,从而深入理解包含在数据中的信息和内涵。
    多维数据分析通常包括以下几种分析方法:


    OLAP数据立方体.PNG

上卷(Roll Up)

  • 上卷(Roll Up)实在数据立方体中执行聚集操作,通过再维级别上升或通过消除某个或某些维来观察更概括的数据。例如:如果将图3-1中的数据立方体沿着时间维的层次上卷,由"季度"上升到"半年",则得到下图所示的立方体:


    数据立方体上卷.PNG
  • 从图3-2中可以看出,贷款金额不再是按照"季度"分组求值,而是按照"半年"分组求值了。通过这样的操作,决策人员能方便的查看数据立方体中更概括的统计数据,便于掌握经济活动的整体动态。
  • 上卷的另一种情况使通过消除一个或多个维来观察更加概括的数据。例如图3-3所示的二维立方体就是通过将图3-1所示的三维立方体中消除了"经济性质"维后得到的结果,这里将所有经济性质的企业的贷款金额累加到了一起。


    上卷消除维度.PNG

下钻(Drill Down)

  • 下钻(Drill Down)是通过在维级别中下降或通过引入某个或某些维来更细致地观察数据。例如,对图3-1所示的数据立方体经过沿时间维进行下钻,将第一季度下降到月,就得到了如图3-4所示的立方体。
  • 从图3-4中可以看出,时间维度的第一季度细化为1月,2月,3月,其贷款金额也随之按照"月份"分组求值。通过这样的下钻操作,决策人员能查看立方体中更加详细的统计数据,便于了解经济活动中的某个细节。
  • 同样,下钻也存在于另外一种形式,即通过添加某个或者某些维来实现,例如在图3-3所示的二维立方体中重新添加"经济性质"维度,那么该立方体又重新回到了图3-1所示的立方体形式。


切片(Slice)

  • 在给定的数据立方体的一个维上进行的选择操作就是切片(Slice),切片的结果是得到了一个二维的平面数据。例如,对图3-1的数据立方体,使用条件:时间=1季度进行选择,就相当于在原来的数据立方体切出一块来。结果如图3-5所示:

切块(Dice)

  • 在给定的数据立方体的两个或者多个维上进行选择操作就是切块(Dice),切块的结果就是得到了一个子立方体。例如对图3-1所示的数据立方体使用条件:(度量值="正常" or "次级" and 时间="1季度"or"2季度" and 经济性质="集体"or"个人"or"其他")进行选择,就相当于在原立方体中切除一小块,如图3-6所示:


转轴(Pivot or Rotate)

  • 转轴就是改变维的方向,例如图3-1中立方体按照"时间" 和"经济性质"两个轴交换位置,得到图3-7图形:


    转轴.PNG

你可能感兴趣的:(数仓--Theory--对OLAP的理解及分析方法)