数据仓库(《数据仓库工具箱:纬度建模权威指南》)

===重要章节(1、2、4、18、19、20、21)

1.数据治理

1.1数仓基本概念

 - 元数据

-纬度表

    描述具体事物信息的记录,例如物品、人员信息、商品信息等

  数据仓库(《数据仓库工具箱:纬度建模权威指南》)_第1张图片

-事实表

   生产、活动产生的记录信息,例如购物记录、旅行记录等(通过外键关联纬度表)

数据仓库(《数据仓库工具箱:纬度建模权威指南》)_第2张图片

-事实表与纬度表区别

  可以通过分析该列是否是一种包含多了个值并且作为计算的参与者的度量,这种为事实;或菏泽该列是对具体指的描述,

是一个常量、某一约束和行标示的参与者,此时属性往往是纬度属性。

 

三种常见的数仓模型

雪花(划分更详细、占用存储)、星型(相较于雪花更常见)、星座模型(事实表共享维表)

数据仓库(《数据仓库工具箱:纬度建模权威指南》)_第3张图片

 

 

数据仓库设计考虑的视图(数据挖掘:概念与技术)

 

  •   自顶向下试图:选择数据仓库所需的相关信息
  •   数据源视图:解释被操作数据库系统手机、存储和管理的信息
  •   数据仓库视图:事实表和维表
  •   商务查询视图:从最终用户家督透视数据仓库中的数据

1.2.纬度建模架构

   通过架构的形式信息的定义了如何处理数据以及逻辑、物理分层模型。展现了从底层数据->etl->数据仓库->数据展现的一个整体流程和架构。

DW/BI架构

数据仓库(《数据仓库工具箱:纬度建模权威指南》)_第4张图片

独立的数据集市架构

数据仓库(《数据仓库工具箱:纬度建模权威指南》)_第5张图片

辐射状企业信息工厂

数据仓库(《数据仓库工具箱:纬度建模权威指南》)_第6张图片

混合架构

数据仓库(《数据仓库工具箱:纬度建模权威指南》)_第7张图片

 

三种数据仓库模型

数据仓库(《数据仓库工具箱:纬度建模权威指南》)_第8张图片

 

 

 

 

 

你可能感兴趣的:(数据库,bigdatanode)