数据仓库工具箱(第3版) ---维度建模权威指南 第一章 数据仓库、商业智能及维度建模初步

数据仓库工具箱(第3版) ---维度建模权威指南  本书共21章
数据仓库和商业智能(Data Warehousing and Business Intelligence,DW/BI)
数据库容量从=的发展: MB-->GB-->TB-->PB
前提:DW/BI系统必须以业务用户的需求来驱动,才能真正从维度角度设计和展现

维度建模是一种主要的DW/BI,受到广泛认可。从业者和学者都认识到数据展现要获得成功,必须建立在简单性的基础之上。【简单性指:使用户方便地理解数据库,使软件能方便的访问数据库的基础性的关键因素。】维度建模时刻考虑如何能提供简单性。维度建模是DW/BI项目成功的关键。


联机分析处理OLAP


第一章 数据仓库、商业智能及维度建模初步
1.1数据获取与数据分析的区别
信息是最重要的财富之一
信息的两个目的:a.操作型最新的状态记录的保存b.分析型决策的制定 简单来说:操作性系统保存数据 DW/BI系统使用数据
优化操作型系统的目的是:使其能够更快地处理事务
操作型系统的特点:一般一次处理一个事务,按部就班,以可预测的方式完成同样的操作型任务,可预测地执行组织的业务过程。
鉴于这种特点,操作型系统通常不必维护历史数据,只需修改数据以反映

DW/BI:研究分析企业的运转,对其性能进行评估。需要详细的数据来支持始终处于变化状态的问题。DW/BI系统一般不会一次只处理一个事务。
优化DW/BI系统是高性能的完成用户的查询。回答用户的查询通常要搜索成千上万条事务,并将查询结果放在一个查询集合中。应对更复杂的问题,DW/BI系统用户通常要求保存历史环境,用于准确地评估组织在一段时间内的性能。

DW/BI地错误观点:DW/BI系统是存储于不同硬件平台上的操作系统的记录的拷贝

1.2数据仓库与商业智能的目标
a.DW/BI系统要能方便地存取信息。内容必须易于理解。对业务用户来说,数据需要直观性。简单描述:简单,快捷。
b.DW/BI系统必须以一致的形式展现信息。DW/BI系统的数据必须是可信的。一致性:意味着DW/BI系统内容的公共标识和定义,可在不同数据源共用。如果两个关于性能质量的参数具有同样的名称,则他们一定是指同一个事情(同名同意性)。反之,如果两个度量参数被用于表示不同的事情,则它们应该具有不同的标记(异意异名性)
c.DW/BI系统必须能够适应变化。设计DW/BI系统时要考虑使其能够方便地处理无法避免的变化,以便在变化发生时仍能处理现有的数据和应用。
d.DW/BI系统必须能够及时展现信息。DW/BI系统主要用于操作型决策。
e.DW/BI系统必须成为保护信息财富的安全壁垒。保存在数据仓库中的信息是组织的信息化财富。DW/BI必须能有效控制对组织中机密信息的访问。
f.DW/BI系统必须成为提高决策制定能力的权威和可信的基础。数据仓库需要正确的信息以支持决策制定。DW/BI系统最重要的输出是基于分析证据所产生的决策。这些决策体现了数据仓库的影响和价值。早期用于表示DW/BI系统的称谓---决策支持系统。
g.DW/BI系统成功的标志是业务群体接受DW/BI系统。

为适应DW/BI的独特需求,需要一整套的技能。这些技能既包括数据库管理的技能,也包括商业分析师的技能,才能更好地适应DW/BI的商业盛筵。


1.3维度建模简介
维度建模:是展现分析数据的首选技术.这一观点被广泛接受的主要两个需求:a.以商业用户可理解的方式发布数据.b.提供高效的查询性能.

维度建模并不是一种新技术,早期主要用于简化数据库.50多年来,经过大量案例的考验,IT组织,行业顾问和商业用户自然而然地被这种以单一维度结构满足人们基本需求的简单性所吸引.简单性至关重要,因为它能够确保用户方便地理解数据,以及确保软件能够快速,有效地的发现及发布结果.

假设某个业务经理描述其业务为"我们在各种各样的市场销售产品,并不断地对我们的表现进行度量." 维度设计者通过倾听和分析,知道其业务强调的是产品,市场,时间.多数人发现其业务包含三维数据,即将其业务数据标识为产品,市场和时间.

从简单的数据模型开始是保持设计简单性的基础.如果从复杂的数据模型起步,那么最终会导致模型过度复杂,从而导致查询性能低下,最终使得商业用户反感.
爱因斯坦曾经说过"凡事应该尽量简单,直到不能再简单为止."

维度模型通常应用在关系数据库管理系统之上,但并不要求维度模型必须满足第3范式(3NF).数据库中强调的3NF主要是为消除冗余.

业界称3NF模型为实体-关系模型.实体关系图(ER图或ERD)表示表间的交互关系.3NF模型及维度模型都可用ERD表示.都包含可连接的关系图.主要差别在于规范化程度. 两种模型都可以用ERD表示.我们强调不要将ER模型当成3NF模型,将3NF模型称为规范化模型以消除混淆.

规范化的3NF模型主要应用于操作性过程中,对事务的更新与插入仅触及数据库的单一地方.
BI查询,规范化模型太复杂.用户难以理解,检索,难以记住复杂网络的模型(例洛杉矶地铁系统).且多数关系数据库管理系统不能有效的查询规范化模型,用户查询难以预测的复杂性将耗尽数据库优化器,产生灾难性的查询性能.

DW/BI展现系统时使用规范化建模方法难以满足对数据的高性能检索需求.

维度建模解决了模式过分复杂的问题.

注:维度模型包含的信息与规范化模型包含的信息相同,但将数据以一种用户可理解的,满足查询性能要求的,灵活多变的方式进行了包装.

第二章 Kimball维度建模技术概述

第三章 零售业务

第四章 库存

第五章 采购

第六章 订单管理

第七章 会计

第八章 客户关系管理

第九章 人力资源管理

第十章 金融业务

第十一章 电信

第十二章 交通运输

第十三章 教育

第十四章 医疗卫生

第十五章 电子商务

第十六章 保险业务

第十七章 Kimball DW/BI生命周期概述

第十八章 维度建模过程与任务

第十九章 ETL子系统与技术

第二十章 ETL系统设计与开发过程和任务

第二十一章 大数据分析


 

你可能感兴趣的:(数据仓库工具箱(第3版) ---维度建模权威指南 第一章 数据仓库、商业智能及维度建模初步)