(笔记)数据仓库工具箱:维度建模的完全指南--总线结构

    在数据仓库领域,有一种构建数据仓库的架构,叫Multidimensional ArchiteMD),即多维体系结构,也叫“总线结构”(Bus Architecture)。多维体系结构的创始人是数据仓库领域最有实践经验的Kimball博士。

    在kimball的维度建模的数据仓库中,关于多维体系结构有三个关键性概念:总线架构(Bus Architecture),一致性维度(Conformed Dimension)和一致性事实(ConformedFact)。

 

    下面主要介绍总线结构。

 

         数据仓库的构建,不是一个步骤就可以建成的,也不可以将它分成孤立的片段进行建造,要使数据仓库能够长期的成功运转,很需要有一种在体系结构上可以按增量方式建造企业数据仓库的方法,这里介绍一种方法是:数据仓库总线结构。

 

    总线:最初是电力行业的一个旧术语。它是一种公用结构,每个装置都与它连接,并通过它获取电力。计算机上硬件和软件也都有总线概念,正是有了总线标准,计算机的外设才能够在一起工作并且有效地共存,即使它们是在不同时间由不同厂家制作的也可以。


    数据仓库总线结构提供了一种可以用于分解企业数据仓库规划任务的合理方法。在体系结构确立阶段的较短时间内,开发团队设计出一整套在企业范围内具有统一解释的标准化维度与事实。这样,数据体系结构的框架就建立起来了。然后,开发团队可以全力以赴的去实现严格依照体系结构进行迭代开发的独立数据中心。随着独立数据中心的使用,它们像积木块一样搭在了一起。一般来说,需要有足够的数据中心才可能为集成的企业数据仓库带来美好的前景。通过数据仓库环境定义标准的总线接口,独立的数据中心就可以由不同的小组在不同的时间进行实现,只要遵循这个标准,独立的数据中心就可以插入到一起并有效地共存。

 

    多维体系结构主要包括后台(Back Room)和前台(Front Room)两部分。后台也称为数据准备区(Staging Area),是MD架构的最为核心的部件。在后台,是一致性维度的产生、保存和分发的场所。同时,代理键也在后台产生。 前台是MD架构对外的接口,包括两种主要的数据集市,一种是原子数据集市,另一种是聚集数据集市。原子数据集市保存着最低粒度的细节数据,数据以星型结构来进行数据存储。聚集数据集市的粒度通常比原子数据集市要高,和原子数据集市一样,聚集数据集市也是以星型结构来进行数据存储。前台还包括像查询管理、活动监控等为了提供数据仓库的性能和质量的服务。 

    在多维体系结构中,所有的这些基于星型机构来建立的数据集市可以在物理上存在于一个数据库实例中,也可以分散在不同的机器上,而所有这些数据集市的集合组成的分布式的数据仓库。

 

   个人总结:数据总线结构,实际上就是首先定义出一整套在企业范围内具有统一解释的标准化维度与事实,建立起数据体系结构的框架,然后根据框架进行插拔开发。

你可能感兴趣的:(数据库)