数据仓库ER建模

一、概述:

数据仓库之父Bill Inmon提出的数据仓库建模方法是自上而下的,从全企业的高度设计一个符合3NF的数据模型,用实体联系(Entity Relationship,ER)模型描述企业的业务。

 

二、建模步骤:

数据仓库的建模步骤分为以下四个阶段:

数据仓库ER建模_第1张图片

1、业务建模:

数据仓库项目的建设,最初可以围绕一个数据仓库核心项目进行设计,随着时间推移,逐步补充添加更多的项目,最后这个小的数据仓库就会增长为企业级数据仓库,掌控起公司所有的业务数据。

数据建模的首要任务是深刻的理解业务,与业务人员共同梳理业务,并设计出业务流程模型,可以帮助更好的理解业务,。

首先确定一个“集成范围”,“”

业务流程模型(BPM)提供流程层次分解及时序关系,不描述任何实现细节;一个业务流程模型中可以定义多个业务流程图,业务流程图(BPD)表示业务处理过程间的关系,注重处理过程中的数据流程。

举一个简单的例子,客户在网上购买商品的业务流程:

 

数据仓库ER建模_第2张图片

2、概念建模:

概念数据模型(CDM)是对现实世界的一种抽象,即把现实世界抽象为信息世界,把现实世界中客观存在的对象抽象为实体和联系,然后用一种图形化的方式直观的描述出来。概念模型以实体-联系(Entity-Relationship,E-R)理论为基础,可以描述系统的静态特征,动态行为以及完整性约束。

概念数据模型的目标是统一业务概念,作为业务人员和技术人员之间沟通的桥梁,确定不同实体之间的最高层次的关系。

常见的概念数据模型有E-R模型,扩充的E-R模型,面向对象模型,谓词模型等。

步骤:

1、从业务描述中抽取名词,包括隐含的名词。

2、从提取出来的名词中总结业务实体

3、从业务实体中归纳、抽象出一般性的业务概念,比如苹果、梨是水果,核桃是干果,都是果品。

4、设计出概念模型

采购的概念模型如下:

数据仓库ER建模_第3张图片

3、逻辑建模:

逻辑数据模型(Logical Data Model):简称数据模型,这是用户从数据库所看到的模型,是具体的DBMS所支持的数据模型,如网状数据模型(Network Data Model)、 层次数据模型(Hierarchical Data Model)等等。 此模型既要面向用户,又要面向系统 ,主要用于数据库管理系统(DBMS)的实现。

逻辑数据模型 反映的是系统分析设计人员对数据存储的观点,是对概念数据模型进一步的分解和细化。 逻辑数据模型是根据业务规则确定的,关于业务对象、业务对象的数据项及业务对象之间关系的基本蓝图。

逻辑数据模型的 内容包括所有的实体和关系,确定每个实体的属性,定义每个实体的主键,指定实体的外键,需要进行范式化处理。

逻辑数据模型的目标是尽可能详细的描述数据,但并不考虑数据在物理上如何来实现。

逻辑数据建模不仅会影响数据库设计的方向,还间接影响最终数据库的性能和管理。如果在实现逻辑数据模型时投入得足够多,那么在物理数据模型设计时就可以有许多可供选择的方法。

      常见的逻辑数据模型有层次模型,网状模型,关系模型。

 

数据仓库ER建模_第4张图片

4、物理建模:

物理数据模型(PDM)描述了数据在存储介质上的组织结构,与具体数据库管理系统(DBMS)有关。它是在概念数据模型或逻辑数据模型的基础上,考虑各种具体实现因素,进行数据库体系结构设计,真正实现数据在数据库中的表示。目标是为一个给定的概念数据模型或逻辑数据模型选取一个最适合应用要求的物理结构。

物理数据模型是在逻辑数据模型的基础上,考虑各种具体的技术实现因素,进行数据库体系结构设计,真正实现数据在数据库中的存放。

物理数据模型(Physical Data Model):简称物理模型,是面向计算机物理表示的模型,描述了数据在储存介质上的组织结构,它不但与具体的DBMS 有关,而且还与操作系统和硬件有关。每一种逻辑数据模型在实现时都有起对应的物理数据模型。DBMS为了保证其独立性与可移植性,大部分物理数据模型的实 现工作又系统自动完成,而设计者只设计索引、聚集等特殊结构。

 

你可能感兴趣的:(数据仓库,数据仓库,数据库)