数据仓库开发札记(二) - 数据仓库

//
数据仓库开发札记(二) - 数据仓库
http://www.myexception.cn/data-warehouse/701348.html
数据仓库开发的流程是确定 用户需求——>设计和建立数据库——>提取和加载数据 ,
其中设计和建立数据库步骤中分为:
确定事实表和维度表
设计事实表
设计维度表
实现数据库设计
而提取和加载数据分为:
校验数据
迁移数据
数据净化
转换数据
因此当我们有建立数据仓库的需求时候,首先按照需求设计数据仓库的模型,然后根据设计好的模型对原有数据库进行ETL处理。

Pentaho根据整个流程整合需要的工具。BI Server是整个BI套件的门户,用来整合各种资源。其他的组件通过publish操作将定义好的模型信息发布到平台上,平台会自动读取这些信息更新自身的数据源等。Design Studio是支持Action Sequence图形化开发的工具,可以定义一序列操作来完成整个BI过程。Pentaho Metadata元数据管理借助于图形化对元数据建模。Kettle ETL主要对源数据库数据进行转换抽取加载等工作。Mondrian OLAP是针对多维分析提供的引擎。Weka是进行数据挖掘工具。Pentaho Reporting工具用来设计报表。Pentaho Dashboard支持仪表盘的开发。

数据仓库开发札记(二) - 数据仓库_第1张图片
Paste_Image.png

你可能感兴趣的:(数据仓库开发札记(二) - 数据仓库)