数据挖掘导论(学习笔记)――2.3数据仓库构建

2.3数据仓库构建

整个数据仓库系统由数据源、数据存储与管理、OLAP服务器、前端工具等组成。


数据仓库系统前端工具包括各种报表、查询、数据分析工具、数据挖掘工具以及各种基于数据仓库或数据集市的应用开发工具。其中,数据分析工具主要针对OLAP服务器,报表工具、数据挖掘工具主要针对数据仓库。


ETL,是指数据抽取(Extract)、转换(Transform)、清洗(Cleaning)、装载(Load)的过程。


在数据仓库的开发过程中,采用的数据模型主要有概念模型、逻辑模型、物理模型、元数据模型、数据粒度和聚集模型。


数据仓库的建设是按照相关业务主题组织和存储海量数据的过程。数据仓库的建立路线主要有如下三种模式:自顶向下、自底向上、平行开发。


数据仓库的建设通常包括确定范围、环境评估、分析、设计、开发、测试和运行等几个步骤。


你可能感兴趣的:(仓库构建,数据挖掘导论)