数据仓库与数据挖掘

侵删致谢,来自浙江工业大学老师的PPT。✿✿ヽ(°▽°)ノ✿

 定义1-1数据仓库(Data WarehouseDW)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的,支持管理决策(Decision Making Support)的数据集合

 定义1-2数据仓库是一个面向主题的、集成的、不可修改的、随时间变化的,支持管理决策的数据集合。

    数据仓库是一个特殊的数据库,其特殊性体现在它的数据具有面向主题、集成、不可修改和随时间变化等4个特征,其目的是支持企业的管理决策而不是支持事务管理。

定义 1-3 主题 是宏观决策问题的一个分析对象,它由决策分析问题的要求来确定,并用一个在较高管理层次上的综合数据集合来描述。
(1) 从信息管理的角度看,主题是在一个较高管理层次上对数据库系统中数据,按照具体的管理要求重新综合、归类的分析对象。
(2) 从数据组织的角度看,主题就是一个数据集合,这些数据对分析对象进行了比较完整、一致的描述,不仅描述了数据自身,还描述了数据之间的关系。
定义 1-4 主题 是一个在较高管理层次上描述决策分析问题的综合数据集合。
定义 1-5 数据仓库管理系统 (Data Warehouse Manage- ment System ,简称 DWMS) 是位于用户与操作系统 (OS) 之间的一层数据分析管理软件,负责对数据仓库数据进行统一更新、管理和使用控制,为用户和应用程序提供访问数据仓库的方法或接口软件的集合。
定义 1-6 数据仓库系统 (Data Warehouse System ,简称 DWS) 是计算机系统、 DW DWMS 、应用软件、数据库管理员和用户的集合。
•数据仓库系统一般由硬件、软件(包括开发工具)、数据仓库、数据仓库管理员等构成。
定义 1-7 知识发现 (KDD) 就是采用有效算法从大量的、不完全的、有噪声的、模糊和随机的数据中识别出有效的、新颖的、潜在有用乃至最终可理解的模式 (Patterns) 的非平凡过程。

定义2-1 A (维度1,维度2,…,维度n;变量1,…,变量k) 是一个名称为An维数组,也称An维超立方体(Hypercube)多维数据模型(多维模型)

多维数据模型通常用于描述决策分析的一个主题框架。

 

 

你可能感兴趣的:(数据仓库与数据挖掘)