【理论】数据仓库中的名词解释

本篇记录《数据仓库》学科中的常用名字,十条基本概念。涉及到常规理论型,以及新型云计算领域。
一 DSS
分析型应用,区别与操作型应用
DSS对数据集成的迫切需要是数据仓库技术出现的最重要原因。

在操作型环境中直接构建分析型应用是一种失败的。我们在应层开发的软件系统使用的数据库绝大多数属于操作性数据库。
需要将分析型处理数据和操作型处理数据分离

【理论】数据仓库中的名词解释_第1张图片
ONAP.png

二 数据仓库
数据仓库简称DW,就是一个用以更好地支持企业或组织的决策分析处理的、面向主题的、集成的、不可更新的、随时间不断变化的数据集合。

数据仓库的目的是支持决策,面向企业高层管理人员

三分类
分类属于监督学习;
这些类别是已知的,通过对已知分类的数据进行训练和学习,找到这些不同类的特征,再对未分类的数据进行分类。

四聚类分析
聚类分析是描述建模的典型例子,而描述建模是数据挖掘任务之一。

【理论】数据仓库中的名词解释_第2张图片
数据挖掘任务.png

聚类属于无监督学习;
压根不知道数据会分为几类(研究人员可以指定聚类数),通过聚类分析将数据聚合成几个群体;聚类的目的是使得属于同类别的对象之间的差别尽可能的小,而不同类别上的对象的差别尽可能的大

五 数据集市
小型数据仓库,面向部门级的应用,通常有较少的主题域.

六主题域
一个完备的分析领域
6.1独立性: 主题域必须具有独立内涵,要求有明确的界限,规定某项数据是否该属于“商品”主题。
6.2完备性: 主题内包含任何对该主题对象的分析处理要求的一切内容

七元数据
元数据指整个数据仓库的描述性信息

八数据仓库体系 结构
数据仓库体系结构包括数据源,集成工具,数据仓库和数据仓库服务器,OLAP服务器,元数据与元数据管理工具,数据集市,前台分拆工具等组成。

九维的构成:维成员,维层,维层次,维属性
维是人们观察数据的特定角度,是某个事物的属性。维是商业活动中的一个基本要素。每个维都有一个唯一的名字。
维成员:维由一些维成员构成。维的一个取值称为维的一个成员。每个成员有一个名字。
维层:不同的细节程度称为不同的维层
维层次:维层是一种分类方法。把每种分类方法叫做一个层次。
维属性:说明为成员所具有的特征。

十 多维数据模型是最流行的数据仓库的数据模型,多维数据模型最典型的数据模式包括星型模式、雪花模式和事实星座模式。

【理论】数据仓库中的名词解释_第3张图片
星系模型.jpg
【理论】数据仓库中的名词解释_第4张图片
星型模型.jpg
【理论】数据仓库中的名词解释_第5张图片
雪花模型.jpg

参考文档
https://mp.weixin.qq.com/s/ipftVliUPFYfGRAHNsQKMw
置信度和可信度
https://zhuanlan.zhihu.com/p/26578568
数据仓库多维数据模型设计
https://yq.aliyun.com/articles/30942

你可能感兴趣的:(【理论】数据仓库中的名词解释)