传统数据仓库 DW/EDW/BI/ODS/DM/ETL

DW 数据仓库

数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。 为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。

EDW 企业数据仓库

数据仓库(DW)概念的创始人W. H.Inmon对数据仓库下了这样的定义:“数据仓库是一个面向主题的、集成的、非易失的且随时间变化的数据集合,用来支持管理人员的决策。”数据仓库将大量用于事物处理的传统数据库数据进行清理、抽取和转换,使原始数据发生了质的变化,转化为适合分析的导出型数据,并按照决策主题的需要进行重新组织。

BI 商业智能

BI软件是商业智能(Business Intelligence)软件的英文缩写。目前,商业智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。商务智能系统中的数据来自企业其他业务系统。例如商贸型企业,其商务智能系统数据包括业务系统的订单、库存、交易账目、客户和供应商信息等,以及企业所处行业和竞争对手的数据、其他外部环境数据。而这些数据可能来自企业的CRM、SCM、进销存等业务系统。

ODS 操作数据存储

操作数据存储ODS(Operational Data Store)是数据仓库体系结构中的一个可选部分,ODS具备数据仓库的部分特征和OLTP系统的部分特征,它是“面向主题的、集成的、当前或接近当前的、不断变化的”数据。

DM 数据集市

数据集市(Data Mart),也叫数据市场,为满足特定的部门或者用户需求,按照多维的方式进行存储,包括定义维度、需要计算的指标、维度的层次等,生成面向决策分析需求的数据立方体。
数据集市,迎合了专业用户群体的特殊需求,包括分析、内容、表现,以及易用性方面。
数据集市,是企业级数据仓库的一个子集,主要面向部门级业务,只面向某个特定的主题。
数据集市数据来源于企业范围的数据库、专业的数据仓库。

ETL 数据仓库技术

ETL,是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过萃取(extract)、转置(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。

获取—转换【清洗,合并,复制】–加载【事实表,维度表】

维度表,事实表

维度表:【维度】从哲学角度看,人们观察、思考与表述某事物的“思维角度”,简称“维度”。例如,人们观察与思考“月亮”这个事物,可以从月亮的“内容、时间、空间”三个思维角度去描述;也可以从月亮的“载体、能量、信息”三个思维角度去描述。
从时间角度出发,年月日这样去考虑。
事实表:最终需要的数据抽取,由多条数据或者或多表总结汇成一条数据或者一个表组成的。

单独的数据集市架构

传统数据仓库 DW/EDW/BI/ODS/DM/ETL_第1张图片传统数据仓库 DW/EDW/BI/ODS/DM/ETL_第2张图片

传统数据仓库劣势

  1. 不能满足海量数据存储需求
  2. 不能处理不同类型的数据
  3. 计算与处理能力差

你可能感兴趣的:(大数据测试学习)