ETL-从1学到100(1/100):ETL涉及到的名词解释

本文章主要介绍ETL和大数据中涉及到名词,同时解释这些名词的含义。由于不是一次性收集这些名词,所以这篇文章将会持续更新,更新日志会存放在本段话下面:

12-19更新:OLTP、OLAP、BI、ETL。

12-20更新:ELT、EII

1. OLTP

中文称呼:在线事务处理系统。

主要功能:对数据进行增删改查,特性是事物的吞吐量。面向的业务主要涉及到的是常用的软件信息存储等等。

2. OLAP

中文称呼:联机分析处理系统。

主要功能:偏向于数据的查询,特性是查询效率。面向的主要是决策分析,关键数据提取汇总等等。

3. BI

中文称呼:商业智能(常常听见过BI报表开发有没有?)

主要功能:使用ETL清洗数据,整合数据仓库,提取数据,完成数据的展现,打破信息壁垒。换个角度来说,BI更像是ETL+数仓+其他技术的一个综合体。

4. ETL

中文称呼:数据清洗(E:抽取+T:转换+L:加载)

主要功能:将数据从OLTP系统中转移到数据仓库中的一系列操作的集合。

5. ELT

中文称呼:抽取、加载、转换

主要功能:ELT与ETL还是有所不同的,所以我在这里还是要记录一下ELT,它的主要功能是:数据首先从源数据进行抽取和加载(ETL是先抽取再转换),再转换成需要的格式,这样做的好处在于,把高吞吐的工作交给数据库来做,减轻高吞吐负担。

6.EII

中文称呼:虚拟数据整合

主要功能:EII目前基本上很少有人用了,EII的侧重点在于对用户的数据展示上,数据的加载转换不是它所注意的。

你可能感兴趣的:(ETL大数据专栏,etl,数据仓库)