【数仓】什么是数仓,什么是OLTP,什么是OLAP

一、 数仓是什么,为什么需要数仓

个人理解,数仓和数据库都是组织数据的方法论,数仓和数据库(关系型数据库)处理的问题不同,所以当面对数据库不那么适合处理的问题时,就出现了数仓 。

数仓具有如下特点:

  1. 数据组织应用的方法论
  2. 按照主题进行组织 (主题是相对应用而言的)
  3. 对数据库进行抽取和清理
  4. 主要是进行数据查询

【数仓】什么是数仓,什么是OLTP,什么是OLAP_第1张图片

二、数仓 vs 关系型数据库 Mysql —— 即 OLTP 和 OLAP

首先,要想理解理解两者的区别,我们先要理解范式的概念,范式是构造数据库的规则。范式一共具有以下几种:

【数仓】什么是数仓,什么是OLTP,什么是OLAP_第2张图片

对关系型数据库 Mysql 来说,我们设计数据库时需要满足三大范式。那我们顺势就可以想到,这样设计出的数据库肯定具有数据冗余低,表数量多等特点 。这样的数据处理存储方式就被称为 —— OLTP 联机事务处理 。

而对数仓来说,数仓的数据设计采用维度建模的方法,这样的设计决定了数仓具有 数据冗余量大,面向业务的特点,这种数据处理方式就被称为 —— OLAP 联机分析处理 。

参考文章:

本文参考自博主 浪尖聊大数据-浪尖的数仓简介好文,欢迎大家多去原作者处点赞支持 ~

你可能感兴趣的:(大数据)