HIVE 初窥门径

**数据仓库:**是一个很大的数据集存储集合;一般针对某些主题的历史数据进行分析,支持管理决策,有成为联机分析处理。
**数据库:**面向的是交易的处理系统,它是针对具体业务在数据库练级的日常操作,通常对记录进行查询,修改。用户较为关心的是操作的响应时间,数据安全性、并发支持的用户数等问题。传统的数据库系统作为数据管理的主要手段,主要用于操作型处理,也被成为联机事物处理<极致流畅的交互,低延迟的数据处理,处理过程的安全性,状态的最终一致性>。
数据仓库与数据哭的区别:
数据库面向事物设计,数据仓库面向主题设计的。
数据库一男存储业务数据,数据仓库存储的一般是历史数据
数据库是为捕获数据而设计了,数据仓库是为分析数据而设计的。
数据仓库,是在数据库已经大量存在的情况下,为了进一步挖掘数据资源,为了决策需要而产生的,它不是所谓的“大型数据库”。
数据仓库分层:按照数据的流入流出的过程,数据仓库架构可分为三层-----数据源(ODS直接接入的原始数据)、数据仓库(DW:存储加工后的数据),数据应用(APP)

你可能感兴趣的:(hive,zeppelin集成)