001.hive数据仓库介绍和应用场景

1.基本概念:

数据仓库是:
一个面向主题、集成的、时变的、非易失的数据集合;支持管理者的决策过程

2.应用场景

1.海量的数据存储
2.ETL
(数据分层:将底层概念映射到更一般的较高层概念->多个城市映射到国家)
3.多维分析
(上钻:从城市纬度抽象到国家纬度进行分析的过程/下钻:与上钻正好相反)
4.分析决策/数据挖掘

001.hive数据仓库介绍和应用场景_第1张图片

你可能感兴趣的:(001.hive数据仓库介绍和应用场景)