《大数据分析-Hive》

Hive是大数据(hadoop)生态系统非常重要的一个工具,它提供了一种类SQL的语言,可以查询存储在Hadoop分布式文件系统(HDFS)中的数据,也可以查询Hadoop数据库(Hbase)中的数据,可以说通过Hive这个数据仓库工具大大降低了开发难度,对于数据分析师来说真的非常友好,只要使用SQL语言的分析师就可以轻松的使用Hive玩转大数据,当然Hive和其他的基于SQL的环境还是有一些差异,所以通过写这一系列文章来帮助数据分析人员学习Hive使用。

下面是学习Hive整体知识框架,我们会从最基本的安装配置到项目实战进行讲解,当然遇到疑惑的问题,一定要学会去思考和解决,你可以去百度,当然也可以和小编一起探讨。

Hive基础知识

Hive安装使用

Hive数据类型与文件格式

Hive数据定义(DDL)

Hive数据操作(DML)

Hive查询

函数

压缩和存储

调优

项目实战

文章最后:

1.Hive官网地址

Apache Hive TM​hive.apache.org

2.Hive文档查看地址

Apache Software Foundation​cwiki.apache.org

3.Hive下载地址

Index of /dist/hive​archive.apache.org

4.github地址

github地址​github.com

你可能感兴趣的:(《大数据分析-Hive》)