大数据平台Hive四天入门学习指南

hive是基于Hadoop的由Facebook公司开发并开源的一个大数据仓库工具,它以SQL语法来操作Hadoop集群,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可有效帮助懂数据库但不懂Hadoop(Mapreduce)的同学快速使用大数据统计。 

对很多参加过云点惠众学习大数据学员来说,HIVE课程是比较基础,并且比较容易使用与介绍,开设过多期HIVE课程,这里提供一下Hive入门学习指南,帮助有一定Linux、数据库、Hadoop基础的学员尽快入门并掌握Hive。,

Hive课主要讲述的内容包括:

(1)HIVE基本介绍。重点介绍大数据平台基本架构、数据仓库、HIVE的起源、HIVE组成、体系结构、与HDFS、MapReduce的关系,与PIG、关系型数据库、HBase等平台的差异。需要约半天时间。

(2)HIVE安装与部署。以HIVE-0.12版本为基础,进行了Hive的安装、部署与测试,本次课约半天时间。

(3)HIVE的基础操作。重点介绍了HIVE数据库的创建与删除、几种类型的表(内部表、外部表、分区表)、表的基本操作,如:创建、数据导入、表查询、表删除。本次课约一天时间。

(4)HIVE的高级操作。重点介绍了HIVE安全、优化、存储类型、高级功能查询、函数查询、数据分析等。本次课约一天时间。

(5)HIVE的编程。以JAVA的JDBC为例,介绍了HIVE的JAVA编程框架、基础语法,并介绍Hive三种函数编程框架。最后包括二个小时的整体答疑。本次课约一天时间。

按照上述方法通过四天的学习,基本上能够理解HIVE的作用,组成。具备搭建HIVE平台的能力。同时能够进行的数据库、表、数据、分析等的操作。基本实现Hive的入门。

 

你可能感兴趣的:(互联网,大数据,人工智能)