数据仓库Hive的使用

数据仓库Hive的使用

  • 一、试验目的要求
  • 二、试验环境
  • 三、试验内容
    • 任务一 启动hadoop集群
    • 任务二 启动Hive,查看当前的数据库列表
    • 任务三 Hive的数据模型---分区表
    • 任务四 Hive的数据模型---桶表
    • 任务五 Hive的数据模型---视图
  • 四、体会心得

一、试验目的要求

【实验目的】

  1. 掌握数据仓库Hive的使用。
  2. 掌握数据仓库工具Hive的使用。
    【实验要求】
  3. 掌握数据仓库Hive的使用。
  4. 能够正常操作数据库,表,数据。

二、试验环境

  1. 五台独立PC机或虚拟机
  2. 主机之间有有效的网络连接
  3. 已安装CentOS 7.4操作系统
  4. 所有主机已完成网络属性配置

三、试验内容

任务一 启动hadoop集群

数据仓库Hive的使用_第1张图片
数据仓库Hive的使用_第2张图片
数据仓库Hive的使用_第3张图片
数据仓库Hive的使用_第4张图片
数据仓库Hive的使用_第5张图片

任务二 启动Hive,查看当前的数据库列表

数据仓库Hive的使用_第6张图片
数据仓库Hive的使用_第7张图片
数据仓库Hive的使用_第8张图片
练习

数据仓库Hive的使用_第9张图片
数据仓库Hive的使用_第10张图片

数据仓库Hive的使用_第11张图片
数据仓库Hive的使用_第12张图片
数据仓库Hive的使用_第13张图片
在这里插入图片描述

任务三 Hive的数据模型—分区表

数据仓库Hive的使用_第14张图片
在这里插入图片描述
数据仓库Hive的使用_第15张图片
在这里插入图片描述
数据仓库Hive的使用_第16张图片
在这里插入图片描述
数据仓库Hive的使用_第17张图片
数据仓库Hive的使用_第18张图片
数据仓库Hive的使用_第19张图片
登录http://192.168.10.111;8080/cluster/apps查看job执行状态
数据仓库Hive的使用_第20张图片
(1)准备数据,在admin家目录下分别新建
student1.txt
数据仓库Hive的使用_第21张图片
student2.txt

数据仓库Hive的使用_第22张图片
student3.txt
数据仓库Hive的使用_第23张图片
在这里插入图片描述
数据仓库Hive的使用_第24张图片
将文件放入HDFS文件系统
数据仓库Hive的使用_第25张图片
数据仓库Hive的使用_第26张图片
(2)创建外部表
在这里插入图片描述
(3)查询外部表
在这里插入图片描述
(4)删除HDFS上的student1.txt

在这里插入图片描述
(5)查询外部表
数据仓库Hive的使用_第27张图片
(6)将student1.txt重新放入HDFS input目录下
在这里插入图片描述
(7)查询外部表
数据仓库Hive的使用_第28张图片

任务四 Hive的数据模型—桶表

对数据HASH运算,房子啊不同文件中,降低热块,提高查询速度
数据仓库Hive的使用_第29张图片
准备文本数据
在这里插入图片描述
数据仓库Hive的使用_第30张图片
将文本数据插入到非桶数据表
数据仓库Hive的使用_第31张图片
在这里插入图片描述
数据仓库Hive的使用_第32张图片
在这里插入图片描述
在这里插入图片描述
数据仓库Hive的使用_第33张图片

任务五 Hive的数据模型—视图

数据仓库Hive的使用_第34张图片
数据仓库Hive的使用_第35张图片
在这里插入图片描述
数据仓库Hive的使用_第36张图片
数据仓库Hive的使用_第37张图片
创建一个view之前,用explain查看创建view
数据仓库Hive的使用_第38张图片
实际创建一个view
数据仓库Hive的使用_第39张图片
在这里插入图片描述
数据仓库Hive的使用_第40张图片
数据仓库Hive的使用_第41张图片
数据仓库Hive的使用_第42张图片

四、体会心得

1.在实验前一定要将课堂上所学的理论知识吃透,这是做实验的基础。否则在后续的实验过程中会增加难度,浪费时间。在老师讲解时就会听不懂,这将使我们在做实验时的难度加大,浪费做实验的宝贵时间。如果不清楚,在做实验时才去摸索,这将使你极大地浪费时间,使你事倍功半。
2.实验过程中,尽量减少操作的盲目性,清楚每做一步都是在做什么,为什么做, 当然,这也是在清楚实验原理与实验目的的基础之上的。每一步都要认真细心,配置正确,以免由于粗心大意配置错误导致后面的实验不能继续进行,而返回来重新配置浪费时间;
3.实验中出现问题时,保持冷静,不要自乱阵脚,先分析出现错误的原因,先自己解决问题;若没有解决思路,可以通过上网查询或者向同学请教;实在没有办法,还可以向老师求助;
通过这次实验,使我不但对之前所学的理论知识有了更深刻的理解和加深,而且对于动手动脑能力也有了提高,而且也学习了一定的问题处理方法和面对问题的态度,这次实验使我收获颇深!

你可能感兴趣的:(云存储,云应用,数据仓库,hive,hadoop)