hive基本操作(未完)

保证Hadoop集群搭建成功,MySQL安装部署完成,配置相应的环境变量

我这里已经配置环境变量,直接启动就可以

集群群启脚本:

启动hive:

启动后选择的时默认数据库,可以看到我这里有几张表

通过本地文件的数据查看,创建表并导入数据

建表:

查看表结构

本地导入数据(如果从hdfs导入数据,那么就去掉local即可):

分析:

(1)load data:表示加载数据

(2)local:表示从本地加载数据到hive表(复制);否则从HDFS加载数据到hive表(移动)

(3)inpath:表示加载数据的路径

(4)overwrite into:表示覆盖表中已有数据,否则表示追加 (这里没演示)

(5)into table:表示加载到哪张表

(6)tuser:表示具体的表

查看表:

根据查询语句中创建表并加载数据(这里会执行mr程序)

查看:

准备数据:员工表

部门表:

部门信息表:

获取每个部门最高薪资:

自定义函数:

打包上传,add jar:

创建临时函数:

执行查询,对比,可见把名字变小写:

你可能感兴趣的:(hive基本操作(未完))