大数据开发hive数据库常用命令汇总

在大数据学习当中,尤其是Hadoop生态的学习当中,Hive是必备的,也是相对门槛较低,比较好入手的一个组件。今天的大数据开发分享,和大家分享Hive的基础知识点。

Hive简介
根据官方文档的定义,Hive是一种用类SQL语句来协助读写、管理那些存储在分布式存储系统上大数据集的数据仓库软件

1、进入hive数据库:

hive

2、查看hive中的所有数据库:

show databases;

3、用default数据库:

use default;

4、查看所有的表:

show tables;

5、查询表结构:

desc table_name(表名);

6、查询表数据:

select * from table_name(表名);

7、创建数据库:

hive> create schema shop_db;

8、验证数据库表:

hive> show databases;

9、删除数据库:

hive> drop database if exists shop_db;
drop schema shop_db;

全部删除相应的表在删除数据库之前:

hive> drop dataBASE if exists shop_db cascade;

10、创建表tb_employee

hive> create table if not exists tb_employee (id int,name string,salary string,destination string)
> comment '员工信息详情表'> row format DELIMITED
> fields terminated by '\t'> lines terminated by '\n'> stored as textfile;

如果增加分区必须在创建表的时候就创建分区,不然就会报错,创建分区的命令>partition by ‘根据哪个字段分区’,

hive> create table tb_employee (id int, name string, dept string)
> PARTITIONED BY (year int)
> row format delimited
> fields terminated by '\t'
> lines terminated by '\n'
> stored as textfile;

stored as textfile文件格式,文件格式在hive中有三种: textfile、Sequencefile、Rcfile。

11、添加数据到表中

hive> load data local inpath '/usr/hadoop/hive/employee.txt' overwrite into table tb_employee;

如果table是个分区表则必须在hql中指定分区

hive> load data local inpath '/usr/hadoop/hive/employee.txt' overwrite into table tb_employee partition(year=2022);

load data:加载数据;

local:本地数据

inpath:文件的地址

overwrite:覆盖表中的数据,注意加overwrite是重写表的数据,不加是追加数据

插入表数据:insert into tb_employee(id,name) values (1,'洪生鹏');hive只支持插入不支持修改和删除

12、重命名表名:

hive> alter table tb_employee rename to emp;

13、修改tb_employee表中字段name为user_name:

hive> alter table tb_employee change name user_name string;

14、修改tb_employee表中字段salary的数据类型从float改为double:

hive> alter table tb_employee change salary salary double;

15、删除表

hive> drop table table_name;

16、创建视图

hive> create view employee_view as select * from tb_employee where salary>3000;

17、不同类型的连接 join 、left outer join 、right outer join 、full outer join

18、创建外部表:用external关键字

hive> create external table outside_table_name(name string comment '姓名',addr string comment '地址');

19、查询表信息:

desc formatted outside_table_name;

关于大数据开发,Hive基础知识点是必须要掌握的。

唐山徐敏被捕,事件再次反转,“保护伞”要现形了?

你可能感兴趣的:(数据仓库,数据库,hive,mysql,大数据)