Hive基本操作

hive简单认识

Hive是建立在HDFS之上的数据仓库,所以Hive的数据全部存储在HDFS上。

Hive的数据分为两部分,一部分是存在HDFS上的具体数据,一部分是描述这些具体数据的元数据信息,一般Hive的元数据存在MySQL上。

Hive是类SQL语法的数据查询、计算、分析工具,执行引擎默认的是MapReduce,可以设置为Spark、Tez。

Hive分内部表和外部表,外部表在建表的同时指定一个指向实际数据的路径(LOCATION),Hive 创建内部表时,会将数据移动到数据仓库指向的路径;若创建外部表,仅记录数据所在的路径,不对数据的位置做任何改变。在删除表的时候,内部表的元数据和数 据会被一起删除,而外部表只删除元数据,不删除数据。

1.进入hive命令行

$cd  $HIVE_HOME
bin

2、创建数据库

hive> create  database  IF NOT EXISTS  test  COMMENT '测试数据库'  LOCATION '/ruozedata' WITH DBPROPERTIES ('creater'='liuzd','date'='20180605')
IF NOT EXISTS:如果不存在则创建

COMMENT:添加注释

LOCATION:指定hdfs存放路径

WITH DBPROPERTIES:添加自定义属性

3、查询数据库信息

hive> desc database  extended test;

在这里插入图片描述

4、删除数据库

hive> drop database test CASCADE;

5、修改数据库

hive> alter database test set location '/ruozedata';

6、数据库切换

hive> use test;

7、常用数据类型

int:整型 

bigint:长整型

float:浮点型

double:双精度

string:字符串

8.创建表

hive> CREATE EXTERNAL TABLE ruozedata_person

    > (id int comment 'this is id', name string comment 'this id name' )

    > comment 'this is ruozedata_person'

    > ROW FORMAT DELIMITED

    > FIELDS TERMINATED BY '\t'

  > location  '/user/hive/warehouse/test.db/emp';

EXTERNAL:创建外部表的关键字,默认是内部表

comment:添加注释,跟在字段后就是字段的注释,跟在表后就是表的注释

ROW FORMAT DELIMITED  FIELDS TERMINATED BY '\t':指定加载数据的列分隔符为制表符

location:指定表数据存放路径

select方式创建表,可以顺带复制数据

hive> create table emp2 as select * from emp;

9、查看表结构

hive> desc formatted ruozedata_person;

10、修改表

hive> alter table ruozedata_person rename to person;

hive> show tables

你可能感兴趣的:(hive,big,data,mysql)