Hive-DDL数据定义

1、创建数据库

1)创建一个数据库,数据库在 HDFS 上的默认存储路径是/user/hive/warehouse/*.db。

2)创建一个数据库,指定数据库在 HDFS 上存放的位置。

2、修改数据库

用户可以使用 ALTER DATABASE 命令为某个数据库的 DBPROPERTIES 设置键-值对 属性值,来描述这个数据库的属性信息。数据库的其他元数据信息都是不可更改的,包括数 据库名和数据库所在的目录位置。

3、查询数据库

Hive-DDL数据定义_第1张图片

Hive-DDL数据定义_第2张图片

4、删除数据库

如果数据库不为空,可以采用 cascade 命令,强制删除:

5、创建表

建表语法:

Hive-DDL数据定义_第3张图片

5.1、管理表

默认创建的表都是所谓的管理表,有时也被称为内部表。因为这种表,Hive 会(或多 或少地)控制着数据的生命周期。Hive 默认情况下会将这些表的数据存储在由配置项 hive.metastore.warehouse.dir(例如,/user/hive/warehouse)所定义的目录的子目录下。当我们 删除一个管理表时,Hive 也会删除这个表中数据。管理表不适合和其他工具共享数据。

5.2、外部表

因为表是外部表,所有 Hive 并非认为其完全拥有这份数据。删除该表并不会删除掉这 份数据,不过描述表的元数据信息会被删除掉

6、分区表

分区表实际上就是对应一个 HDFS 文件系统上的独立的文件夹,该文件夹下是该分区 所有的数据文件。Hive 中的分区就是分目录,把一个大的数据集根据业务需要分割成小的 数据集。在查询时通过 WHERE 子句中的表达式选择查询所需要的指定的分区,这样的查 询效率会提高很多

6.1、分区表基本操作

(1)、创建分区表语法

Hive-DDL数据定义_第4张图片

(2)、加载数据到分区表中

(3)、查询分区表中数据

多分区联合查询

Hive-DDL数据定义_第5张图片

(4)、增加分区

(5)、删除分区

(6)、查看分区表有多少分区

(7)、查看分区表结构

7、修改表

7.1、重命名表

7.2、更新列、添加和替换列

8、删除表

hive (default)> drop table dept_partition;

 

你可能感兴趣的:(大数据)