【大数据入门核心技术-Hive】(十一)HiveSQL数据分区

目录

一、分区的概念

二、创建分区

1)静态分区

1、单分区测试

2、多分区测试

2)动态分区

3、动态分区和静态分区混合使用

三、分区的其它操作

1、恢复分区

2、归档分区

3、交换分区

四、分区数据查询

1、单分区数据查询

2、多分区数据查询

方法1: 通过union

方法2: 通过 or


一、分区的概念

数据分区的概念以及存在很久了,通常使用分区来水平分散压力,将数据从物理上移到和使用最频繁的用户更近的地方,以及实现其目的。 hive中有分区表的概念,我们可以看到分区具重要性能优势,而且分区表还可以将数据以一种符合逻辑的方式进行组织,比如分层存储

Hive官方网站对Hive partition的介绍: 可以使用Partitioned BY子句创建分区表。一个表可以有一个或多个分区列,并且为分区列中的每个不同的值组合创建一个单独的数据目录。此外,可以使用按列聚集的方式对表或分区进行存储,并且可以通过按列排序的方式在存储区内对数据进行排序。这可以提高某些查询的性能。

二、创建分区

分区表分别有静态分区和动态分区。

创建分区表语法:

CREATE [TEMPORARY] [EXTERNAL] TABLE [IF NOT EXISTS] [db_name.]table_name    -- (Note: TEMPORARY ava

你可能感兴趣的:(大数据技术入门到21天通关,大数据,hive,hadoop,数据仓库,hdfs)