Maxcompute分区表的简单操作

分区概述:

不介绍了,看图就一目了然了。

从图就可以看出,分区的好处是:     

                                             1.能方便对数据的管理。   

                                             2.可以优化查询。查询表时通过WHERE子句查询指定所需查询的分区。避免全表扫描,提高处理效率,降低计算费用。

Maxcompute分区表的简单操作_第1张图片

使用限制

  • 单表分区层级最多为6级。
  • 单表分区数最大值为60000个。
  • 单次查询允许查询最多的分区个数为10000个。
  • STRING分区类型的分区值不支持使用中文。

其他介绍:

https://help.aliyun.com/document_detail/27820.html

https://developer.aliyun.com/article/66609

个人就觉得写的太“啰嗦”了,好用咱就用(在<=使用限制 之内哈)

 

使用语法:

(字段名取的有点随意)

1.创建分区表:

CREATE TABLE IF NOT EXISTS movies1_1    
(
    title  STRING,
    count1 STRING
) 
PARTITIONED BY                          
(
    data1  STRING
);

2.创建分区字段

ALTER TABLE movies1_1 ADD IF NOT EXISTS PARTITION(data1='1997');
ALTER TABLE movies1_1 ADD IF NOT EXISTS PARTITION(data1='1998');

3.对分区进行插入数据()

insert into movies1_1 partition(data1 = '1997') values(xxx,xxx);
INSERT INTO movies1_1 PARTITION(data1='1999') SELECT title,count FROM movie_test1 where title='1999';

4.查询分区表数据

select title from movies1_1 where data1='1999'

 

注意:

字段的类型不能乱搭,如上面查询分区表数据,1999使用 ' ' 包含起来的,假如不使用  '  '  ,1999就自动被识别为BIGINT类型,这样查询起来就会导致精度丢失,数据不准确。

你可能感兴趣的:(大数据学习之路)