hash分区的目的是将数据均匀的分布到对应分区中,如果表中有主键或唯一索引,分区列必须是主键或唯一索引的一部分。
hash分区创建分区是“PARTITION BY HASH(expr)”实现的,expr是整数列或者可以将分区列转换成整数的表达式。
1.已经存在的表创建分区
CREATE TABLE `test_user_hash` (
`user_id` bigint(19) NOT NULL,
`user_name` varchar(50) NOT NULL,
`ext_int` int(2) NOT NULL,
`ts` bigint(19) NOT NULL,
PRIMARY KEY (`user_id`,`ext_int`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
ALTER TABLE `test_user_hash` PARTITION BY HASH(ext_int) PARTITIONS 3 ;
2.建表时创建分区
CREATE TABLE `test_user_hash` (
`user_id` bigint(19) NOT NULL,
`user_name` varchar(50) NOT NULL,
`ext_int` int(2) NOT NULL,
`ts` bigint(19) NOT NULL,
PRIMARY KEY (`user_id`,`ext_int`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8
partition by hash (ext_int) partitions 3;
3.插入测试数据
INSERT INTO test_user_hash(user_id,user_name,ext_int,ts)VALUES
(1,'user_name1',1,UNIX_TIMESTAMP()),
(2,'user_name2',2,UNIX_TIMESTAMP()),
(3,'user_name3',3,UNIX_TIMESTAMP()),
(4,'user_name4',4,UNIX_TIMESTAMP()),
(5,'user_name5',5,UNIX_TIMESTAMP()),
(6,'user_name6',6,UNIX_TIMESTAMP()),
(7,'user_name7',7,UNIX_TIMESTAMP()),
(8,'user_name8',8,UNIX_TIMESTAMP())
;
预期各分区数据量:p0:p1:p2=2:3:3
查询数据库:
SELECT
PARTITION_NAME,
TABLE_ROWS
FROM
INFORMATION_SCHEMA. PARTITIONS
WHERE
TABLE_NAME = 'test_user_hash';
完全符合预期。
4、hash线性分区
线性分区与hash分区相比,只是分区语句上加上了linear关键字,如:ALTER TABLE `test_user_hash` PARTITION BY LINEAR HASH(ext_int) PARTITIONS 3 ;
LINEAR HASH的优点是在添加、删除、合并、拆分分区的时候,非常有效率,但是缺点是线性hash分区的数据分布不均匀。