MySQL分区表

MySQL分区表

1. 分区表

对用户来说,分区表是一个独立的逻辑表,但是由底层由多个物理表组成。实现分区的代码实际上试对一组底层表的句柄对象的封装。对分区表的请求,都会通过句柄对象转化成对存储引擎的接口调用。
MySQL实现分区表的方式–对底层表的封装–意味着索引也是按照分区的子表定义的,而没有全局索引。
MySQL在创建表时使用PARITITION BY子句定义每个分区存放的数据。在执行查询的时候,优化器会根据分区定义过滤那些没有我们需要数据的分区,这样查询就无需扫描所有分区–只需要查询包含需要数据的分区即可。
分区表本身也有一些限制:
1. 一个表最多只能有1024个分区。
2. 在MySQL5.1中,分区表达式必须是整数,或者返回整数的表达式。在MySQL5.5中,某些场景中可以直接使用列来分区。
3. 如果分区字段中有主键或者唯一索引的列,那么所有主键和唯一索引列都必须包含进来。
4. 分区表中无法使用外检约束。

2. 分区表的原理

如前所述,分区表由多个相关的底层表实现,这些底层表也是由句柄对象(Handler object)表示,所以我们也可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有的底层表必须使用相同的存储引擎),分区表的索引只是在各个底层表上各自加上一个完全相同的索引。从存储引擎的角度来看,底层表和一个普通表没有任何区别,存储引擎也无需知道这是一个普通表还是一个分区表的一部分。

分区表上的操作按照下面的操作逻辑进行:

  • SELECT 查询
    当查询一个分区表的时候,分区层先打开并锁住所有的底层表,优化器先判断是否可以过滤部分分区,然后调用对应的存储引擎接口访问各个分区的数据。
  • INSERT 操作
    当写入一条记录时,分区层先打开并锁住所有的底层表,然后确定哪个分区表接受这条记录,再讲记录写入对应底层表。
  • DELETE 操作
    当删除一条记录时,分区层先打开并锁住所有的底层表, 然后确定数据对应的底层表,最后对响应的底层表进行删除操作。
  • UPDATE 操作
    当更新一条记录时,分区层先打开并锁住所有的底层表,MySQL先确定需要更新的记录对应的分区表,然后取出数据并更新,然后再判断更新后的数据应该放哪个分区,最后对底层表进行写入操作,并对原数据进行删除操作。

虽然每个操作都会先打开并锁住所有的底层表,但是这并不是说分区表在处理过程中是锁住全表的。如果存储引擎能够自己实现行级锁,例如InnoDB, 则会在分区层释放对应表锁。这个加锁、解锁过程与普通InnoDB上的查询类似。

3. 分区表的类型

MySQL支持多种分区表。我们看到的最多的是根据范围进行分区,每个分区存储落在某个范围的记录,分区表达式可以是列,也可以是包含列的表达式。例如,下表可以将每一年的销售记录存放在不同的分区里:

CREATE TABLE sales(
    order_date DATETIME NOT NULL,
    --Other colums ommited
)ENGINE=InnoDB PARTITION BY RANGE(YEAR(order_date))(
    PARTITION p_2010 VALUES LESS THAN (2010),
    PARTITION p_2011 VALUES LESS THAN (2011),
    PARTITION p_2012 VALUES LESS THAN (2012),
    PARTITION p_catchall VALUES LESS THAN MAXVALUE
);

PARTITION分区子句中可以使用各种函数。但是有一个要求,表达式返回的值必须是一个确定的整数,且不能是一个常数。
MySQL从5.6开始,支持的分区类型有范围分区、列表分区、哈希分区、键值分区。

你可能感兴趣的:(mysql)