Mysql数据库分区(PARTITION)操作记录

mysql的数据库分区是什么?

mysql的数据库分区,是将数据表的数据文件和索引文件按照规则分别存储在不同文件中。数据表数据量大时,用来提高数据的检索速度,同数据库的分表原理。Mysql5.1及以上版本支持。还可以执行:show variables like '%partition%'来查看是否支持分区。

show variables like '%partition%'

mysql分区的类型

mysql的分区类型包括range、list、hash、key,最为常用的当属range类型。

分区创建的sql语句实例,range类型

CREATE TABLE `be_ad_log` (

  `id` int(11) NOT NULL AUTO_INCREMENT,

  `ad_id` int(11) NOT NULL COMMENT '广告ID ',

  `impression` int(11) DEFAULT '0' COMMENT '展示次数',

  `click` int(11) DEFAULT '0' COMMENT '点击次数',

  `ctr` int(11) DEFAULT '0' COMMENT '下载次数',

  `create_time` datetime NOT NULL COMMENT '录入时间',

  PRIMARY KEY (`id`,`create_time`),

  KEY `create_time` (`create_time`) USING BTREE

) ENGINE=MyISAM  DEFAULT CHARSET=utf8 ROW_FORMAT=FIXED 

PARTITION BY RANGE (DAY(create_time))(

PARTITION p1 VALUES LESS THAN (2) ,

PARTITION p2 VALUES LESS THAN (3) ,

PARTITION p3 VALUES LESS THAN (4) ,

…………

PARTITION p30 VALUES LESS THAN (31) ,

PARTITION p31 VALUES LESS THAN (32) 

)

创建语句中需要注意的,create_time字段需为date类型或者数字类型,设置为timestamp类型则会报错;create_time需要设置为联合主键。

示例中,将create_time作为分区的标识字段,通过DAY函数获取日期的天,根据天,将数据分别存储在p1~p31中。创建后的磁盘存储结构如下:

根据上图所示,be_ad_log表中的数据文件和索引文件分别为不同的物理文件,MYD记录数据,MYI记录索引,frm记录表结构,par记录分区结构。

导入数据

本次实例中,数据库原有未分区的be_ad_log表,新建be_ad_log表前已经将旧表更名为be_ad_log6。除了be_ad_log6表为分区外,其他两个表的结构相同,现在将be_ad_log6中的数据复制到新建的be_ad_log表中。

insert into `be_ad_log` select * `from be_ad_log6` 

对比分区结构be_ad_log和未分区结构的be_ad_log6

两个表的数据量几乎一致,对比两条查询的sql语句,查询be_ad_log6为5.59秒。而经过分区操作的be_ad_log表为1.41秒,查询效率提升了79%。

EXPLAIN PARTITIONS的使用

在mysql中,查询语句前加入explain可以帮助分析SQL的执行过程,使用未使用索引、影响行数等信息。在explain后面加入partitions则可以分析分区查询的过程,如下图的partitions字段中表示,本次查询只在p1盘中进行搜索。相比于全盘检索,效率大大提高。

使用分区效果虽好,但是需要注意如下几点:

1)数据库分区从mysql5.1版本后开始使用。

2)主键或者唯一索引必须包含分区字段,如上实例的PRIMARY KEY (`id`,`create_time`)作为联合索引

3)只能通过int类型字段或者返回int类型的表达式来进行分区。通常使用YEAR、DAY、TO_DAYS等函数。

4)每个表最多分区有限制,最多1024个分区。

5)采用分区后,不支持外键,相关的约束逻辑需要通过程序来实现。

6)分区后,可能会造成索引失效,需要对分区进行验证操作。

你可能感兴趣的:(Mysql数据库分区(PARTITION)操作记录)