前言
分页的sql优化是日常开发中经常遇到的问题,笔者在此做一个经验总结,并附上相应的实验过程。
实验准备
若不想亲自实验的,可以直接跳过这一节。但还是建议大家做一下实验,眼见为实。
1.安装测试数据库
本次实验使用的数据是mysql官方提供的employee数据库,mysql官方提供了一些测试数据库,可以在这里找到https://dev.mysql.com/doc/ind...。
2.修改测试数据库
安装好employee数据库后,笔者出于测试修改了一下salaries表的结构,方便测试,修改操作如下:
//修改原表的主键为id
CREATE TABLE `test_salaries` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`emp_no` int(11) NOT NULL,
`salary` int(11) NOT NULL,
`from_date` date NOT NULL,
`to_date` date NOT NULL,
PRIMARY KEY (`id`),
CONSTRAINT `test_salaries_ibfk_1` FOREIGN KEY (`emp_no`) REFERENCES `employees` (`emp_no`) ON DELETE CASCADE
) ENGINE=InnoDB DEFAULT CHARSET=latin1;
//导入原表数据
INSERT INTO test_salaries (id,emp_no,salary,from_date,to_date) SELECT NULL,emp_no,salary,from_date,to_date FROM salaries;
3.完成测试环境
至此,实验的准备工作完成。可先查看一下test_salaries表中有多少数据(以下测试基于该表)
SELECT count(*)FROM test_salaries;
优化分页SQL查询
优化分页SQL查询的思路:
- 尽可能使用索引覆盖扫描,而不是查询所有的列。然后根据需要做一次关联操作再返回所需的列(延迟关联)
- 将limit查询转换为已知位置的查询,让mysql通过范围扫描获得对应的结果(范围扫描)
延迟关联
原始sql查询语句:
SELECT * FROM test_salaries WHERE salary <= 94000 LIMIT 2677500,10;
原始sql查询语句执行效果:
只查询id的sql语句:
SELECT id FROM test_salaries WHERE salary <= 94000 LIMIT 2677500,10;
只查询id的sql语句执行效果:
优化后的sql语句:
SELECT * FROM test_salaries INNER JOIN (SELECT id FROM test_salaries WHERE salary <= 94000 LIMIT 2677500,10) AS lim USING(id);
优化后的sql语句执行效果:
并且我们可以注意到,这条语句的执行时间与上一条只查询id的语句的执行时间非常接近。
范围扫描
原始sql查询语句:
SELECT * FROM test_salaries limit 2844030,10;
原始sql查询语句执行效果:
只查询id的sql语句:
SELECT id FROM test_salaries ORDER BY id limit 2844030,1;
只查询id的sql语句执行效果:
优化后的sql语句:
SELECT * FROM test_salaries WHERE id>=(SELECT id FROM test_salaries ORDER BY id limit 2844030,1) limit 0,10;
优化后的sql语句执行效果:
同样的,我们可以发现后两句sql的执行时间比较接近。
应用程序层面的分页优化设计
除了对sql语句进行优化,我们还可以在应用程序层面对分页进行一些优化设计。
- 将具体的页数换成“下一页”按钮,假设每页显示20条记录,那么每次查询时都是用LIMIT返回21条记录并只显示20条,如果第21条存在,那么就显示“下一页”按钮。
- 先获取并缓存较多的数据(例如1000条),然后每次分页都从缓存中获取。这样做可以让应用程序根据结果集的大小采取不同策略,如果结果集少于1000,就可以在页面上显示所有的分页连接;如果结果集大于1000,则可以在页面上设计一个额外的“找到的结果多于1000条”之类的按钮。