在项目开发当中,经常要实现分页功能,在面试时也会经常被问到:什么是分页。这是因为在一个页面上能够显示的数据是有限的,而存放在数据库中的数据往往很多,我们必须将这些数据安放到不同的页面中去。
一、分页
1. 什么是分页
一般在客户端实现分页功能的时候,要显示当前页的数据、当前所在页数、临近页面的按钮以及总页数等等。这些数据随着翻页的进行能够动态的变化,为了实现这样的效果,一般会采取两种办法:真分页和假分页。这样的划分方式是从与数据库的交互方式出发的,是每次翻页时都进行查询还是一次性查出所有的数据。
2. 真分页
真分页指的是每次在进行翻页时都只查询出当前页面的数据,特点就是与数据库的交互次数较多,但是每次查询的数据量较少,数据也不需要一直保存在内存中。适用于数据量比较大的场景,数据不适合全量查出的情况。
3. 假分页
假分页指的是对于要显示的数据一次性全部查出,一直存在在服务端或客户端,在前端进行分页或由服务端控制分页。将根据当前所在页来计算应该显示的数据所在下标,用循环取出目标数据。只有当会话断开或页面关闭,相应的资源才会被释放。
4. 缓存层
真分页和假分页都要和数据库进行交互,对于真分页来说不需要担心数据同步的问题,因为每次都是查询出最新的,但是数据库的负担会很重,尤其是用户量大的情况下。
假分页可以在一定程度上减轻数据库的压力,但是数据不能及时得到同步,除非重新请求或页面刷新。
一般在企业中会有缓存层的存在,既能有效降低数据库的压力,又能及时的进行数据同步。在对数据库中的数据进行修改后,要将变更后的数据及时同步到缓存层,在进行数据查询时从缓存层获取。
二、MySQL实现分页
本文将介绍如何通过真分页的方式,每次取出所需数据。对于不同的数据,实现分页有不同的方式,在MySQL中可以使用LIMIT来限制查询出的数据。
1. LIMIT用法
LIMIT出现在查询语句的最后,可以使用一个参数或两个参数来限制取出的数据。其中第一个参数代表偏移量:offset(可选参数),第二个参数代表取出的数据条数:rows。
- 单参数用法
当指定一个参数时,默认省略了偏移量,即偏移量为0,从第一行数据开始取,一共取rows条。
/* 查询前5条数据 */ SELECT * FROM Student LIMIT 5;
- 双参数用法
当指定两个参数时,需要注意偏移量的取值是从0开始的,此时可以有两种写法:
/* 查询第1-10条数据 */ SELECT * FROM Student LIMIT 0,10; /* 查询第11-20条数据 */ SELECT * FROM Student LIMIT 10 OFFSET 10;
2. 分页公式
- 总页数计算
在进行分页之前,我们需要先根据数据总量来得出总页数,这需要用到COUNT函数和向上取整函数CEIL,SQL如下:
/* 获得数据总条数 */ SELECT COUNT(*) FROM Student; /* 假设每页显示10条,则直接进行除法运算,然后向上取整 */ SELECT CEIL(COUNT(*) / 10) AS pageTotal FROM Student;
- 核心信息
- 当前页:pageNumber
- 每页数据量:pageSize
在实际操作中,我们能够得到的信息有当前所在页以及每页的数据量,同时要注意一下是否超出了最大页数。以每页10条为例,则前三页的数据应为:
- 第1页:第1~10条,SQL写法:LIMIT 0,10
- 第2页:第11~20条,SQL写法:LIMIT 10,10
- 第3页:第21~30条,SQL写法:LIMIT 20,10
据此我们可以总结出,LIMIT所需要的两个参数计算公式如下:
offset
:(pageNumber - 1) * pageSizerows
:pageSize
8种MySQL分页方法总结
方法1: 直接使用数据库提供的SQL语句
—语句样式: MySQL中,可用如下方法: SELECT * FROM 表名称 LIMIT M,N。
—适应场景: 适用于数据量较少的情况(元组百/千级)。
—原因/缺点: 全表扫描,速度会很慢 且 有的数据库结果集返回不稳定(如某次返回1,2,3,另外的一次返回2,1,3)。Limit限制的是从结果集的M位置处取出N条输出,其余抛弃。
方法2: 建立主键或唯一索引, 利用索引(假设每页10条)
—语句样式: MySQL中,可用如下方法:
代码如下:
SELECT * FROM 表名称 WHERE id_pk > (pageNum*10) LIMIT M
—适应场景: 适用于数据量多的情况(元组数上万)。
—原因: 索引扫描,速度会很快。有朋友提出因为数据查询出来并不是按照pk_id排序的,所以会有漏掉数据的情况,只能方法3。
方法3: 基于索引再排序
—语句样式: MySQL中,可用如下方法: SELECT * FROM 表名称 WHERE id_pk > (pageNum*10) ORDER BY id_pk ASC LIMIT M。
—适应场景: 适用于数据量多的情况(元组数上万). 最好ORDER BY后的列对象是主键或唯一所以,使得ORDERBY操作能利用索引被消除但结果集是稳定的(稳定的含义,参见方法1)。
—原因: 索引扫描,速度会很快. 但MySQL的排序操作,只有ASC没有DESC(DESC是假的,未来会做真正的DESC,期待)。
方法4: 基于索引使用prepare
(第一个问号表示pageNum,第二个?表示每页元组数)
—语句样式: MySQL中,可用如下方法:
代码如下:
PREPARE stmt_name FROM SELECT * FROM 表名称 WHERE id_pk > (?* ?) ORDER BY id_pk ASC LIMIT M
—适应场景: 大数据量。
—原因: 索引扫描,速度会很快. prepare语句又比一般的查询语句快一点。
方法5:利用MySQL支持ORDER操作可以利用索引快速定位部分元组,避免全表扫描
—比如: 读第1000到1019行元组(pk是主键/唯一键)。
代码如下:
—SELECT * FROM your_table WHERE pk>=1000 ORDER BY pk ASC LIMIT 0,20
方法6: 利用"子查询/连接+索引"快速定位元组的位置,然后再读取元组. 道理同方法5
—如(id是主键/唯一键,蓝色字体时变量):
利用子查询示例:
代码如下:
SELECT* FROMyour_table WHEREid <= (SELECTid FROMyour_table ORDER BYid descLIMIT (p a g e − 1 ) ∗ page-1)*page−1)∗pagesize ORDERBYid desc LIMIT $pagesize
利用连接示例:
代码如下:
SELECT* FROMyour_table ASt1 JOIN(SELECTid FROMyour_table ORDERBY id descLIMIT (p a g e − 1 ) ∗ page-1)*page−1)∗pagesize ASt2 WHERE t1.id <= t2.id ORDERBYt1.id descLIMIT $pagesize;
方法7: 存储过程类(最好融合上述方法5/6)
—语句样式: 不再给出
—适应场景: 大数据量. 作者推荐的方法
—原因: 把操作封装在服务器,相对更快一些。
方法8: 反面方法
—网上有人写使用 SQL_CALC_FOUND_ROWS。 没有道理,勿模仿 。
基本上,可以推广到所有数据库,道理是一样的。但方法5未必能推广到其他数据库,推广的前提是,其他数据库支持ORDER BY操作可以利用索引直接完成排序。
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。