MySQL学习笔记-7-order by

问题

查询城市是“杭州”的所有人名字,并且按照姓名排序返回前 1000 个人的姓名、年龄。
建表语句:

CREATE TABLE `t` (
  `id` int(11) NOT NULL,
  `city` varchar(16) NOT NULL,
  `name` varchar(16) NOT NULL,
  `age` int(11) NOT NULL,
  `addr` varchar(128) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `city` (`city`)
) ENGINE=InnoDB;

查询语句:

select city,name,age from t where city='杭州' order by name limit 1000  ;

全字段排序

1、初始化 sort_buffer,确定放入 name、city、age 这三个字段;
2、从索引 city 找到第一个满足 city='杭州’条件的主键 id,也就是图中的 ID_X;
3、到主键 id 索引取出整行,取 name、city、age 三个字段的值,存入 sort_buffer 中;
4、从索引 city 取下一个记录的主键 id;
5、重复步骤 3、4 直到 city 的值不满足查询条件为止,对应的主键 id 也就是图中的 ID_Y;
6、对 sort_buffer 中的数据按照字段 name 做快速排序;按照排序结果取前 1000 行返回给客户端。

rowid 排序

1、初始化 sort_buffer,确定放入两个字段,即 name 和 id;
2、从索引 city 找到第一个满足 city='杭州’条件的主键 id,也就是图中的 ID_X;
3、到主键 id 索引取出整行,取 name、id 这两个字段,存入 sort_buffer 中;
4、从索引 city 取下一个记录的主键 id;
5、重复步骤 3、4 直到不满足 city='杭州’条件为止,也就是图中的 ID_Y;
6、对 sort_buffer 中的数据按照字段 name 进行排序;
7、遍历排序结果,取前 1000 行,并按照 id 的值回到原表中取出 city、name 和 age 三个字段返回给客户端。

使用联合索引

alter table t add index city_user(city, name);

1、从索引 (city,name) 找到第一个满足 city='杭州’条件的主键 id;
2、到主键 id 索引取出整行,取 name、city、age 三个字段的值,作为结果集的一部分直接返回;
3、从索引 (city,name) 取下一个记录主键 id;
4、重复步骤 2、3,直到查到第 1000 条记录,或者是不满足 city='杭州’条件时循环结束。

使用覆盖索引

alter table t add index city_user_age(city, name, age);

1、从索引 (city,name,age) 找到第一个满足 city='杭州’条件的记录,取出其中的 city、name 和 age 这三个字段的值,作为结果集的一部分直接返回;
2、从索引 (city,name,age) 取下一个记录,同样取出这三个字段的值,作为结果集的一部分直接返回;
3、重复执行步骤 2,直到查到第 1000 条记录,或者是不满足 city='杭州’条件时循环结束。

小知识点

1、MySQL会为每个线程分配一个内存(sort_buffer)用于排序该内存大小为sort_buffer_size

如果排序的数据量小于sort_buffer_size,排序将会在内存中完成
如果排序数据量很大,内存中无法存下这么多数据,则会使用磁盘临时文件来辅助排序,也称外部排序
在使用外部排序时,MySQL会分成好几份单独的临时文件用来存放排序后的数据,然后在将这些文件合并成一个大文件

2、mysql会通过遍历索引将满足条件的数据读取到sort_buffer,并且按照排序字段进行快速排序

如果查询的字段不包含在辅助索引中,需要按照辅助索引记录的主键返回聚集索引取出所需字段
该方式会造成随机IO,在MySQL5.6提供了MRR的机制,会将辅助索引匹配记录的主键取出来在内存中进行排序,然后在回表
按照情况建立联合索引来避免排序所带来的性能损耗,允许的情况下也可以建立覆盖索引来避免回表

3、全字段排序

通过索引将所需的字段全部读取到sort_buffer中
按照排序字段进行排序
将结果集返回给客户端

优点:

MySQL认为内存足够大时会优先选择全字段排序,因为这种方式比rowid 排序避免了一次回表操作

缺点:

造成sort_buffer中存放不下很多数据,因为除了排序字段还存放其他字段,对sort_buffer的利用效率不高
当所需排序数据量很大时,会有很多的临时文件,排序性能也会很差

4、rowid排序

通过控制排序的行数据的长度来让sort_buffer中尽可能多的存放数据,max_length_for_sort_data
只将需要排序的字段和主键读取到sort_buffer中,并按照排序字段进行排序
按照排序后的顺序,取id进行回表取出想要获取的数据
将结果集返回给客户端

优点:

更好的利用内存的sort_buffer进行排序操作,尽量减少对磁盘的访问

缺点:

回表的操作是随机IO,会造成大量的随机读,不一定就比全字段排序减少对磁盘的访问

你可能感兴趣的:(mysql)