前言
最左原则顾名思义就是从最左边开始匹配的原则,mysql会一直向右匹配直到遇到范围查询(>、<、between、like)就停止匹配,索引可以任意顺序,mysql的查询优化器会帮你优化成索引可以识别的形式,其针对的是组合索引(又名联合索引)。
假设我们现在对A、B、C三个字段建立组合索引,来剖析什么时候会用到索引。
1.A、B、C任意组合
A=nickName, B=groupId, C=sign。
首先来看下我的表结构和索引如图1-2,在这里就不作过多赘述。
我先来介绍下图3中sql在expalin执行计划后得一些参数。
id:为选择标识符。
select_type:表示查询的类型,SIMPLE表示简单的select,没有union和子查询。
table:输出结果集的表。
partitions:匹配的分区。
type:表示表的连接类型,range是指给定范围内的检索,比如 in(xx, xx) 或者 between。该类最好的时候是const(即表示为通过索引一次就找到了),最差的时候是all(需要遍历全表)。
possible_keys:表示查询时,可能使用的索引。(显示可能应用在这张表中的索引,不一定能应用到。)
key:表示实际使用的索引。
key_len:索引字段的长度。
ref:列与索引的比较。
rows:找到所需的记录所需要读取的行数。
filtered:按表条件过滤的行百分比。
Extra:执行情况的描述和说明。
由图3的key字段看出A、B、C下,我们使用上了nickName_id_sign联合索引,rows字段看出,读取了1行。
那我们来看看B、C、A与C、B、A呢?
图4-5看出B、C、A与C、B、A也用到了索引,为什么呢?
这是因为当客户端把SQL语句传送到服务器后,服务器进程会对该语句进行解析。这个解析的工作是在服务器端所进行的,解析动作又可分为很多小动作。其中最重要的一步就是确定最佳执行计划。服务器进程会根据一定的规则,对这条语句进行优化。(在执行计划开始之前会有一步查询转换,如:视图合并、子查询解嵌套、谓语前推及物化视图重写查询等。【此处不理解可以忽略,大概可以理解为优化器寻找最低成本的执行计划】)。最终确定可能的最低成本的执行计划。当服务器进程的优化器确定这条查询语句的最佳执行计划后, 就会将这条SQL语句与执行计划保存到数据高速缓存,提高SQL语句处理效率。
在mysql中会使用Index Merge intersection algorithm算法来调整条件子句顺序(可以理解为上面所表述的寻找最低成本的执行计划),详情请看官方文档。
2.A、B与A、C任意组合
由图6可以看出A、B组合也使用到了索引,看到type值为ref(非唯一性索引扫描,返回匹配某个单独值的所有行,本质上也是一种索引访问,它返回所有匹配某个单独值的行,它可能会找到多个符合条件的行,所以他应该属于查找和扫描的混合体。),再看rows,为40条,比A、B、C下略多,但还好,可以接受。
由图7可以看出A、C组合也使用到了索引,可以看到key_len索引中使用的字节数比A、B、C与A、B下小得多,再看rows,为七万多条,filtered的过滤条件仅为百分之十,这是因为A、B、C组合索引覆盖了(A)、(A,B)、(A,B,C)三个索引点击查看官方文档,而A、C组合用到了A索引,我们来看图8只有A条件nickName下与图7的rows参数都一致。filtered参数不一致是因为where的后置条件决定其过滤比例的。
3.B、C组合
图9可看出B、C组合下没有用到索引,type类型为ALL遍历整表去寻找记录,possible_keys与key都为空,rows几乎为全表记录。这是因为组合索引的最左匹配原则,mysql会根据A来确定下一步的搜索方向,当没有A时,就只能去全记录去寻找。
有什么问题请留言,大家一起探讨学习。