索引并不是时时都会生效的,比如以下几种情况,将导致索引失效
最左前缀法则
如果使用了联合索引,要遵守最左前缀法则。最左前缀法则指的是查询从索引的最左列开始, 并且不跳过索引中的列。如果跳跃某一列,索引将会部分失效( 后面的字段索引失效 ) 。查看tb_user 表所创建的索引 。 这个联合索引涉及到三个字段,顺序分别为:profession,age,status。
show index from tb_user;
对于最左前缀法则指的是,查询时,最左变的列,也就是profession必须存在,否则索引全部失效。
explain select * from tb_user where profession = '软件工程' and age = 31 and status = '0';
SQL 查询时,存在 profession 字段,最左边的列是存在的,索引满足最左前缀法则的基本条
件。但是查询时,跳过了 age 这个列,所以后面的列索引是不会使用的,也就是索引部分生效,所以索引的长度就是47 。
explain select * from tb_user where profession = '软件工程' and status = '0';
思考
当执行 SQL 语句 : explain select * from tb_user where age = 31 and status = '0' and profession = '软件工程 ' ; 时,是否满足最左前缀法则,走不走联合索引,
可以看到,是完全满足最左前缀法则的,索引长度 54 ,联合索引是生效的。注意 : 最左前缀法则中指的最左边的列,是指在查询时,联合索引的最左边的字段( 即是第一个字段) 必须存在,与我们编写 SQL 时,条件编写的先后顺序无关。
范围查询
联合索引中,出现范围查询 (>,<) ,范围查询右侧的列索引失效。
explain select * from tb_user where profession = '软件工程' and age > 30 and status = '0' ;
当范围查询使用 > 或 < 时,走联合索引了,但是索引的长度为 49 ,就说明范围查询右边的 status 字
段是没有走索引的。
explain select * from tb_user where profession = '软件工程' and age >= 30 and status = '0';
当范围查询使用 >= 或 <= 时,走联合索引了,但是索引的长度为 54,就说明所有的字段都是走索引的。 所以,在业务允许的情况下,尽可能的使用类似于 >= 或 <= 这类的范围查询,而避免使用 > 或 < 。
索引列运算
不要在索引列上进行运算操作, 索引将失效。在tb_user表中,除了前面介绍的联合索引之外,还有一个索引,是phone字段的单列索引。
当根据 phone 字段进行等值匹配查询时 , 索引生效。
explain select * from tb_user where phone = '17799990015';
当根据phone字段进行函数运算操作之后,索引失效。
explain select * from tb_user where substring(phone,10,2) = '15';
字符串不加引号
字符串类型字段使用时,不加引号,索引将失效。
字符串类型的字段,加单引号
explain select * from tb_user where profession = '软件工程' and age = 31 and status = '0';
字符串类型的字段,不加单引号
explain select * from tb_user where profession = '软件工程' and age = 31 and status = '0';
我们会明显的发现,如果字符串不加单引号,对于查询结果,没什么影响, 但是数据库存在隐式类型转换,索引将失效。
模糊查询
如果仅仅是尾部模糊匹配,索引不会失效。如果是头部模糊匹配,索引失效。
模糊查询时, % 加在关键字之后
explain select * from tb_user where profession like '软件%';
模糊查询时, % 加在关键字之前
explain select * from tb_user where profession like '%工程';
我们发现,在 like 模糊查询中,在关键字后面加 % ,索引可以生效。而如果在关键字
前面加了 % ,索引将会失效。
or连接条件
用 or 分割开的条件, 如果 or 前的条件中的列有索引,而后面的列中没有索引,那么涉及的索引都不会被用到。
explain select * from tb_user where id = 10 or age = 23;
由于age没有索引,所以即使id、phone有索引,索引也会失效。所以需要针对于age也要建立索引。
create index idx_user_age on tb_user(age);
再次执行上述的SQL语句
当or连接的条件,左右两侧字段都有索引时,索引才会生效。
数据分布影响
如果 MySQL 评估使用索引比全表更慢,则不使用索引。
explain select * from tb_user where phone >= '17799990005';
explain select * from tb_user where phone >= '17799990015';
MySQL 在查询时,会评估使用索引的效率与走全表扫描的效率,如果走全表扫描更快,则放弃
索引,走全表扫描。 因为索引是用来索引少量数据的,如果通过索引查询返回大批量的数据,则还不如走全表扫描来的快,此时索引就会失效。
SQL提示
SQL 提示,是优化数据库的一个重要手段,简单来说,就是在 SQL 语句中加入一些人为的提示来达到优化操作的目的。
use index
建议 MySQL 使用哪一个索引完成此次查询(仅仅是建议, mysql 内部还会再次进行评估)
explain select * from tb_user use index(idx_user_pro) where profession = '软件工程';
ignore index
忽略指定的索引。
explain select * from tb_user ignore index(idx_user_pro) where profession = '软件工程';
force index
强制使用索引。
explain select * from tb_user force index(idx_user_pro) where profession = '软件工程';
覆盖索引
尽量使用覆盖索引,减少 select * 。 那么什么是覆盖索引呢? 覆盖索引是指 查询使用了索引,并
且需要返回的列,在该索引中已经全部能够找到 。
查询id,profession,age, status字段
explain select id,profession,age, status from tb_user where profession = '软件工程' and age = 31 and status = '0' ;
查询id,profession,age, status,name字段
explain select id,profession,age, status,name from tb_user where profession = '软件工程' and age = 31 and status = '0' \G;
因为,在 tb_user 表中有一个联合索引 idx_user_pro_age_sta ,该索引关联了三个字段profession、 age 、 status ,而这个索引也是一个二级索引,所以叶子节点下面挂的是这一行的主键id 。 所以当我们查询返回的数据在 id 、 profession 、 age 、 status 之中,则直接走二级索引 直接返回数据了。 如果超出这个范围,就需要拿到主键 id,再去扫描聚集索引,再获取额外的数据了,这个过程就是回表。 而我们如果一直使用select * 查询返回所有字段值,很容易就会造成回表查询(除非是根据主键查询,此时只会扫描聚集索引)
前缀索引
当字段类型为字符串( varchar , text , longtext 等)时,有时候需要索引很长的字符串,这会让
索引变得很大,查询时,浪费大量的磁盘 IO , 影响查询效率。此时可以只将字符串的一部分前缀,建立索引,这样可以大大节约索引空间,从而提高索引效率。
语法
create index idx_xxxx on table_name(column(n)) ; 1
前缀长度
可以根据索引的选择性来决定,而选择性是指不重复的索引值(基数)和数据表的记录总数的比值,索引选择性越高则查询效率越高, 唯一索引的选择性是1 ,这是最好的索引选择性,性能也是最好的。
select count(distinct substring(email,1,5)) / count(*) from tb_user ;
创建前缀索引
create index idx_email_5 on tb_user(email(5));
单列索引与联合索引
- 单列索引:即一个索引只包含单个列。
- 联合索引:即一个索引包含了多个列。
我们先来看看 tb_user 表中目前的索引情况, 在查询出来的索引中,既有单列索引,又有联合索引。
在业务场景中,如果存在多个查询条件,考虑针对于查询字段建立索引时,建议建立联合索引, 而非单列索引。
总结
- 针对于数据量较大,且查询比较频繁的表建立索引。
- 针对于常作为查询条件(where)、排序(order by)、分组(group by)操作的字段建立引。
- 尽量选择区分度高的列作为索引,尽量建立唯一索引,区分度越高,使用索引的效率越高。
- 如果是字符串类型的字段,字段的长度较长,可以针对于字段的特点,建立前缀索引。
- 尽量使用联合索引,减少单列索引,查询时,联合索引很多时候可以覆盖索引,节省存储空间, 避免回表,提高查询效率。
- 要控制索引的数量,索引并不是多多益善,索引越多,维护索引结构的代价也就越大,会影响增删改的效率。
- 如果索引列不能存储NULL值,请在创建表时使用NOT NULL约束它。当优化器知道每列是否包含NULL值时,它可以更好地确定哪个索引最有效地用于查询。