MySQL索引原理详解, 何时失效

1. 索引的本质是什么

索引的本质是一种排好序的数据结构。

它就好比字典中的目录。

 

2. 索引的分类

索引的分类要看是什么维度。

如果是从数据库功能的维度来划分的,如下:

索引类型 详细描述
普通索引 create index index_name on table(column);
唯一索引 索引列的值必须唯一(可以为空) create unique index index_name on table(column);
主键索引 特殊的唯一索引,不允许为空 PK
组合索引 在多个字段上创建索引,遵循最左前缀原则。alter table t add index index_name(a,b,c);
全文索引 用来查找文本中的关键字

如果是从数据结构的维度来划分的,如下:

  • Hash 索引
    Hash 索引是比较常见的一种索引,他的单条记录查询的效率很高,时间复杂度为1。
    但是,Hash索引并不是最常用的数据库索引类型,尤其是我们常用的Mysql Innodb引擎就是不支持hash索引的
因为存储引擎都会为每一行计算一个hash码,hash码都是比较小的,
并且不同键值行的hash码通常是不一样的,hash索引中存储的就是Hash码,
hash 码彼此之间是没有规律的,且 Hash 操作并不能保证顺序性,
所以值相近的两个数据,Hash值相差很远,被分到不同的桶中。


  • 二叉树

一个节点只能有两个子节点。即度不超过2
二叉树的时间复杂度为 O(n)
左子节点 小于 本节点,右子节点 大于 本节点

二叉树的特点:
磁盘的IO由树高决定


  • B树(二三树)

B树的结构每个节点中不仅包含数据的 key 值,还有 data 值

见下图


B树结构

如果 data 比较大,会导致每个节点的 key 存储的较少,
当数据量较大的时候,同样会导致B树很深,从而增加了磁盘 IO 的次数,进而影响查询效率。


  • B+树

MySQL 中最常用的索引的数据结构是 B+ 树,它有以下特点:

1. 在 B+ 树中,所有数据记录节点都是按照键值的大小存放在同一层的叶子节点上,
    而非叶子结点只存储key的信息,这样可以大大减少每个节点的存储的key的数量,降低B+ 树的高度

2. B+ 树叶子节点的关键字从小到大有序排列,左边结尾数据都会保存右边节点开始数据的指针。

3. B+ 树的层级更少:相较于 B 树 B+ 每个非叶子节点存储的关键字数更多,
    树的层级更少所以查询数据更快

4. B+ 树查询速度更稳定:B+ 所有关键字数据地址都存在叶子节点上,
    所以每次查找的次数都相同所以查询速度要比B树更稳定;

5. B+ 树天然具备排序功能:B+ 树所有的叶子节点数据构成了一个有序链表,
    在查询大小区间的数据时候更方便,数据紧密性很高,缓存的命中率也会比B树高。

6. B+ 树全节点遍历更快:B+ 树遍历整棵树只需要遍历所有的叶子节点即可,
     而不需要像 B 树一样需要对每一层进行遍历,这有利于数据库做全表扫描。

关于B+树的详细介绍可以查看我的另一篇博客:
https://www.cnblogs.com/davidgu/p/14526659.html

 

3. 何时使用索引

MySQL每次查询只使用一个索引。
与其说是“数据库查询只能用到一个索引”,倒不如说,和全表扫描比起来,
去分析两个索引B+树更加耗费时间。

所以where A=a and B=b这种查询使用(A,B)的组合索引最佳,
B+树根据(A,B)来排序。

使用索引的场景:

a. 主键,unique字段
b. 和其他表做连接的字段需要加索引
c. 在where里使用>,≥,=,<,≤,is null和between等字段
d. 使用不以通配符开始的like,where A like 'China%'
e. 聚集函数MIN(),MAX()中的字段
f. order by和group by字段

 

4. 何时不使用索引

不使用索引的场景:

a. 表记录太少
b. 数据重复且分布平均的字段(只有很少数据值的列)
c. 经常插入、删除、修改的表要减少索引
d. text,image等类型不应该建立索引,这些列的数据量大
    假如text前10个字符唯一,也可以对text前10个字符建立索引
e. MySQL能估计出全表扫描比使用索引更快时,不使用索引

 

5. 索引何时失效

索引失效的场景:

a. 组合索引未使用最左前缀,例如组合索引(A,B),where B=b不会使用索引
b. like未使用最左前缀,where A like '%Sheep'
c. 搜索一个索引而在另一个索引上做order by,where A=a order by B,
    只使用A上的索引,因为查询只使用一个索引
d. or会使索引失效。如果查询字段相同,也可以使用索引。
    (eg: where A=a1 or A=a2(生效),where A=a or B=b(失效))
e. 如果列类型是字符串,要使用引号
    (eg: where A='Sheep',否则索引失效(会进行类型转换))
f. 在索引列上的操作,函数(upper()等)、or、!=(<>)、not in等

 

6. explain语句显示结果关键字解释

关键字 解释
ALL 全表扫描
index 索引全扫描
range 索引范围扫描,常用语<,<=,>=,between等操作
ref 使用非唯一索引扫描或唯一索引前缀扫描,返回单条记录,常出现在关联查询中
eq_ref 类似ref,区别在于使用的是唯一索引,使用主键的关联查询
const/system 单条记录,系统会把匹配行中的其他列作为常数处理,如主键或唯一索引查询
null MySQL不访问任何表或索引,直接返回结果

你可能感兴趣的:(MySQL索引原理详解, 何时失效)