索引
索引本质是一种数据结构,目的是为了提高数据查询的效率,尽可能减少 IO 次数。
- 大大减少服务器需要扫描的数据量
- 帮助服务器减少排序过程和避免生成临时表
- 可以把 随机 IO 转变为 顺序 IO
有效使用索引会大大提升查询效率,但会增加磁盘空间和降低插入效率
常见的索引类型
哈希索引
哈希索引(Hash Index)是基于哈希表实现,是一种键值对(Key-Value)存储的数据结构;
优点:等值查询效率较高
缺点:范围查询效率较低,需要一个一个查找
MySQL 中只有 Memory 引擎显示支持哈希索引,也是其默认索引类型
有序数组
有序数组的元素是递增或递减的,可以通过二分算法,在 log(n) 时间复杂度查到对应元素
优点:范围查询效率较高
缺点:增加新元素速度较慢,需要拷贝数组
树形索引
二叉树, 红黑树, B Tree, B+Tree 等
高性能索引策略
图片来自《高性能 MySQL 第三版》
聚簇索引
聚簇索引中索引即数据,数据行存放在索引的叶子节点中
因数据行在磁盘中只存放了一份,因此一个表只有一个聚簇索引
如果表中没定义主键,InnoDB 会选择一个唯一的非空索引代替,如果没有非空索引则会隐式创建一个 6 字节大小的指针作为主键,同时也会成为聚簇索引
非聚簇索引
非聚簇索引也称为二级索引,索引的叶子节点中存放的是主键的值
当使用因为非聚簇索引查询时,因为非聚簇索引叶子节点中存放的是主键的值,当查到主键的值后,需要根据主键再查到对应的数据行,这一过程叫做回表
基于非聚簇索引的查询需要多扫描一棵索引树。因此,我们在应用中应该尽量使用主键查询
多列索引
建立多列索引,数据会保存在索引树的节点上,可以利用覆盖索引原则,减少回表
多列索引的索引项是按照索引定义里面出现的字段顺序排序的
覆盖索引
当使用二级索引查询时,如果查询的内容保存在索引树上,则直接返回保存再索引数树的数据即可,不需要再回表查询
最左前缀
B+ 树这种索引结构,可以利用索引的最左前缀,来定位记录
如果在 (name,age) 列上建立了索引,根据最左前缀,查询 name 也会走索引,从而可以减少维护索引个数
只要满足最左前缀,就可以利用索引来加速检索。最左前缀可以是联合索引的最左 N 个字段,也可以是字符串索引的最左 M 个字符
like aa%
后模糊查询索引有效,like %aa
模糊查询索引无效
索引下推
MySQL 5.6 引入的索引下推优化(index condition pushdown),可以在索引遍历过程中,对索引中包含的字段先做判断(where条件里的匹配),直接过滤掉不满足条件的记录,减少回表次数
在仅能利用最左前缀索的场景下(而不是能利用全部联合索引),对不在最左前缀索引中的其他联合索引字段加以利用
explain
输出的 Extra
字段中会有 Using index condition;
即代表本次查询会利用到索引,且会利用到索引下推