MySQL 索引

索引

索引本质是一种数据结构,目的是为了提高数据查询的效率,尽可能减少 IO 次数。

  1. 大大减少服务器需要扫描的数据量
  2. 帮助服务器减少排序过程避免生成临时表
  3. 可以把 随机 IO 转变为 顺序 IO

有效使用索引会大大提升查询效率,但会增加磁盘空间和降低插入效率

常见的索引类型

哈希索引

哈希索引(Hash Index)是基于哈希表实现,是一种键值对(Key-Value)存储的数据结构;

优点:等值查询效率较高

缺点:范围查询效率较低,需要一个一个查找

MySQL 中只有 Memory 引擎显示支持哈希索引,也是其默认索引类型

有序数组

有序数组的元素是递增或递减的,可以通过二分算法,在 log(n) 时间复杂度查到对应元素

优点:范围查询效率较高

缺点:增加新元素速度较慢,需要拷贝数组

树形索引

二叉树, 红黑树, B Tree, B+Tree 等

高性能索引策略

图片来自《高性能 MySQL 第三版》

MySQL 索引_第1张图片

聚簇索引

聚簇索引中索引即数据,数据行存放在索引的叶子节点中

因数据行在磁盘中只存放了一份,因此一个表只有一个聚簇索引

如果表中没定义主键,InnoDB 会选择一个唯一的非空索引代替,如果没有非空索引则会隐式创建一个 6 字节大小的指针作为主键,同时也会成为聚簇索引

非聚簇索引

非聚簇索引也称为二级索引,索引的叶子节点中存放的是主键的值

当使用因为非聚簇索引查询时,因为非聚簇索引叶子节点中存放的是主键的值,当查到主键的值后,需要根据主键再查到对应的数据行,这一过程叫做回表

基于非聚簇索引的查询需要多扫描一棵索引树。因此,我们在应用中应该尽量使用主键查询

多列索引

建立多列索引,数据会保存在索引树的节点上,可以利用覆盖索引原则,减少回表

多列索引的索引项是按照索引定义里面出现的字段顺序排序的

覆盖索引

当使用二级索引查询时,如果查询的内容保存在索引树上,则直接返回保存再索引数树的数据即可,不需要再回表查询

最左前缀

B+ 树这种索引结构,可以利用索引的最左前缀,来定位记录

如果在 (name,age) 列上建立了索引,根据最左前缀,查询 name 也会走索引,从而可以减少维护索引个数

只要满足最左前缀,就可以利用索引来加速检索。最左前缀可以是联合索引的最左 N 个字段,也可以是字符串索引的最左 M 个字符

like aa% 后模糊查询索引有效,like %aa 模糊查询索引无效

索引下推

MySQL 5.6 引入的索引下推优化(index condition pushdown),可以在索引遍历过程中,对索引中包含的字段先做判断(where条件里的匹配),直接过滤掉不满足条件的记录,减少回表次数

仅能利用最左前缀索的场景下(而不是能利用全部联合索引),对不在最左前缀索引中的其他联合索引字段加以利用

explain 输出的 Extra 字段中会有 Using index condition; 即代表本次查询会利用到索引,且会利用到索引下推

你可能感兴趣的:(mysql)