InnoDB之索引简述

1. InnoDB中用到的索引是B+树,回顾一下B+树的知识。

2. 聚集索引

每张InnoDB表都会有一个聚集索引用于指定行数据存放的顺序。默认情况下,InnoDB以表的主键作为聚集索引,即该表按照主键的大小顺序进行存储的。而聚集索引就是以主键构造的一颗B+树,且叶子节点就是行数据本身。

InnoDB聚集索引的选取:
如果表有主键则主键就是聚集索引,如果没有则选取第一个UNIQUE索引且索引对应的行是NOT NULL的,如果还没有,则系统自动生成。

1. 聚集索引的特点:

  • 由于一张表的排列顺序只有一种,所以一张表也最多只能有一个聚集索引
  • 我们创建表时,无法手动指定聚集索引的。

2. 聚集索引的优点

  • 由于叶子节点存放的就是行数据本身,所以查找只需要一次遍历B+树就可以找到
  • 对聚集索引字段的排序和范围查找很快
    • 排序:因为聚集索引已经是排好序的,所以无需再进行排序操作。
    • 范围:我们只需要找到范围的两端,且由于叶子节点是一个双向链表,且是数据本身,所以两端叶子之间的叶子节点就是结果。

3. 非聚集索引

除了聚集索引的索引都叫非聚集索引。
非聚集索引和聚集索引的区别就是叶子节点存放的数据。且非聚集索引显然一张表可以有多个的。

  • 聚集索引叶子节点存放的是行数据本身。
  • 非聚集索引叶子节点存放的是聚集索引的值。
    所以对非聚集索引的查找[通常情况下]至少要经过两次B+树的遍历。且范围查找时,找到所有符合条件的聚集索引值之后,需要依次对每个聚集索引值找到对应的数据。

MyISAM引擎表不存在聚集索引,所有的索引的叶子节点存放的都是行数据的地址,即每次查找通过B+树找到数据的地址,然后再根据地址找到具体的数据。

4. 联合索引

如果有一个联合索引(a,b),则就会建一个这样的组合树,树的节点每个“值”都是一个数值对,而且按照a的大小顺序排的,当a相等时,才会根据b的大小排。如图。


联合索引

所以(a,b)索引时,可以单独查a也会走索引。而如果单独查b则不会走索引。

  • 联合索引的第二个好处:
    已经对第二个键做好了排序,比如:
select * from t where a = 5 order by b

其实order by b这步是不需要进行任何额外开销的,因为联合索引已经对b做好了排序了,所以直接取a = 5就可以了。

5. 覆盖索引

InnoDB是支持覆盖索引的,即从非聚集索引中就可以得到想要的结果,而不需进行回聚集索引查询。
这样的情况有两种:

1. 根据非聚集索引的条件查询聚集索引对应列的值

例如:加入a是聚集索引,b是非聚集索引

select a from t where b = 2;

我们知道非聚集索引叶子节点存的就是聚集索引的值,所以这个查询只需进行一次B+树搜索就可以了。

2. 某些统计问题

因为非聚集索引存的只是聚集索引的值,而聚集索引存的是整个行数据,所以非聚集索引的大小要远远小于聚集索引,小就意味着更少的IO。所以如果可以通过非聚集索引完成的事,就不要使用聚集索引。
例如:假设t有主键a,和非聚集索引b

select count(*) from t;

这条语句使用的就是b,因为b更小更高效。

覆盖索引有个特点:
  • 使用explain进行执行过程分析时,extra字段是using index
  • 一般情况下,联合索引(a,b),根据b的查询不会用到这个联合索引,但如果查询的是count就可能会用到。
select count(*) from t where b = 2;

用到这个索引的原因是因为非聚集索引很小,查询的效果快。

6. 索引提示

当InnoDB最终使用的index并不是最优的时(这种情况几乎不会出现),我们可以给它一些提示,建议它用某个索引。

select * from t user index(ix_a) where a = 1;

注意这里只是建议它使用,最终使用的索引还是由InnoDB自己决定。

对之对应的还有force index,即强制这条查询语句使用某个索引。

select * from t force index(ix_a) where a = 1;

你可能感兴趣的:(InnoDB之索引简述)