MYSQL Innodb中的聚簇索引和非聚簇索引

聚簇索引

数据库表的索引从数据存储方式上可以分为聚簇索引和非聚簇索引(又叫二级索引)两种。
存储引擎Innodb中的聚簇索引在同一个B+-Tree中保存了索引和数据行,在聚簇索引中,实际的数据保存在叶子页中,中间的节点页保存指向下一层节点页(也可能是叶子叶)的指针。“聚簇”的意思是数据行被按照一定顺序一个个紧密地排列在一起存储。一个表只能有一个聚簇索引,因为在一个表中数据的存放方式只有一种。

一般来说,将通过主键作为聚簇索引的索引列,也就是通过主键聚集数据。下图展示了Innodb中聚簇索引的结构(图片来自《高性能MySQL(第三版)》):

MYSQL Innodb中的聚簇索引和非聚簇索引_第1张图片
image.png

聚簇索引的结构

这里要特别注意‘页’的概念,一个页可以理解为一块具有一定大小的连续的存储区域。相同页内的数据行在物理上是相邻的,因此逻辑上键值相邻的页在物理上可能相隔很远

在中间的某个节点页中,主键<11的叶子页和11<主键<21的叶子页分别被两个指针所指向,且主键<11的叶子页也有一个指针指向了11<主键<21的叶子页,其余页之间的关系也是一样。

聚簇索引的优点

  1. 聚簇索引将索引和数据行保存在同一个B+-Tree中,查询通过聚簇索引可以直接获取数据,相比非聚簇索引需要第二次查询(非覆盖索引的情况下)效率要高。
  2. 聚簇索引对于范围查询的效率很高,因为其数据是按照大小排列的,

聚簇索引的缺点

  1. 聚簇索引的更新代价比较高,如果更新了行的聚簇索引列,就需要将数据移动到相应的位置。这可能因为要插入的页已满而导致“页分裂”。
  2. 插入速度严重依赖于插入顺序,按照主键进行插入的速度是加载数据到Innodb中的最快方式。如果不是按照主键插入,最好在加载完成后使用OPTIMIZE TABLE命令重新组织一下表。
  3. 聚簇索引在插入新行和更新主键时,可能导致“页分裂”问题。
  4. 聚簇索引可能导致全表扫描速度变慢,因为可能需要加载物理上相隔较远的页到内存中(需要耗时的磁盘寻道操作)。

非聚簇索引

非聚簇索引,又叫二级索引。Innodb中二级索引的叶子节点中保存的不是指向行的物理指针(MyISAM又不一样,它的二级索引叶子节点存储的是物理指针),而是行的主键值。当通过二级索引查找行,存储引擎需要在二级索引中找到相应的叶子节点,获得行的主键值,然后使用主键去聚簇索引中查找数据行,这需要两次B+-Tree查找。
好处很明显就是在数据爷裂开数据存储位置发生改变时不用维护数据物理指针的变化了。缺点也是有的多了一次B+Tree的查询(根据主键在聚簇索引查询出主键所在的叶子页)。

总结

下面是Innodb聚簇索引和非聚簇索引的示意图(图片来自《高性能MySQL(第三版)》:

MYSQL Innodb中的聚簇索引和非聚簇索引_第2张图片
image.png

Innodb聚簇索引和非聚簇索引

你可能感兴趣的:(MYSQL Innodb中的聚簇索引和非聚簇索引)