MySQL InnoDB存储引擎中的索引结构解析

目录

  • 常见的几种数据结构
    • 1、二叉树
    • 2、红黑树
    • 3、B树
    • 4、B+树
    • 5、总结
  • 索引结构
    • 1、聚簇索引和非聚簇索引
    • 2、Hash索引
    • 3、总结

常见的几种数据结构

1、二叉树

特点:

  • 每个节点最多有两个子节点,分别称为左子节点和右子节点。
  • 通常不是自平衡的,可能会出现极端倾斜的情况,导致插入和删除的时间复杂度变为 O(n)。

MySQL InnoDB存储引擎中的索引结构解析_第1张图片

2、红黑树

红黑树又称平衡二叉树

特点:

  • 每个节点要么是红色,要么是黑色。
  • 根节点是黑色的。
  • 没有连续的红色节点(即红色节点的父节点和子节点不能同时为红色)。
  • 对于每个节点,从该节点到其子孙节点的所有路径上包含相同数目的黑色节点。
  • 新插入的节点为红色,然后通过颜色调整和旋转来满足上述性质。

通过保持特定的平衡条件,可以在插入和删除节点时自我调整,保持树的平衡性,确保操作的时间复杂度为 O(log n)。

红黑树常被用作 C++ STL 中的 map 和 set 的底层实现,以及一些数据库(如 Redis)的内部实现。

总结:红黑树通过旋转调整 解决了二叉树不平衡问题
MySQL InnoDB存储引擎中的索引结构解析_第2张图片

3、B树

特点:

  • B树是一种平衡的多路搜索树,每个节点可以有多个子节点,且子节点的数量范围通常称为B树的阶。
  • 每个节点包含有序的键值对,节点内的关键字按升序排列。

总结:B树通过将多个键值存储在每个节点中,以及允许每个节点可以拥有更多的子节点,减少了树的高度。解决了红黑树高度、旋转的问题
MySQL InnoDB存储引擎中的索引结构解析_第3张图片
MySQL InnoDB存储引擎中的索引结构解析_第4张图片

4、B+树

特点:

  • 非叶子节点只存储key值不存储数据
  • 所有的key值都可以在叶子节点上找到,且是有序的双向链表

总结:B+树通过非叶子节点只存储key值,且叶子节点是有序的双向链表,解决了B树高度、范围查找问题
MySQL InnoDB存储引擎中的索引结构解析_第5张图片

5、总结

因此选择B+树是因为非叶子节点只存储索引,不存储数据,可以使每个节点存储更多索引,减小树的深度。叶子节点包含了所有索引的双向链表,方便了范围查询。

索引结构

1、聚簇索引和非聚簇索引

聚簇索引:

  • mysql 中 innodb 存储引擎中的聚簇索引非叶子结点存储的是索引key(通常是主键),叶子节点存储的是行数据

MySQL InnoDB存储引擎中的索引结构解析_第6张图片

非聚簇索引:

  • mysql 中 innodb 存储引擎中的非聚簇索引非叶子结点存储的是索引,叶子节点存储的聚簇索引key

MySQL InnoDB存储引擎中的索引结构解析_第7张图片
总结:
InnoDB 存储引擎中

  1. 如果表中有主键,则会使用主键来作为聚簇索引
  2. 如果表中没有主键,则会使用第一个唯一索引作为聚簇索引
  3. 如果主键和唯一索引都没有,会选择一个列或一组列作为聚簇索引

拓展:
MYISAM 存储引擎使用的是非聚簇索引,所有叶子节点存储的都是行数据地址的指针,因此在MYISAM中索引和数据是分开存储的。

2、Hash索引

mysql中除了B+树索引其实还有Hash索引,但是应用场景一般不多。默认使用B+树索引

特点:

  • Hash索引使用哈希表实现,适合等值查询,因为它能提供接近O(1)的查找效率。但是,Hash索引并不支持范围查询,因为哈希表无法保持数据的顺序关系。
  • 此外,哈希冲突的存在会导致性能下降,特别是在数据量大的情况下。而B+树索引即使面对大量数据,也能保持较好的性能。

MySQL InnoDB存储引擎中的索引结构解析_第8张图片

3、总结

综上所述,InnoDB存储引擎之所以选择B+树作为索引结构,是因为它在保证查询效率的同时,还支持范围查询,并且具有更好的顺序读取性能。当然,这并不意味着B+树在所有场景下都是最佳选择,对于某些特定的使用案例,比如频繁的等值查询,且具有较少的hash冲突,Hash索引可能是一个更好的选择。

你可能感兴趣的:(关系型数据库,mysql,二叉树,红黑树,b树,b+树,hash索引)