文章目录
一.索引概述
1)无索引情况
2)有索引情况
二.索引结构
三.二叉树
四.B-tree(多路平衡查找树)
五.B+Tree
六.Hash
介绍:
索引(index)是帮助MySQL高效获取数据的数据结构(有序)。在数据之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查找算法,这种数据结构就是索引。
在无索引情况下,就需要从第一行开始扫描,一直扫描到最后一行,我们称之为全表扫描,性能很低。
如果我们针对于一张表建立了索引,假设索引结构就是二叉树,那么也就意味着,会对一个字段建 立一个二叉树的索引结构。
特点:
MySQL的索引实在存储引擎层实现的,不同的存储引擎有不同的结构,主要包含以下几种:
不同的存储引擎对于索引结构的支持:
注意:平常说的索引,如果没有特别指明,都是指B+tree结构组织的索引。
理想的结构:
如果主键是顺序插入的,则会形成一个单向链表:
二叉树缺点:
① 顺序插入时,会形成一个链表,查询性能大大降低。
② 大数据量情况下,层级较深,检索速度慢。
B树是一种多叉路衡查找树,相对于二叉树,B树每个节点可以有多个分支,即多叉。
树的度数:一个节点的子节点个数。
特点:
①X阶的B树,每一个节点最多存储X-1个key,对应X个指针;
②一旦节点存储的key数量到达X,就会裂变,中间元素向上分裂;
③在B树中,非叶子节点和叶子节点都会存放数据;
B+Tree是B-Tree的变种
绿色框框起来的部分,是索引部分,仅仅起到索引数据的作用,不存储数据。
红色框框起来的部分,是数据存储部分,在其叶子节点中要存储具体的数据。
标准的B+Tree的数据结构:
B+Tree 与 B-Tree相比,主要有以下三点区别:
所有的数据都会出现在叶子节点;
叶子节点形成一个单向链表;
非叶子节点仅仅起到索引数据作用,具体的数据都是在叶子节点存放的;
MySQL索引数据结构对经典的B+Tree进行了优化。
在原B+Tree的基础上,增加一个指向相邻叶子节点 的链表指针,就形成了带有顺序指针的B+Tree,提高区间访问的性能,利于排序。
哈希索引就是采用一定的hash算法,将键值换算成新的hash值,映射到对应的槽位上,然后存储在 hash表中。
如果两个(或多个)键值,映射到一个相同的槽位上,他们就产生了hash冲突(也称为hash碰撞),可 以通过链表来解决。
特点:
①Hash索引只能用于对等比较(=,in),不支持范围查询(between,>,< ,...);
②无法利用索引完成排序操作;
③查询效率高,通常(不存在hash碰撞的情况下)只需要一次检索就可以了,效率通常要高于B+tree索 引;
存储引擎支持:
在MySQL中,支持hash索引的是Memory存储引擎。 而InnoDB中具有自适应hash功能,hash索引是 InnoDB存储引擎根据B+Tree索引在指定条件下自动构建的。