【数据结构】初步认识B、B+树

在学习B树前,如果没有2-3树的基础,建议先去学习一下2-3树会更好理解B树图解2-3树(学习红黑树、B树的基础)

首先需要明白B树就是B-树,因为B树的原英文名称为B-tree,所以很多人把B树又叫做B-树,这就导致很多人以为B树分为:B-、B、B+树三种,其实英文中B-Tree中的“-”不是减号,只是一个横杠的意思,就好比B+树英文为B+-tree.

明白了基本概念后,对B树进行一个基本的介绍

  • B树的本质也是一颗二叉搜索树
  • B树的节点最多有m个孩子(m>=2)
  • 除根节点和叶子节点外,其他每个节点至少有ceil(m/2)个孩子 (这里的ceil()是一个向上取整的函数)
  • B树是一颗绝对平衡的树(根节点到任意节点路径相同)

通过下图B树和AVL树的比较来深刻理解一下B树的定义

【数据结构】初步认识B、B+树_第1张图片

对于上图而言,我们定义的B树的m等于3,也就是一个节点最多有三个孩子,在实际应用中B树的m会定义的很大。

那么B树为什么这样定义呢?有什么好处?

  • 对照着上图,我们可以看到如果分别在AVL和B树中进行查找元素,B树会快很多,因为B树的高度低,这个原因也是mysql选择B树的原因,那么为什么现在Mysql大部分用的是B+树而不是B树作为索引呢?

首先来看一下B+树和B树的区别,如下图

【数据结构】初步认识B、B+树_第2张图片

通过上图的对比可以发现,B+树在叶子节点冗余了所有非叶子节点的key,每个叶子节点增加了一个指向相邻叶子节点的指针。

还需要注意B+树中的非叶子节点仅仅存储了key就是指向了子树的最大最小值,只有叶子节点才存储了key和value,value就是真实的数据。

上图显然增大了mysql索引的数据量,为何还要这么做?

  • 这是因为如果在MySQL中进行范围查询使用B树时,就会存在一个回溯的问题,比如对应上图使用B树查询一个大于1的所有数据,那么就会是4--->2--->1,然后向上回旋提取数据,但是向上回旋这个过程的效率时什么低的,这就是为什么B+树的叶子节点是将所有的数据按照顺兴用链表连接起来的原因。
  • 当使用B+树进行范围查询时,比如查询大于1的所有数据,那么就会5-->3--->2--->1,ok查询到了等于1的数据,然后就是简单的链表操作将大于1的数据取出来即可,这比B树的回旋操作效率会大很多。

 

你可能感兴趣的:(数据结构与算法)