B+树的正确姿势

背景

用过MySQL的同学都知道高效查询需要走索引,否则全表读取会导致慢SQL。InnoDB的索引是采用B+树实现的。网络和书本上关于B+树的定义各不相同,读者们可能都分辨不清哪个是准确的定义。

定义

笔者按照《数据库系统概念》(Database System Concepts)这本书上的概念,准确定义B+树

B+树采用的是平衡树结构,从根节点到每个叶子节点的路劲长度都是相同的,我们给每棵树定义nn是固定不变的,下图是B+树节点全满状态的结构:

B+树的正确姿势_第1张图片
P表示指针,K表示关键字,且如果i < j,则Ki < Kj(假设没有重复的关键字)。

对于叶节点,i = 1,2,···,n-1, 指针Pi指向具有关键字Ki的一条文件记录,指针Pn指向后一个叶节点,这样所有的叶节点按键值大小顺序串成一个链表,可以高效地进行顺序处理。

非叶节点的结构与叶节点相同,只不过非叶节点的指针都是指向树中的节点。假设有Ki-1,Pi,Ki,则指针Pi指向的子树中的关键字值大于等于Ki-1,小于KiP1指向的子树的关键字值,小于K1Pn指向的子树的关键字值都大于等于Kn-1

  • 对任意节点,指针数 = 关键字数 + 1

  • 对于任意非叶节点,其指针数必须满足[ceil(n/2), n]

  • 若非叶节点是根节点,则其指针数可以小于ceil(n/2),但至少包含两个指针,除非整棵树只有一个节点

  • 对于任意叶节点,其关键字数必须满足[ceil((n-1)/2), n-1]

  • 若叶节点是根节点,则其关键字数可以小于ceil((n-1)/2)

更新

关于B+树的查找、插入、删除操作,请参考本人github

https://github.com/butterflyl...

原文链接

https://segmentfault.com/a/11...

你可能感兴趣的:(数据结构,innodb,mysql)