Mysql之B+Tree

文章目录

  • B+Tree
  • 数据页

B+Tree

  1. Mysql没有选择B-Tree的原因

    • B-Tree每个结点都保存数据,每个结点的大小有限,这样会导致树的深度变高,从而导致磁盘I/O操作次数增加
    • 不能很好的利用操作系统读取磁盘的特性(操作系统每次读取4k的数据,以页为单位)
    • 不能很好的利用磁盘的预读能力(操作系统每次读取一页,会提前预读下一页或者下几页)
  2. 使用B+Tree

    • 非叶节点不保存数据相关信息,只保存关键字和子节点的指针,这样每个结点能存的很多关键字和子节点的指针,树的高度相对会变小
    • 关键字对应的数据保存在叶子节点中
    • 采用的是左闭合区间
    • 所有叶子节点之间都有一个双向指针,便于范围和分页查找
  3. Mysql B+Tree索引组织表图

    Mysql之B+Tree_第1张图片

  4. 从上图可以看出,加入每一行数据占用整个数据页(默认数据页大小16KB,能存储最大的数据小于16KB),那么B+Tree将退化为单链表,所以InnoDB规定了一个Page必须包含两行数据。也就是一行数据存储在Page上的大小小于8KB。

数据页

  1. 页(Page)是InnoDB存储引擎管理数据库的最小磁盘单位。
  2. 非叶子节点中的数据(User Record)占据Page的大部分空间,User Record由一条条的Record(行数据)组成,在一个单链表的内部,单链表的头尾由两条记录来表示,字符串形式的"Infimum"代表开头,"Supremum"表示结尾;
  3. User Record内部存储了四种格式的数据:
    • 主索引树非叶子节点
      • 子节点存储的主键里最小的值,这是B+树必须的,作用是在一个Page里定位到具体的记录的位置
      • 最小的值所在的Page的编号,作用是定位到对应的Record所在的Page
    • 主索引树叶子节点
      • 主键,B+树所必须的,也是数据行的一部分
      • 除去主键以外的所有列,这时数据行的除去主键的其他所有列的集合
    • 辅助索引树非叶子节点
      • 子节点里存储的辅助键值里的最小值,这时B+Tree必须的,作用是在一个Page里定位到具体记录的位置
    • 辅助索引树叶子节点
      • 辅助索引键值,是B+树必须的
      • 主键值,用来在主索引树里在做一次B+树检索来找到整条记录

你可能感兴趣的:(mysql)