InnoDB查询一条记录原理

若要进行页的查找,则需要通过page directory。因为B+树查询记录只能查询到记录所在的页,而精确定位到记录在页中的位置,则需要通过page directory, 该功能有点类似书中的目录一样。

mysql 版本为 5.7.27 工具使用Synalyze It!

接下来简单说下Innodb的处理策略:

  1. 将所有正常的记录(包括最大和最小记录,不包括标记为已删除的记录)划分为几个组
  2. 每个组的最后一条记录的头信息中的n_owned属性表示该组内共有几条记录
  3. 将每个组的最后一条记录的地址偏移量按顺序存储起来,每个地址偏移量也被称为一个槽(英文名:Slot)。这些地址偏移量都会被存储到靠近页的尾部的地方,页中存储地址偏移量的部分也被称为Page Directory

实际数据进行分析:

CREATE TABLE `test` (
  `id` int(11) unsigned NOT NULL AUTO_INCREMENT,
  `t1` varchar(10) DEFAULT NULL,
  `t2` varchar(15) DEFAULT NULL,
  `t3` int(11) DEFAULT NULL,
  `t4` varchar(1500) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 ROW_FORMAT=COMPACT;

--创建数据的脚本
CREATE DEFINER=`root`@`localhost` PROCEDURE `insert_test`( )
BEGIN
  #Routine body goes here...

declare i int;
declare tmp int;
set i=1;
set tmp = 1;
while i<200 do
    if tmp=1 then
        insert into test (t1, t4) values('a', REPEAT('a', i)); 
        set tmp = 0;
    else
        insert into test (t1, t3, t4) values('a', i, REPEAT('a', i)); 
        set tmp = 1;
    end if;
    set i=i+1;
end while;
END

我们分析第6页的数据

直接定位如下图的位置:
定位方法可以学习该文章 InnoDB数据页结构分析

image.png

从上图中可以看到一共有14个字节,一个slot占用2个字节,所以一共有7个slot,也就是说一共有7个组,并且这页一共27条记录,从173-199为了便于分析,转成如下图:


  • 00 70 -> supremum记录所在行偏移量地址
  • 10 2C -> id为192的行偏移量地址
  • 0C C2 -> id为188的行偏移量地址
  • 09 68 -> id为184的行偏移量地址
  • 06 1E -> id为180的行偏移量地址
  • 02 E4 -> id为176的行偏移量地址
  • 00 63 -> infimum记录所在行偏移量地址

各个槽代表的记录的主键值都是从小到大排序的,所以我们可以使用二分法来进行快速查找。7个槽的编号分别是:0、1、2、3、4、5、6,所以初始情况下最低的槽就是low=0,最高的槽就是high=6。比方说我们想找主键值为193的记录,步骤如下:
​ 1. 首先得到中间槽的位置:(0 + 6)/2 = 3,所以得到槽3,根据槽3的地址偏移量知道它的主键值是184,因为184<193,设置low=3 ,high不变;
​ 2. 再次计算中间槽的位置:(3 + 6)/2 = 4,所以得到槽4,根据槽4的地址偏移量知道它的主键值是188, 因为188<194,设置low=4 ,high不变;
​ 3. 再再次计算中间槽的位置:(4 + 6)/2 = 5, 根据槽5的地址偏移量知道它的主键值是192, 因为192<194,设置low=5 ,high不变
4. 因为high - low的值为1,所以确定主键值为193的记录在槽5和槽6之间,接下来就是遍历链表的查找了;

page directory 由槽(slot )组成,每个槽占用两个字节,其指向的是记录在页中的偏移量。 page directory 中的槽根据指向记录的主键顺序逆序存放, 因此通过二叉查找算桂可以快速地定位到查询的记录。 然而, 为了提高存储以及插入的效率, InnoDB 存储引擎对于槽的设计采用了稀疏(sparse )方式。 不是页中的每一个记录都对应 个槽, 而是每个槽对应一个记录,同时每个记录都包含一个 4 位的 n owned 属性, 记录这个槽中拥有的记录数量。
每个槽总是包含 4-8 条记录, 例外的情况是第 1 槽仅包含 l 个记录, 即 infimum 记录本身。最后 1个槽可包含 1-8 个记录。

你可能感兴趣的:(InnoDB查询一条记录原理)