13 - 为什么我删了一半的数据,表文件的大小却没有改变?

关键词

删除、重建表

0.引子

要了解为什么无法通过删除表数据来释放空间,就要理解 InnoDB 对此类操作的方式。

在开始之前,有一些小问题需要你注意:

  • 本节都是在 InnoDB 引擎下的讨论。
  • 在 8.0 版本之后,表结构的定义信息存放在系统数据表中,所以这里主要讨论的是表数据。
  • 参数 innodb_file_per_table 可以设置一个表是否单独建立一个 .ibd 的文件。建议你设置为 ON(默认)

1.数据删除的流程

1.1复用空间

在 InnoDB 中,使用 B+ 树进行索引,索引结构如下:

13-B+树索引示意图.png

假设,我们要删除 R4 这个记录,InnoDB 会将这个记录标记为删除,并在之后插入 ID 为 300 ~ 600 的数据时,复用这个位置。所以,磁盘文件的大小并不会缩小

同样的道理,如果你删除了整个数据页中的数据,整个数据页将可以被复用,而不会释放空间。即使你使用 delete 删除了表内的所有数据,也不会释放这些空间。

1.2结构空洞

你会发现,在磁盘中,很多空间被标记为“已删除”,但是它的空间并没有被释放,这在外部看来,就是数据的空洞

不仅是数据的删除,插入数据也会造成数据的空洞。在之前的文章中,我们介绍过了 B+树 索引节点上的空洞。实际上,在数据页中也很容易出现空洞,下面是一个因为数据插入导致数据页分裂而形成空洞的例子:

13-页分裂.png

所以,你可以发现,经过大量增删改的表,在结构上会存在空洞。所以,去除这些空洞,就可以收缩表空间。

这就要通过重建表来达到这个目的了。

2.重建表

你可以使用 alter table A engine=InnoDB 命令重建表,其过程如下:
13-重建表.png

你会发现,在这个过程中,会阻塞表的所有更新,也就是说,它不是 Online 的。在 5.6 之后的版本,引入了 Online DDL(依然是使用上面的语句重建),对这个流程做了优化。

相比于之前的操作,它添加了一个 row log ,用于记录所有对表 A 的操作,在重建之后,就会用该日志对新表进行修改:
13-Online DDL.png

在这个过程中,有些地方需要注意一下:

  • 在 state1 中,alter 语句会拿到这个表的 MDL写锁,在之后的 三个状态中,写锁会退化成读锁。
  • 无论如何,重建表都会使用大量的 IO 资源,所以你要避开业务高峰使用。

总结

  • 使用 delete 无法缩小表文件的大小。
  • 经过大量的增删,一个表会出现很多结构空洞。
  • 重建表可以收缩表空间,使用 alter table A engine=InnoDB 即可。

上期问题

在上期文章最后,我留给你的问题是,如果一个高配的机器,redo log 设置太小,会发生什么情况。

每次事务提交都要写 redo log,如果设置太小,很快就会被写满,也就是下面这个图的状态,这个“环”将很快被写满,write pos 一直追着 CP。
13-问题答案.jpg

这时候系统不得不停止所有更新,去推进 checkpoint。

这时,你看到的现象就是磁盘压力很小,但是数据库出现间歇性的性能下跌。

本期思考

假设现在有人碰到了一个“想要收缩表空间,结果适得其反”的情况,看上去是这样的:

  • 一个表 t 文件大小为 1TB;
  • 对这个表执行 alter table t engine=InnoDB;
  • 发现执行完成后,空间不仅没变小,还稍微大了一点儿,比如变成了 1.01TB。

你觉得可能是什么原因呢 ?


以上就是本节所有内容,希望你能避免空洞的生活。

注:本文章的主要内容来自我对极客时间app的《MySQL实战45讲》专栏的总结,我使用了大量的原文、代码和截图,如果想要了解具体内容,可以前往极客时间

你可能感兴趣的:(13 - 为什么我删了一半的数据,表文件的大小却没有改变?)