Postgresql vacuum 和 vacuum full

转载自 https://www.modb.pro/db/63663

dead tuples
tuple:元组,也就是一行数据

首先,简要解释什么是"死元组"和"膨胀".

当您在PostgreSQL中执行DELETE时,行不会立即从数据文件中删除.而是仅通过在页头中设置xmax字段将其标记为已删除.同样对于UPDATE,它可能在PostgreSQL中被视为DELETE+INSERT.

这是PostgreSQL MVCC背后的基本思想之一,因为它允许更大并发,在不同的进程之间最小的锁定.这个MVCC实现的缺点是留下了已删除的元组,即使在所有可能看到这些版本的事务完成之后也是如此.

如果没有清理,那些"死元组"(对于任何事务实际上是不可见的)将永远留在数据文件中.对于DELETE和UPDATE比较多的的表,死元组可能占据很多磁盘空间.同时,死元组也将从索引中引用,进一步增加了浪费的磁盘空间量.这就是我们在PostgreSQL中称之为“膨胀”的东西,同时因为查询也会变慢。

下面主要介绍vacuum清理dead tuples的过程。 在清理dead tuples时,系统有两种处理方式:vacuum 和 vacuum full。主要区别在如下:

vacuum
只是把表中的dead tuples进行删除标记,并没有真正物理删除;vacuum过程中,可以正常访问数据表
vacuum full
物理删除表中的dead tuples,释放空间给操作系统;vacuum full过程中,表被锁定,不允许访问
Postgresql vacuum 和 vacuum full_第1张图片

Vacuum 做了什么
1 扫描所有表,或者特殊表,得到dead tuples

2 如果需要会固化需要清理的dead tuples

3 清理与dead tuples有关的index tuple

4 清理页面中的dead tuples 并将清理后的空间释放

5 更新对应表的FSM 和 VM 文件

6 更新相关的系统表

Vacuum FULL 做了什么

1 对于表使用了独占锁 exclusive lock

2 创建一个并行的空的存储文件

3 将目前的标记为存活的tuples(行)拷贝到了新的存储中(其实就是新的物理文件)

4 在将原有的数据都拷贝后,开始释放原有的存储数据的文件

5 释放独占锁

你可能感兴趣的:(数据库,数据库设计,postgresql,数据库)