redo log
是InnoDB存储引擎层的日志,又称重做日志文件,是物理日志。redo log
记录数据修改后新数据的备份、冗杂的undo log
、未提交的事务和回滚的事务,数据缓存到内存中,只是在事务提交前将redo log
持久化到磁盘
redo log
可以保证即使数据库发生异常重启,之前提交的记录都不会丢失,保证了事务的持久性。当有一条记录需要更新的时候,InnoDB引擎就会先把记录写到
redo log
中,并更新内存。之后,InnoDB引擎会在适当的时候,将这个操作更新到磁盘中,这个更新是在系统比较空闲的时候做,他的关键点是先写日志,再写磁盘。**
redo log
**日志大小是固定的,若空间满了以后会回到头部停止更新,先加载一些数据到磁盘让出文件空间,之后继续写入
物理日志:因为
mysql
数据最终是保存在数据页中的,物理日志记录的就是数据页变更。
为了保证Redo Log能够有比较好的IO性能,InnoDB 的 Redo Log的设计有以下几个特点:
尽量保持Redo Log
存储在一段连续的空间上。因此在系统第一次启动时就会将日志文件的空间完全分配。以顺序追加的方式记录Redo Log,通过顺序IO来改善性能。
redo log包括两部分:一是内存中的日志缓冲(redo log buffer),该部分日志是易失性的;二是磁盘上的重做日志文件(redo log file),该部分日志是持久的。日志并不是直接写入文件的,而是先写入日志缓冲,当需要将日志刷新到磁盘时(如事务提交),将许多日志一起写入磁盘.
并发的事务共享Redo Log
的存储空间,它们的Redo Log
按语句的执行顺序**,依次交替的记录在一起,以减少日志占用的空间。所以,当一个事务将Redo Log写入磁盘时,也会将其他未提交**的事务的日志写入磁盘。
Redo Log
上只进行顺序追加的操作,当一个事务需要回滚时,它的Redo Log
记录也不会从Redo Log
中删除掉。
注意:
一般在事务提交之前会将redo log
持久化到磁盘中,以此来保证持久性
binlog
是属于MySQL Server层面的,又称为归档日志,属于逻辑日志,是以二进制的形式记录的是这个语句的原始逻辑,依靠binlog
是没有CrashSafe
能力的
逻辑日志:可以简单理解为记录的就是sql语句。
binlog
主要使用场景:主从复制
,数据恢复
主从复制:在Master
端开启binlog
,然后将binlog
发送到各个Slave
端,Slave
端重放binlog
从而达到主从数据一致。
数据库恢复方法
系统会定期整库备份,binlog会记录所有的逻辑操作,当需要恢复到指定的某一时刻时:
为什么 redo log 具有 crash-safe 的能力,而 binlog 没有?
**CrashSafe
**指MySQL服务器宕机重启后,能够保证:
- 所有已经提交的事务的数据仍然存在。
- 所有没有提交的事务的数据自动回滚。
当数据库 crash(崩溃) 后,想要恢复未刷盘但已经写入 redo log
和 binlog
的数据到内存时,binlog
是无法恢复的。虽然 binlog
拥有全量的日志,但没有一个标志让 innoDB 判断哪些数据已经刷盘,哪些数据还没有。
但 redo log
不一样,只要刷入磁盘的数据,都会从 redo log
中抹掉,数据库重启后,直接把 redo log
中的数据都恢复至内存就可以了。这就是为什么 redo log
具有crash-safe
的能力,而binlog
不具备。
redo log 和 binlog的区别:
binlog
是逻辑日志,记录的是这个更新语句的原始逻辑首先进行sql查询语句的执行流程,如需 update ID = 2 ,先找到这一行,执行以下流程:
为什么update语句 要有两阶段提交?
这是为了让两份日志之间的逻辑一致。
当执行update语句时,数据修改完更新到内存,先写redo log
并设置redo log
为准备阶段,再写binlog
,写完binlog
设置为redo log
为结束阶段。两个中间有一个写入差错,那么该操作都是失败,即redo log
发现只有准备阶段没有结束,那么会将该条事务进行回滚。
假如不采用两阶段提交机制的话那么会有什么影响呢?
(1)先写redo log
:当写完redo log设备断电,binlog
没有记录,那么数据库刚刚启动之后通过redo log
可以恢复到断电前的状态,但是由于binlog
没有写入,当从某个节点进行恢复时(或者创建一个备份库),那么binlog没用这条记录,恢复出来的数据库是有错误的。
(2)先写binlog
:当写完binlog
设备断电,redo log
没有记录,还没有写入磁盘,那么数据库重新启动之后通过redo log
恢复并没有这条数据,而当从某个时间点进行恢复(或者创建一个备份库)时,binlog
有相关数据,所以会导致数据不统一。
Undo Log 是为了实现事务的原子性,事务中执行失败,进行回滚,在MySQL数据库 InnoDB
存储引擎中,还用Undo Log
来实现多版本并发控制(简称:MVCC
)。由引擎层的InnoDB引擎实现,是逻辑日志,记录数据修改被修改前的值。
原理:
Undo Log的原理很简单,为了满足事务的原子性,在操作任何数据之前,首先将数据备份到Undo Log。然后进行数据的修改。如果出现了错误或者用户执行了ROLLBACK语句,系统可以利用Undo Log中的备份将数据恢复到事务开始之前的状态。
回滚时机?
- 用户调用 rollback 主动回滚
- 事务出错
- 辅助 redo log 实现事务持久性
当事务提交的时候,innodb
不会立即删除undo log
,因为后续还可能会用到undo log
,如隔离级别为repeatable read
时,事务读取的都是开启事务时的最新提交行版本,只要该事务不结束,该行版本就不能删除,即undo log不能删除。
但是在事务提交的时候,会将该事务对应的undo log
放入到删除列表中,未来通过purge来删除。并且提交事务时,还会判断undo log
分配的页是否可以重用,如果可以重用,则会分配给后面来的事务,避免为每个独立的事务分配独立的undo log
页而浪费存储空间和性能。
undo log
主要分为两种:
undo log
, 只在事务回滚时需要,并且在事务提交后可以被立即丢弃。undo log
; 不仅在事务回滚时需要,在快照读时也需要;所以不能随便删除,只有在快速读或事务回滚不涉及该日志时,对应的日志才会被 purge 线程统一清除purge
从前面的分析可以看出,为了实现 InnoDB 的 MVCC 机制,更新或者删除操作都只是设置一下老记录的 deleted_bit ,并不真正将过时的记录删除。
为了节省磁盘空间,InnoDB 有专门的 purge 线程来清理 deleted_bit 为 true 的记录。为了不影响 MVCC 的正常工作,purge 线程自己也维护了一个read view(这个 read view 相当于系统中最老活跃事务的 read view );如果某个记录的 deleted_bit 为 true ,并且 DB_TRX_ID 相对于 purge 线程的 read view 可见,那么这条记录一定是可以被安全清除的。
除了可以保证事务的原子性,Undo Log也可以用来辅助完成事务的持久化,如数据库异常之后的恢复机制。
因为未提交的事务和回滚了的事务也会记录在Redo Log
,因此在进行恢复时,这些事务要进行特殊的的处理。有2种不同的恢复策略:
A. 进行恢复时,只重做已经提交了的事务。
B. 进行恢复时,重做所有事务包括未提交的事务和回滚了的事务。然后通过Undo Log回滚那些未提交的事务。
MySQL数据库InnoDB存储引擎使用了B策略,InnoDB
存储引擎中的恢复机制有几个特点:
Undo Log回滚那些未提交的事务,被回滚了的事务在恢复时先redo
再undo
,也不会破坏数据的一致性
必须要在写Redo Log
之前将对应的Undo Log
写入磁盘。为了降低复杂度,InnoDB将Undo Log
看作数据,因此记录Undo Log
的操作也会记录到redo log
中。这样undo log就可以象数据一样缓存起来,而不用在redo log
之前写入磁盘了。
参考:
极客时间 mysql45讲
https://www.qiancheng.me/post/coding/mysql-001
说说MySQL中的Redo log Undo log都在干啥 - 苏家小萝卜 - 博客园 (cnblogs.com)
详细分析MySQL事务日志(redo log和undo log) - 骏马金龙 - 博客园 (cnblogs.com)
MySQL事务日志undo log和redo log分析