MYSQL(02)-事务原理

ACID模型

MYSQL传统关系数据库的ACID模型有以下特性

  • Atomicity原子性:一个事务中所有操作都必须全部完成,要么全部不完成。
  • Consistency一致性. 在事务开始或结束时,数据库应该在一致状态。
  • Isolation隔离性. 事务将假定只有它自己在操作数据库,彼此不知晓。
  • Durability持久性.一旦事务完成,就不能返回。

MYSQL-ACID模型的实现原理如下

  • 事务的原子性是通过 undo log 来实现的
  • 事务的持久性性是通过 redo log 来实现的
  • 事务的隔离性是通过 (读写锁+MVCC)来实现的
  • 而事务的终极大 boss 一致性是通过原子性,持久性,隔离性来实现的!!!

下面就逐一介绍其实现原理

原子性(Atomicity)原理

一个事务必须被视为不可分割的最小工作单位,一个事务中的所有操作要么全部成功提交,要么全部失败回滚,对于一个事务来说不可能只执行其中的部分操作,这就是事务的原子性。

数据库是通过回滚操作来实现原子性的。 所谓回滚操作就是当发生错误异常或者显式的执行rollback语句时需要把数据还原到原先的模样,所以这时候就需要用到undo log来进行回滚。undo log 就是用于记录更新或新增操作之前的数据状态,当出现需要回滚的情况时,将原数据刷回到数据库中,从而保证操作的原子性,具体实现方式如下:

上面从银行账户转账到理财账户的操作步骤如下

  • 1.事务开始
  • 2.查询数据
  • 3.进行update操作,balance=balance-400;
  • 4.记录zhangsan(1000)到undo log 日志中,回滚时需要将数据更新回来
  • 5.进行update操作,amount=amount+400;
  • 6.记录amount(0)到undo log日志中,回滚的时候需要将数据刷新回来
  • 7.事务提交/回滚

持久性(Durability)原理

事务一旦提交,其所作做的修改会永久保存到数据库中,此时即使系统崩溃修改的数据也不会丢失。
MySQL的数据存储,表数据是存放在磁盘上的,因此想要存取的时候都要经历磁盘IO,然而即使是使用SSD磁盘IO也是非常消耗性能的。 为此,为了提升性能InnoDB提供了缓冲池(Buffer Pool),Buffer Pool中包含了磁盘数据页的映射,可以当做缓存来使用:

  • 读数据:会首先从缓冲池中读取,如果缓冲池中没有,则从磁盘读取在放入缓冲池;
  • 写数据:会首先写入缓冲池,缓冲池中的数据会定期同步到磁盘中;

上面这种缓冲池的措施虽然在性能方面带来了质的飞跃,但是它也带来了新的问题,当MySQL系统宕机,断电的时候可能会丢数据!因为我们的数据已经提交了,但此时是在缓冲池里头,还没来得及在磁盘持久化,所以我们急需一种机制需要存一下已提交事务的数据,为恢复数据使用。redo log就派上用场了。

redo log来记录已成功提交事务的修改信息,并且会把redo log持久化到磁盘,系统重启之后在读取redo log恢复最新数据。

隔离性(Isolation)原理

Mysql 隔离级别有以下四种(级别由低到高):

  • READ UNCOMMITED (读未提交)
  • READ COMMITED (读提交)
  • REPEATABLE READ (可重复读)
  • SERIALIZABLE (串行化)

隔离性是要管理多个并发读写请求的访问顺序。 这种顺序包括串行或者是并行,从隔离性的实现可以看出这是一场数据的可靠性与性能之间的权衡,可靠性性高的,并发性能低(比如 Serializable),可靠性低的,并发性能高(比如 Read Uncommited),不同的隔离级别会有不同的问题

- 脏读 不可重复读 幻读
读未提交
读已提交 ×
不可重复读 × ×
串行化 × × ×
  • 脏读:事务中读取到了其他事务没有提交的数据,主要是读写完全没有加锁造成的
  • 不可重复读:事务中多次读取结果不一致,因为多次读取中间,其他事务修改并提交了数据(主要原因是修改)
  • 幻读:事务中多次范围读取结果不一致,因为多次读取中间,其他事务修改并提交了数据(主要原因是新增/删除)

读未提交(READ UNCOMMITED)

:在该隔离级别下,事务中的修改即使还没提交,对其他事务是可见的。其他事务可以读取其未提交的数据,造成脏读。:因为读不会加任何锁,所以写操作在读的过程中修改数据,所以会造成脏读。好处是可以提升并发处理性能,能做到读写并行。

读提交(READ COMMITTED)

:在该隔离级别下,事务中的修改如果还没提交,对其他事务是不可见的。不会造成脏读,但是多次读取会造成数据不一致的情况,会有不可重复度的问题,例如:一个事务中两次读取,在这中间他事务进行了一个更新并提交,那么两次读取的内容会不一样。:InnoDB在该隔离级别下读取数据不加锁而是使用了MVCC机制(详情如下)

可重复读 (REPEATABLE READ)

Mysql隔离级别。在一个事务内的多次读取的结果是一样的。这种级别下可以避免,脏读,不可重复读等查询问题,Innodb可以解决还可以解决幻读问题。Mysql 有两种机制可以达到这种隔离级别的效果,分别是采用读写锁和MVCC机制来实现。

  • 采用MVCC的实现:使用 的方式支持并行读写并行内部使用MVCC原理(后面介绍)
  • 采用锁的实现:使用 对于SELECT... FOR UPDATE ,SELECT ... LOCK IN SHARE MODE 等情况使用的是加锁解决机制(记录锁,间隙锁等实现)

串行化(SERIALIZABLE)

  • 该隔离级别理解起来最简单,实现也最单。在隔离级别下除了不会造成数据不一致问题,没其他优点。

MVCC (多版本控制)

MVCC (MultiVersion Concurrency Control) 叫做多版本并发控制,主要是针对事务中并行普通读取的优化。
InnoDB在实现的 MVCC的时候使用一致性视图来保证RC(读提交),和RR(可重复读)事务隔离级别的实现 ,是事务开启时,对整个库创建快照(read view),是通过每行记录的后面保存两个隐藏的列来实现的。这两个列, 一个保存了行的创建时间,一个保存了行的过期时间, 当然存储的并不是实际的时间值,而是系统版本号。每当修改数据时,版本号加一。当事务读取时,如果数据的当前版本号大于自己的事务,则查询的时候抛弃。从而实现不加锁读进而做到读写并行。MVCC在mysql中的实现依赖的是undo log与read view

  • undo log :undo log 中记录某行数据的多个版本的数据。
  • read view :用来判断当前版本数据的可见性

在不同的隔离级别下,MVCC创建read view历史版本的时机也是不同的

  • 在读提交隔离级别下:视图 read-view的创建是在语句执行的时候创建的
  • 在可重复读隔离级别下:视图 read-view的创建是在事务启动的时候创建的

幻读问题详解

幻读在业务中存在两种情况,快照读,和当前读,MVCC策略能够解决快照读的问题,但是对于当前读则需要使用间隙锁。是指读取数据库中最新版本的数据,在多个update的时候不能基于快照读。读取历史版本的数据进行更新,会导致数据不一致问题

  • 快照读:当使用普通select * 进行统计的时候,使用MVCC可以保证幻读问题
  • 当前读:当使用select for update 或者 select ... lock in share mode 操作的时候,insert,update,delete等操作都会被阻塞。当前读是通过手动加record lock(记录锁)和gap lock(间隙锁 )来实现的

你可能感兴趣的:(MYSQL(02)-事务原理)