事务
使用户定义的一个操作序列,这些操作要么全部失败,是一个不可分割的工作单位(构成单一逻辑工作单元的操作集合)
如果某一事务成功,则该事务中进行的所有数据更改均会提交,成为数据库中永久组成部分。
如果事务遇到错误且必须取消或者回滚,则所有更改均被清除。
事务的执行,要么成功,要么回滚。
MySQL服务器逻辑架构从上往下可以分为三层:
第一层:处理客户端连接、授权认证等
第二层:服务器层,负责查询语句的解析、优化、缓存以及内置函数的实现、存储过程等。
第三层:存储引擎,负责MySQL中数据的存储和提取
MySQL中服务器不管理事务,事务是由存储引擎实现的。MySQL支持事务的存储引擎有InnoDB、NDB Cluster等,其中InnoDB使用最为广泛;其他存储引擎不支持事务。
#开启一个事务
START TRANSACTION
[transaction_characteristic [, transaction_characteristic] ...]
#事务特点
transaction_characteristic: { WITH CONSISTENT SNAPSHOT | READ WRITE | READ ONLY }
BEGIN [WORK]
#提交
COMMIT [WORK] [AND [NO] CHAIN] [[NO] RELEASE]
#回滚
ROLLBACK [WORK] [AND [NO] CHAIN] [[NO] RELEASE]
#设置自动提交
SET autocommit = {0 | 1}
MySQL中默认采用的是自动提交模式,在自动提交模式下,每个sql语句都会被当作一个事务执行提交操作。
查看自动提交状态:
SHOW VARIABLES LIKE 'autocommit';
关闭自动提交
#值为1为开启,0为关闭
SET autocommit=0;
如果没有关闭自动提交,在执行增删改后,ROLLBACK是不能撤销操作的。
而如果关闭了自动提交,你需要在做出更改之后,使用COMMIT或者ROLLBACK提交或者撤销操作。(注意:自动提交关闭对DDL语言没有作用,例如:CREATE ,DROP 等操作)
在开启一个事务之后,自动提交会暂时的关闭
#执行事务
START TRANSACTION;
......
COMMIT/ROLLBACK;
使用 START TRANSACTION ,自动提交将保持禁用状态,直到您使用 COMMIT 或结束事务ROLLBACK 。自动提交模式然后恢复到其先前的状态。
#该语句标志着一个事务的开始
START TRANSACTION
启动事务后把所有后继的SQL语句看作事务组成的一部分,知道提交或者回滚事务为止。
语法:
START { TRAN | TRANSACTION }
[ { transaction_name | @tran_name_variable }
[ WITH MARK [ 'description' ] ] ]
#提交事务
COMMIT TRANSACTION;
COMMIT ;
提交事务后,事务结束,期间所作的操作将保存在数据库中,事务结束。
语法:
COMMIT { TRAN | TRANSACTION }
[ transaction_name | @tran_name_variable ] ]
注意:
在MySQL中,存在一些特殊的命令,如果在事务中执行了这些命令,会马上强制执行COMMIT提交事务;DDL语句(CREATE TABLE/DROP TABLE/ALTER TABLE) LOCK TABLES语句等等。
#回滚 撤销
ROLLBACK TRANSACTION ;
回滚事务后,事务结束,放弃事务期间所做的任何修改,事务结束。
该语句将显式事务或隐性事务回滚到事务的起点或事务内的某个保存点。(SAVAPOINT)
语法:
ROLLBACK { TRAN | TRANSACTION }
[ transaction_name | @tran_name_variable |savepoint_name | @savepoint_variable ]
SAVAPOINT:保存点是事务中的一点。用于撤销部分事务,当事务结束时,会自动删除该事务定义的所有保存点。当执行RILLBACK时,通过指定保存点可以退回到指定的点
语法:
#设置保存点
SAVEPOINT identifier
#回滚到保存点
ROLLBACK [WORK] TO [SAVEPOINT] identifier
#释放保存点
RELEASE SAVEPOINT identifier
保存点操作
#设置保存点
SAVEPOINT identifier
#取消部分事务
ROLLBACK [WORK] TO [SAVEPOINT] identifier
#取消全部事务
ROLLBACK
事务的ACID特性:
日志主要包括:
我们需要关注的是二进制日志(bin log)和事务日志(包括redo log和undo log)
InnoDB存储引擎提供了两种事务日志 :
其中redo log用于保证事务持久性;undo log则是事务原子性和隔离性实现的基础
原子性
是指事务作为一个整体,要么都做,要么都不做,如果事务中的一条sql语句执行失败,则已执行的语句会回滚,数据库退回到之前的状态。
实现原理 undo log(回滚日志)
在MySQL里数据每次修改前,都首先会把修改之前的数据作为历史保存一份到undo log 里面,数据里会记录操作该数据的事务ID,当事务执行失败或调用ROLLBACK,导致事务需要回滚,便可以利用undo log 中的信息将数据回滚到修改之前的状态.
回滚日志的分类:
insert undo log
代表事务在 insert 新记录时产生的 undo log, 只在事务回滚时需要,并且在事务提交后可以被立即丢弃
update undo log
事务在进行 update 或 delete 时产生的 undo log ; 不仅在事务回滚时需要,在快照读时也需要;所以不能随便删除,只有在快速读或事务回滚不涉及该日志时,对应的日志才会被 purge 线程统一清除
持久性
也成为永久性,指一个事务一旦提交,它对数据库中的数据的改变就应该是永久性的。接下来的其他操作或故障不应该对其执行结果产生影响。
刷脏
InnoDB提供了缓存(Buffer Pool),Buffer Pool中包含了磁盘中部分数据页的映射,作为访问数据库的缓冲:当从数据库读取数据时,会首先从Buffer Pool中读取,如果Buffer Pool中没有,则从磁盘读取后放入Buffer Pool;当向数据库写入数据时,会首先写入Buffer Pool,Buffer Pool中修改的数据会定期刷新到磁盘中(这一过程称为刷脏)
刷脏引发的问题
Buffer Pool的使用大大提高了读写数据的效率,但是也带了新的问题:如果MySQL宕机,而此时BufferPool中修改的数据还没有刷新到磁盘,就会导致数据的丢失,事务的持久性无法保证。解决这个问题通过redo log来解决。
实现原理:redo log
重做日志是一种基于磁盘的数据结构,用于在崩溃恢复期间纠正不完整事务写入的数据redo log采用的是WAL(Write-ahead logging,预写式日志),所有修改先写入日志。
事务操作成功后,数据库所处的状态和它的业务规则是一致的,数据库的完整性约束没有被破坏,事务执行的前后都是合法的数据状态。
数据库的完整性约束包括但不限于:实体完整性(如行的主键存在且唯一)、列完整性(如字段的类型、大小、长度要符合要求)、外键约束、用户自定义完整性(如转账前后,两个账户余额的和应该不变)。
一致性是事务追求的最终目标:原子性、持久性、隔离性,都是为了保证数据库状态的一致性。
隔离性
是指事务内部的操作与其他事务是隔离的,并发执行的各个事物之间不能互相干扰。研究的是不同事务之间的相互影响。
隔离性主要考虑的最简单的读操作
和写操作
隔离性的探讨,主要可以分为两个方面:
并发:多个人同时对一个对象进行操作
并发可能导致下面三类问题:
当前事务A中可以读到其他事务B未提交的数据(脏数据)、
在事务A中先后两次读取同一个数据,两次读取的数据结构不一样。
在事务A中按照某个条件先后两次查询数据库,所得到的数据条数不同
SQL标准中定义了四种隔离级别,并规定了每种隔离级别下上述几个问题是否存在。一般来说,隔离级别越低,系统开销越低,可支持的并发越高,但隔离性也越差
Y/N(可能/不可能)
隔离级别 | 脏读 | 不可重复读 | 幻读 |
---|---|---|---|
读未提交 | Y | Y | Y |
读已提交 | N | Y | Y |
可重复读 | N | N | Y |
可串行化 | N | N | N |
读未提交在并发时会导致很多问题,而性能相对于其他隔离级别提高却很有限,因此使用较少。
可串行化强制事务串行,并发效率很低,只有当对数据一致性要求极高且可以接受没有并发时使
用,因此使用也较少。在大多数数据库系统中,默认的隔离级别是读已提交(如Oracle)或可重复读(后文简称RR)。InnoDB默认的隔离级别是RR
查看当前事务级别
MySQL 5
SELECT @@tx_isolation;
MySQL 8
SELECT @@transaction_isolation ;
设置事务隔离级别
#设置read uncommitted级别:
SET SESSION TRANSACTION ISOLATION LEVEL READ UNCOMMITTED;
#设置read committed级别:
SET SESSION TRANSACTION ISOLATION LEVEL READ COMMITTED;
#设置repeatable read级别:
SET SESSION TRANSACTION ISOLATION LEVEL REPEATABLE READ;
#设置serializable级别:
SET SESSION TRANSACTION ISOLATION LEVEL SERIALIZABLE;
在MySQL默认是用的隔离级别为RR,解决了脏读和不可重复读问题
解决幻读问题是利用MVCC+行锁(排他锁)和间隙锁进行解决
MVCC全称Multi-Version Concurrency Control,即多版本的并发控制协议,MVCC 的目的就是多版本并发控制,在数据库中的实现,就是为了解决读写冲突。
当前读
像 select lock in share mode (共享锁), select for update; update; insert; delete (排他锁)这些操作都是一种当前读,为什么叫当前读?就是它读取的是记录的最新版本,读取时还要保证其他并发事务不能修改当前记录,会对读取的记录进行加锁
快照读
像不加锁的 select 操作就是快照读,即不加锁的非阻塞读;快照读的前提是隔离级别不是串行级别,串行级别下的快照读会退化成当前读;之所以出现快照读的情况,是基于提高并发性能的考虑,快照读的实现是基于多版本并发控制,即 MVCC ,可以认为 MVCC 是行锁的一个变种,但它在很多情况下,避免了加锁操作,降低了开销;既然是基于多版本,即快照读可能读到的并不一定是数据的最新版本,而有可能是之前的历史版本
MVCC 是为了实现读(快照读)-写冲突不加锁,而这个读指的就是快照读, 而非当前读,当前读实际上是一种加锁的操作,是悲观锁的实现。
MVCC实现原理主要是依赖记录中的 3个隐式字段,undo日志 ,Read View 来实现.
InnoDB存储引擎在每行数据的后面添加了三个隐藏字段
DB_ROW_ID:当表没有主键或唯一非空索引时,innodb就会使用这个行ID自动产生聚簇索引。如
果表有主键或唯一非空索引,聚簇索引就不会包含这个行ID了。这个DB_ROW_ID跟MVCC关系不大。
事务A(事务ID为2)对该记录做出了修改,将Honor列内容改为"fmvp":
Read View 是事务进行快照读操作的时候生产的读视图 (Read View),在该事务执行的快照读的那一刻,会生成数据库系统当前的一个快照,记录并维护系统当前活跃事务的 ID 。Read View 主要是用来做可见性判断的,把生成的读视图 (Read View)当作条件用来判断当前事务能够看到哪个版本的数据,既可能是当前最新的数据,也有可能是该行记录的undo log里面的某个版本的数据。
Read View遵循一个可见性算法,主要是将要被修改的数据的最新记录中的 DB_TRX_ID(即当前事务 ID)取出来,与系统当前其他活跃事务的 ID 去对比(由 Read View 维护)
当每个事务开启时,都会被分配一个 ID , 这个 ID 是递增的,所以最新的事务,ID 值越大
把 Read View 简单的理解成有三个全局属性
例如:
假设当前列表中的事务id为【80,100】
则根据low_limit_id新事务的ID就应该为101
锁是计算机在执行多线程或者线程时用于并发访问同一共享资源是的同步机制。
MySQL中的锁实在服务器层或者引擎层实现的,为了保证了数组访问的一致性和有效性。
锁机制的基本原理可以概括为:
基于MySQL 8
查看锁的事务
SELECT * FROM performance_schema.data_locks;
查看等待锁的事务
SELECT * FROM performance_schema.data_lock_waits
查看InnoDB的整体状态,包括锁的情况
show engine innodb status;
并发用户访问同一数据,锁机制可以避免数据不一致问题的发生
大致可分为下面几类
又称之为读锁,简称S锁,当事务A对数据加上读锁后,其他事务只能对该数据加读锁,不能做任何修改操作,也就是不能添加写锁。只有当事务A上的读锁被释放后,其他事务才能对其添加写锁。
应用场景
共享锁主要是为了支持并发的读取数据而出现的,读取数据时,不允许其他事务对当前数据进行修改操作,从而避免”不可重读”的问题的出现。
实现方式
select * from dept WHERE dept_id=50 LOCK IN SHARE MODE;
提交事务或者回滚事务后释放
又称之为写锁、独占锁,排它锁,简称X锁,当事务对数据加上写锁后,其他事务既不能对该数据添加读写,也不能对该数据添加写锁,写锁与其他锁都是互斥的。只有当前数据写锁被释放后,其他事务才能对其添加写锁或者是读锁。
MySQL InnoDB引擎默认update,delete,insert都会自动给涉及到的数据加上排他锁,select语句默认不会加任何锁类型。
应用场景
写锁主要是为了解决在修改数据时,不允许其他事务对当前数据进行修改和读取操作,从而可以有效避免”脏读”问题的产生。
实现方式
select * from dept WHERE dept_id=50 FOR UPDATE;
MyISAM和MEMORY存储引擎采用表级锁
InnoDB支持行级锁、表级锁,默认情况采用行级锁
乐观锁是相对悲观锁而言的,乐观锁假设数据一般情况下不会造成冲突,所以在数据进行提交更新的时
候,才会正式对数据的冲突与否进行检测,如果发现冲突了,则返回给用户错误的信息,让用户决定如
何去做。
应用场景
适用于读多写少,因为如果出现大量的写操作,写冲突的可能性就会增大,业务层需要不断重试,会大大降低系统性能。
实现方式
一般使用数据版本(Version)记录机制实现,在数据库表中增加一个数字类型的 “version” 字段来实现
悲观锁,正如其名,具有强烈的独占和排他特性,每次去拿数据的时候都认为别人会修改,对数据被外界(包括本系统当前的其他事务,以及来自外部系统的事务处理)修改持保守态度,因此,在整个数据处理过程中,将数据处于锁定状态。
应用场景:适用于并发量不大、写入操作比较频繁、数据一致性比较高的场景。
实现方式:select…for update是MySQL提供的实现悲观锁的方式,属于排它锁。
在MySQL中使用悲观锁,必须关闭MySQL的自动提交 set autocommit=0。共享锁和排它锁是悲观锁的不同的实现,它俩都属于悲观锁的范畴
当某组资源的两个或多个线程之间有循环相关性时,将发生死锁。
为避免死锁的发生,用户应该遵循以下原则: