事务是数据库区别于文件系统的重要特性之一,当我们有了事务就会让数据库始终保持一致性
,同时我们还能通过事务的机制恢复到某个时间点
,这样可以保证已提交到数据库的修改不会因为系统崩溃而丢失。
SHOW ENGINES
命令来查看当前 MySQL 支持的存储引擎都有哪些,以及这些存储引擎是否支持事务。
能看出在 MySQL 中,只有InnoDB 是支持事务的。
Engine | Support | Comment | Transactions | XA | Savepoints |
---|---|---|---|---|---|
ARCHIVE | YES | Archive storage engine | NO | NO | NO |
BLACKHOLE | YES | /dev/null storage engine (anything you write to it disappears) | NO | NO | NO |
MRG_MYISAM | YES | Collection of identical MyISAM tables | NO | NO | NO |
FEDERATED | NO | Federated MySQL storage engine | null | null | null |
MyISAM | YES | MyISAM storage engine | NO | NO | NO |
PERFORMANCE_SCHEMA | YES | Performance Schema | NO | NO | NO |
InnoDB | DEFAULT | Supports transactions, row-level locking, and foreign keys | YES | YES | YES |
MEMORY | YES | Hash based, stored in memory, useful for temporary tables | NO | NO | NO |
CSV | YES | CSV storage engine | NO | NO | NO |
**事务:**一组逻辑操作单元,使数据从一种状态变换到另一种状态。
事务处理的原则:保证所有事务都作为 一个工作单元
来执行,即使出现了故障,都不能改变这种执行方
式。当在一个事务中执行多个操作时,要么所有的事务都被提交( commit
),那么这些修改就 永久
地保
存下来;要么数据库管理系统将 放弃
所作的所有 修改
,整个事务回滚( rollback
)到最初状态。
#案例:AA用户给BB用户转账100
update account set money = money - 100 where name = 'AA';
#服务器宕机
update account set money = money + 100 where name = 'BB';
合法性状态
变换到另外一个 合法性状态
。这种状态语义上
的而不是语法上的,跟具体的业务有关。预定的约束
的状态就叫做合法的状态。通俗一点,这状态是由你自己姓名
字段设置为唯一性约束
,这时当事务进行提交或者事务发生回滚的时候,如果数据表中的姓名不唯一,就破坏了事务的一致性要求。不能被其他事务干扰
,即一个事务内部的操作及使用的数据对 并发
的UPDATE accounts SET money = money - 50 WHERE NAME = 'AA';
UPDATE accounts SET money = money + 50 WHERE NAME = 'BB';
永久性的
,接下来的其他操作和数据库故障不应该对其有任何影响。事务日志
来保证的。日志包括了 重做日志
和 回滚日志
。当我们通过事务对数据进行修改的时候,首先会将数据库的变化信息记录到重做日志
中,然后再对数据库中对应的行进行修改。这样做的好处是,即使数据库系统崩溃,数据库重启后也能找到没有更新到数据库系统中的重做日志,重新执行,从而使事务具有持久性。总结
ACID是事务的四大特性,在这四个特性中,原子性是基础,隔离性是手段一致性是约束条件,而持久性是
我们的目的。数据库事务,其实就是数据库设计者为了方便起见,把需要保证
原子性
、隔离性
、一致性
和持久性
的一个或多个数据库操作称为一个事务。
我们现在知道 事务
是一个抽象的概念,它其实对应着一个或多个数据库操作,MySQL根据这些操作所执行的不同阶段把 事务
大致划分成几个状态:
活动的
状态。没有刷新到磁盘
时,我们就说该事务处在 部分提交的
状态。活动的
或者 部分提交的
状态时,可能遇到了某些错误(数据库自身的错误、操作系统错误或者直接断电等)而无法继续执行,或者人为的停止当前事务的执行,我们就说该事务处在 失败的
状态。失败的
状态,那么就需要把已经修改的事务中的操作还原到事务执行前的状态。换句话说,就是要撤销失败事务对当前数据库造成的影响。我们把这个撤销的过程称之为 回滚
。当 回滚
操作执行完毕时,也就是数据库恢复到了执行事务之前的状态,我们就说该事务处在了 中止的
状态。UPDATE accounts SET money = money - 50 WHERE NAME = 'AA';
UPDATE accounts SET money = money + 50 WHERE NAME = 'BB';
部分提交的
状态的事务将修改过的数据都 同步到磁盘
上之后,我们就可以说该事务处在了 提交的
状态。一个基本的状态转换图如下所示
图中可见,只有当事务处于提交的
或者中止的
状态时,一个事务的生命周期才算是结束了。对于已经提交的事务来说,该事务对数据库所做的修改将永久生效,对于处于中止状态的事务,该事务对数据库所做的所有修改都会被回滚到没执行该事务之前的状态。
使用事务有两种方式,分别为 显式事务 和 隐式事务 。
步骤1: START TRANSACTION 或者 BEGIN ,作用是显式开启一个事务
mysql> BEGIN;
#或者
mysql> START TRANSACTION;
START TRANSACTION 语句相较于 BEGIN 特别之处在于,后边能跟随几个 修饰符 :
① READ ONLY :标识当前事务是一个 只读事务 ,也就是属于该事务的数据库操作只能读取数据,而不
能修改数据。
补充:只读事务中只是不允许修改那些其他事务也能访问到的表中的数据,对于临时表来说(我们使用CREATE TMEPORARY TABLE创建的表),由于它们只能在当前会话中可见,所以只读事务其实也是可以对临时表进行增、删、改操作的。
② READ WRITE :标识当前事务是一个 读写事务 ,也就是属于该事务的数据库操作既可以读取数据,
也可以修改数据。
③ WITH CONSISTENT SNAPSHOT :启动一致性读。
**步骤2:**一系列事务中的操作(主要是DML,不含DDL)
**步骤3:**提交事务 或 中止事务(即回滚事务)
# 提交事务。当提交事务后,对数据库的修改是永久性的。
mysql> COMMIT;
# 回滚事务。即撤销正在进行的所有没有提交的修改
mysql> ROLLBACK;
# 将事务回滚到某个保存点。
mysql> ROLLBACK TO [SAVEPOINT]
MySQL中有一个系统变量 autocommit :
mysql> SHOW VARIABLES LIKE 'autocommit';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| autocommit | ON |
+---------------+-------+
1 row in set (0.01 sec)
当然,如果我们想关闭这种 自动提交 的功能,可以使用下边两种方法之一:
数据定义语言(Data definition language,缩写为:DDL)
隐式使用或修改mysql数据库中的表
事务控制或关于锁定的语句
① 当我们在一个事务还没提交或者回滚时就又使用 START TRANSACTION 或者 BEGIN 语句开启了
另一个事务时,会 隐式的提交 上一个事务。即:
② 当前的 autocommit 系统变量的值为 OFF ,我们手动把它调为 ON 时,也会 隐式的提交 前边语
句所属的事务。
③ 使用 LOCK TABLES 、 UNLOCK TABLES 等关于锁定的语句也会 隐式的提交 前边语句所属的事
务。
加载数据的语句
关于MySQL复制的一些语句
其它的一些语句
数据定义语言 (Data definition language,缩写为: DDL)
数据库对象,指的就是 数据库、表、 视图、存储过程 等结构。当我们使用CREATE、 ALTER、 DROP等语句去修改数据库对象时,就会隐式的提交前边语句`所属于的事务。即:
BEGIN:
SELECT... # 事务中的一条语句
UPDATE ...# 事务中的一条语句
# 事务中的其它语句ee.
CREATE TABLE ... # 此语句会隐式的提交前边语句所属于的事务
隐式使用或修改mysql数据库中的表
当我们使用ALTER USER、CREATE USER 、DROP USER 、GRANT 、RENAME USER、REVOKE、SET PASSWORD 等语句时也会隐式的提交前边语句所属于的事务。
事务控制或关于锁定的语句
①当我们在一个事务还没提交或者回滚时就又使用 START TRANSACTION或者BEGIN语句开启了另一个事务时,会 隐式的提交 上一个事务。即:
BEGIN:
... # 事务中的一条语句SELECT
UPDATE ..,# 事务中的一条语句
# 事务中的其它语句i.t
BEGIN; # 此语句会隐式的提交前边语句所属于的事务
② 当前的 autocommit系统变量的值为 OFF,我们手动把它调为 ON 时,也会隐式的提交前边语句所属的事务。
③使用 LOCK TLBLES、UNLOCK TABLES 等关于锁定的语句也会 隐式的提交 前边语句所属的事务。
加载数据的语句
使用 LOAD DATA 语句来批量往数据库中导入数据时,也会 隐式的提交 前边语句所属的事务
关于MySQL复制的一些语句
使用START SLAVE、STOP SLAVE、RESET SLAVE CHANGE MASTER TO等语句时会隐式的提交前边语句所属的事务。
当我们设置 autocommit=0 时,不论是否采用 START TRANSACTION 或者 BEGIN 的方式来开启事务,都需要用 COMMIT 进行提交,让事务生效,使用 ROLLBACK 对事务进行回滚。当我们设置 autocommit=1 时,每条 SQL 语句都会自动进行提交。 不过这时,如果你采用 START TRANSACTION 或者 BEGIN 的方式来显式地开启事务,那么这个事务只有在 COMMIT 时才会生效,在 ROLLBACK 时才会回滚
MyISAM不支持事务
链式事务,commit之后 即便没有写bigin 下面也开启了一个事务
你能看到相同的 SQL代码,只是在事务开始之前设置了 SET @@completion_type = 1;,结果就和我们第一次处理的一样,只有一个“张三”。这是为什么呢?
1、这里我讲解下 MySQL中 completion_type 参数的作用,实际上这个参数有3 种可能
completion=0,这是默认情况。当我们执行 COMMIT 的时候会提交事务,在执行下一个事务时,还需要使用 START TRANSACTION 或者 BEGIN 来开启。
2、completion=1,这种情况下,当我们提交事务后相当于执行了 COMMIT AND CHAIN,也就是开启一个链式事务,即当我们提交事务之后会开启一个相同隔离级别的事务。
3、completion=2,这种情况下 COMMIT=COMMIT AND RELEASE,也就是当我们提交后,会自动与服务器断开连接。
当我们设置autocommit=0 时,不论是否采用 START TRANSACTION 或者 BEGIN 的方式来开启事务,都需要用COMMIT 进行提交,让事务生效,使用 ROLLBACK 对事务进行回滚
当我们设置 autocommit=1 时,每条 SOL 语句都会自动进行提交。不过这时,如果你采用 START TRANSACTION 或者 BEGIN 的方式来显式地开启事务,那么这个事务只有在COMMIT 时才会生效,在 ROLLBACK 时才会回滚
BEGIN;
UPDATE user3 SET balance = balance - 100 WHERE NAME ='三';
UPDATE user3 SET balance = balance - 100 WHERE NAME ='三';
SAVEPOINT s1;设置保存点
UPDATE user3 SET balance = balance + 1 WHERE NAME = '三';
ROLLBACK TO s1;回滚到保存点
SELECT * EROM user3;
ROLLBACK; #回滚操作
SELECT * EROM user3;
MySQL是一个 客户端/服务器 架构的软件,对于同一个服务器来说,可以有若干个客户端与之连接,每个客户端与服务器连接上之后,就可以称为一个会话( Session )。每个客户端都可以在自己的会话中向服务器发出请求语句,一个请求语句可能是某个事务的一部分,也就是对于服务器来说可能同时处理多个事务。事务有 隔离性 的特性,理论上在某个事务 对某个数据进行访问 时,其他事务应该进行 排队 ,当该事务提交之后,其他事务才可以继续访问这个数据。但是这样对 性能影响太大 ,我们既想保持事务的隔离性,又想让服务器在处理访问同一数据的多个事务时 性能尽量高些 ,那就看二者如何权衡取舍了。
我们需要创建一个表:
CREATE TABLE student (
studentno INT,
name VARCHAR(20),
class varchar(20),
PRIMARY KEY (studentno)
) Engine=InnoDB CHARSET=utf8;
然后向这个表里插入一条数据:
INSERT INTO student VALUES(1, '小谷', '1班')
现在表里的数据就是这样的:
mysql> select * from student;
+-----------+--------+-------+
| studentno | name | class |
+-----------+--------+-------+
| 1 | 小谷 | 1班 |
+-----------+--------+-------+
1 row in set (0.00 sec)
针对事务的隔离性和并发性,我们怎么做取舍呢?先看一下访问相同数据的事务在 不保证串行执行 (也
就是执行完一个再执行另一个)的情况下可能会出现哪些问题:
对于两个事务 Session A、Session B,如果事务Session A 修改了 另一个 未提交 事务Session B 修改过 的数据,那就意味着发生了 脏写
时间编号 | Session A | Session B |
---|---|---|
1 | BEGIN; | |
2 | BEGIN; | |
3 | UPDATE student SET name = ‘李四’ WHERE students = 1; | |
4 | UPDATE studentSET name=‘张三’ WHERE students = 1; | |
5 | COMMIT; | |
6 | ROLLBACK; |
Session A和Session B各开启了一个事务,Session B中的事务先将studentno列为1的记录的name列更新为李四,然后Session A中的事务接着又把这条studentno列为1的记录的name列更新为张三,如果之后Session B中的事务进行了回滚,那么Session A中的更新也将不复存在,这种现象就称之为脏写。这时Session A中的事务就没有效果了,明明把数据更新了,最后也提交事务了,最后看到的数据什么变化也没有。这里大家对事务的隔离级比较了解的话,会发现默认隔离级别下,上面SessionA中的更新语句会处于等待状态,这里只是跟大家说明一下会出现这样现象。
对于两个事务 Session A、Session B,Session A 读取 了已经被 Session B 更新 但还 没有被提交 的字段。之后若 Session B 回滚 ,Session A 读取 的内容就是 临时且无效 的。
时间编号 | Session A | Session B |
---|---|---|
1 | BEGIN; | |
2 | BEGIN; | |
3 | UPDATE student SET name = ‘李四’ WHERE students = 1; | |
4 | SELECT * FROM student WHERE studentno = 1; # 如果读到了值为‘张三’,则意味着发生了脏读,因为B之后回滚了。 | |
5 | COMMIT; | |
6 | ROLLBACK; |
Session A和Session B各开启了一个事务,Session B中的事务先将studentno列为1的记录的name列更新为’张三’,然后Session A中的事务再去查询这条studentno为1的记录,如果读到列name的值为’张三’,而Session B中的事务稍后进行了回滚,那么Session A中的事务相当于读到了一个不存在的数据,这种现象就称之为 脏读
对于两个事务Session A、Session B,Session A 读取 了一个字段,然后 Session B 更新 了该字段。 之后Session A 再次读取 同一个字段, 值就不同 了。那就意味着发生了不可重复读。
时间编号 | Session A | Session B |
---|---|---|
1 | BEGIN; | |
2 | SELECT * FROM student WHERE studentno = 1; # 此时读到值’王五’ | |
3 | UPDATE student SET name = ‘张三’ WHERE students = 1; | |
4 | SELECT * FROM student WHERE studentno = 1; # 此时读到值’张三’,发生了不可重复读 | |
5 | UPDATE student SET name = ‘李四’ WHERE students = 1; | |
6 | SELECT * FROM student WHERE studentno = 1; # 此时读到值’李四’,发生了不可重复读 |
对于两个事务Session A、Session B, Session A 从一个表中 读取 了一个字段, 然后 Session B 在该表中 插入 了一些新的行。 之后, 如果 Session A 再次读取 同一个表, 就会多出几行。那就意味着发生了幻读。
时间编号 | Session A | Session B |
---|---|---|
1 | BEGIN; | |
2 | SELECT * FROM student WHERE studentno > 0; # 此时读到值’张三’ | |
3 | INSERT INTO student VALUE(2,‘李四’,‘2班’) | |
4 | SELECT * FROM student WHERE studentno > 0; # 此时读到值’张三’、'李四’两条记录,发生幻读 |
ession A中的事务先根据条件 studentno > 0这个条件查询表student,得到了name列值为’张三’的记录;之后Session B中提交了一个 隐式事务 ,该事务向表student中插入了一条新记录;之后Session A中的事务再根据相同的条件 studentno > 0查询表student,得到的结果集中包含Session B中的事务新插入的那条记录,这种现象也被称之为 幻读 。我们把新插入的那些记录称之为 幻影记录 。
注意1: 有的同学会有疑问,那如果 Session B 中删除了一些符合 studentno >的记录而不是插入新记录,那Session A之后再根据 studentno >8的条件读取的 记录变少了,这种现象算不算幻读呢? 这种现象 不属于幻读,幻读强调的是一个事务按照某个 相同条件多次读取 记录时,后读取时读到了之前 没有读到的记录。
注意2: 那对于先前已经读到的记录,之后又读取不到这种情况,算啥呢?这相当于对每一条记录都发生了 不可重复读的现象。幻读只是重点强调了读取到了之前读取没有获取到的记录。
上面介绍了几种并发事务执行过程中可能遇到的一些问题,这些问题有轻重缓急之分,我们给这些问题按照严重性来排一下序:
脏写 > 脏读 > 不可重复读 > 幻读
我们愿意舍弃一部分隔离性来换取一部分性能在这里就体现在:设立一些隔离级别,隔离级别越低,并发问题发生的就越多。 SQL标准 中设立了4个 隔离级别 :
SQL标准 中规定,针对不同的隔离级别,并发事务可以发生不同严重程度的问题,具体情况如下:
隔离级别 | 脏读可能性 | 不可重复读可能行 | 幻读可能性 | 加锁读 |
---|---|---|---|---|
READ UNCOMMITED | Yes | Yes | Yes | No |
READ COMMITED | No | Yes | Yes | No |
REPEATABLE READ | No | No | Yes | No |
SERIALIZABLE | No | No | No | Yes |
脏写 怎么没涉及到?因为脏写这个问题太严重了,不论是哪种隔离级别,都不允许脏写的情况发生。
不同的隔离级别有不同的现象,并有不同的锁和并发机制,隔离级别越高,数据库的并发性能就越差,4种事务隔离级别与并发性能的关系如下:
MySQL的默认隔离级别为REPEATABLE READ,我们可以手动修改一下事务的隔离级别。
# 查看隔离级别,MySQL 5.7.20的版本之前:
mysql> SHOW VARIABLES LIKE 'tx_isolation';
+---------------+-----------------+
| Variable_name | Value |
+---------------+-----------------+
| tx_isolation | REPEATABLE-READ |
+---------------+-----------------+
1 row in set (0.00 sec)
# MySQL 5.7.20版本之后,引入transaction_isolation来替换tx_isolation
# 查看隔离级别,MySQL 5.7.20的版本及之后:
mysql> SHOW VARIABLES LIKE 'transaction_isolation';
+-----------------------+-----------------+
| Variable_name | Value |
+-----------------------+-----------------+
| transaction_isolation | REPEATABLE-READ |
+-----------------------+-----------------+
1 row in set (0.02 sec)
#或者不同MySQL版本中都可以使用的:
SELECT @@transaction_isolation;
通过下面的语句修改事务的隔离级别:
SET [GLOBAL|SESSION] TRANSACTION ISOLATION LEVEL 隔离级别;
#其中,隔离级别格式:
> READ UNCOMMITTED
> READ COMMITTED
> REPEATABLE READ
> SERIALIZABLE
或者:
SET [GLOBAL|SESSION] TRANSACTION_ISOLATION = '隔离级别'
#其中,隔离级别格式:
> READ-UNCOMMITTED
> READ-COMMITTED
> REPEATABLE-READ
> SERIALIZABLE
关于设置时使用GLOBAL或SESSION的影响:
使用 GLOBAL 关键字(在全局范围影响):
SET GLOBAL TRANSACTION ISOLATION LEVEL SERIALIZABLE;
#或
SET GLOBAL TRANSACTION_ISOLATION = ‘SERIALIZABLE’;
则:
当前已经存在的会话无效,只对执行完该语句之后产生的会话起作用
使用 SESSION 关键字(在会话范围影响):
SET SESSION TRANSACTION ISOLATION LEVEL SERIALIZABLE;
#或
SET SESSION TRANSACTION_ISOLATION = ‘SERIALIZABLE’;
则:
对当前会话的所有后续的事务有效,如果在事务之间执行,则对后续的事务有效
该语句可以在已经开启的事务中间执行,但不会影响当前正在执行的事务
小结:数据库规定了多种事务隔离级别,不同隔离级别对应不同的干扰程度,隔离级别越高,数据一致性就越好,但并发性越弱
演示1. 读未提交之脏读
设置隔离级别为未提交读:
这里要灵活的理解读取
的意思,第一次select是读取,第二次的insert其实也属于隐式的读取,只不过是在mysql的机制中读取的,插入数据也是要先读取一下有没有主键冲突才能决定是否执行插入。
幻读,并不是说两次读取获取的结果集不同,幻读侧重的方面是某一次的select操作得到的结果所表征的数据状态无法支撑后续的业务操作。更为具体一些: select.某记录是否存在,不存在,准备插入此记录,但执行insert时发现此记录已存在,无法插入,此时就发生了幻读。
在RR隔离级别下,step1、step2是会正常执行的,step3则会报错主键冲突,对于事务1的业务来说是执行失败的,这里事务1就是发生了幻读,因为事务1在step1中读取的数据状态并不能支撑后续的业务操作,事务1:“见鬼了,我刚才读到的结果应该可以支持我这样操作才对啊,为什么现在不可以”。事务1不敢相信的又执行了step4,发现和setp1读取的结果是一样的(RR下的MVCc机制)。此时,幻读无疑已经发生,事务1无论读取多少次,都查不到id =3的记录,但它的确无法插入这条他通过读取来认定不存在的记录(此数据已被事务2插入),对于事务1来说,它幻读了。
其实RR也是可以避免幻读的,通过对select操作手动加行X锁(独占锁)
(SELECT … FOR UPDATE 这也正是SERIALIZABLE隔离级别下会隐式为你做的事情)。同时,即便当前记录不存在,比如id = 3是不存在的,当前事务也会获得一把记录锁(因为InnoDB的行锁锁定的是索引,故记录实体存在与否没关系,存在就加行X锁,不存在就加间隙锁),其他事务则无法插入此索引的记录,故杜绝了幻读。
在SERIALIZABLE隔离级别
下,step1执行时是会隐式的添加行(X)锁
/gap(X)锁
的,从而step2会被阻塞,
step3会正常执行,待事务1提交后,事务2才能继续执行(主键冲突执行失败),对于事务1来说业务是正确的,成功的阻塞扼杀了扰乱业务的事务2,对于事务1来说他前期读取的结果是可以支撑其后续业务的。
所以MySQL的幻读并非什么读取两次返回结果集不同,而是事务在插入事先检测不存在的记录时,惊奇的发现这些数据已经存在了,之前的检测读获取到的数据如同鬼影一般。
从事务理论的角度来看,可以把事务分为以下几种类型:
扁平事务(Flat Transactions)
带有保存点的扁平事务(Flat Transactions with Savepoints)
链事务(Chained Transactions)
嵌套事务(Nested Transactions)
分布式事务(Distributed Transactions)
下面分别介绍这几种类型:
链事务 是指一个事务由多个子事务链式组成,它可以被视为保存点模式的一个变种。带有保存点的扁平事务,当发生系统崩溃时,所有的保存点都将消失,这意味着当进行恢复时,事务需要从开始处重新执行,而不能从最近的一个保存点继续执行。链事务的思想 是:在提交一个事务时,释放不需要的数据对象,将必要的处理上下文隐式地传给下一个要开始的事务,前一个子事务的提交操作和下一个子事务的开始操作合并成一个原了操作,这意味着下一个事务将看到上一个事务的结果,就好像在一个事务中进行一样。这样,在提交子事务时就可以释放不需要的数据对象,而不必等到整个事务完成后才释放。
链事务与带有保存点的扁平事务的不同之处体现在:
1、带有保存点的扁平事务能回滚到任意正确的保存点,而链事务中的回滚仅限于当前事务,即只能恢复到最近的一个保存点。
2、对于锁的处理,两者也不相同,链事务在执行COMMIT后即释放了当前所持有的锁,而带有保存点的扁平事务不影响迄今为止所持有的锁。