什么是事务(Transaction)
事务是指一组操作集合,这一组操作执行完成之后必须满足 ACID 特性。
- 原子性(Atomic): 一组操作要么全部执行成功,要么全部执行失败;
- 一致性(Consistency): 事务执行成功后,数据必须保持一致。例如转账事务,不管有多少个转账并发,户头的钱款总数还是固定一致的;
- 隔离性(Isolation): 并发事务所作的修改必须与任何其它并发事务所作的修改隔离。串行处理事务能保证绝对的隔离,但考虑到性能的问题,可以适当降低隔离程度以提高并发效率;
- 持久性(Duration): 事务执行后,对数据的影响是永久性的,即使系统出现故障也会继续保持。
对于数据库事务((Database Transaction),这一组操作集合就是指多个SQL语句。这组SQL语句执行时需要保证ACID的特性。
什么是事务隔离?
一个事务要保证ACID的特性,事务隔离就是指其中的隔离性(Isolation)。
隔离性越高,系统吞吐量越低。
所以我们在考虑事务隔离问题时,本质上是在考虑一个trade off的问题:
- 隔离性
- 吞吐量
事务隔离的级别
事务隔离的级别有四个级别:
- Read Uncommitted
- Read Committed
- Repeatable Read
- Serializable
这四个级别的主要区分在于:
一个事务执行时能否读取到其他事务对数据所做的修改。
PS: 最好的理解事务隔离级别的方式就是从隔离方式的命名去理解。
第一级别:Read Uncommitted
Read Uncommitted,当前事务读取到其他未提交(uncommitted)的事务所做的数据更新。
这种现象通常也叫作 脏读 (Dirty Read)
。
#首先,修改隔离级别
set tx_isolation='READ-UNCOMMITTED';
select @@tx_isolation;
+------------------+
| @@tx_isolation |
+------------------+
| READ-UNCOMMITTED |
+------------------+
#事务A:启动一个事务
start transaction;
select * from tx;
+------+------+
| id | num |
+------+------+
| 1 | 1 |
| 2 | 2 |
| 3 | 3 |
+------+------+
#事务B:也启动一个事务(那么两个事务交叉了)
#在事务B中执行更新语句,且不提交
start transaction;
update tx set num=10 where id=1;
select * from tx;
+------+------+
| id | num |
+------+------+
| 1 | 10 |
| 2 | 2 |
| 3 | 3 |
+------+------+
#事务A:那么这时候事务A能看到这个更新了的数据吗?
select * from tx;
+------+------+
| id | num |
+------+------+
| 1 | 10 | --->可以看到!说明我们读到了事务B还没有提交的数据
| 2 | 2 |
| 3 | 3 |
+------+------+
#事务B:事务B回滚,仍然未提交
rollback;
select * from tx;
+------+------+
| id | num |
+------+------+
| 1 | 1 |
| 2 | 2 |
| 3 | 3 |
+------+------+
#事务A:在事务A里面看到的也是B没有提交的数据
select * from tx;
+------+------+
| id | num |
+------+------+
| 1 | 1 | --->脏读意味着我在这个事务中(A中),事务B虽然没有提交,但它任何一条数据变化,我都可以看到!
| 2 | 2 |
| 3 | 3 |
+------+------+
第二级别:Read Committed
Read committed,当前事务读取到其他已提交(committed)的事务所做的数据更新。
该隔离级别会带来另一个现象,不可重复读(Non-repeatable Read)
,是指一个事务执行期间,因为其他事务所做的数据更新,可能会存在多次读取数据不一致的现象。
目前,该级别通常是大部分数据库的默认隔离级别。 Mysql是例外,它的隔离级别是第三级别,后续会有介绍。
#首先修改隔离级别
set tx_isolation='read-committed';
select @@tx_isolation;
+----------------+
| @@tx_isolation |
+----------------+
| READ-COMMITTED |
+----------------+
#事务A:启动一个事务
start transaction;
select * from tx;
+------+------+
| id | num |
+------+------+
| 1 | 1 |
| 2 | 2 |
| 3 | 3 |
+------+------+
#事务B:也启动一个事务(那么两个事务交叉了)
在这事务中更新数据,且未提交
start transaction;
update tx set num=10 where id=1;
select * from tx;
+------+------+
| id | num |
+------+------+
| 1 | 10 |
| 2 | 2 |
| 3 | 3 |
+------+------+
#事务A:这个时候我们在事务A中能看到数据的变化吗?
select * from tx; --------------->
+------+------+ |
| id | num | |
+------+------+ |
| 1 | 1 |--->并不能看到! |
| 2 | 2 | |
| 3 | 3 | |
+------+------+ |——>相同的select语句,结果却不一样
|
#事务B:如果提交了事务B呢? |
commit; |
|
#事务A: |
select * from tx; --------------->
+------+------+
| id | num |
+------+------+
| 1 | 10 |--->因为事务B已经提交了,所以在A中我们看到了数据变化
| 2 | 2 |
| 3 | 3 |
+------+------+
第三级别:Repeatable Read
Repeatable Read,当前事务读取不到其他事务所做的数据更新。事务执行阶段内某段范围内的数据,无论读取多少次都是一样(Repeatable)的。
该隔离级别存在另一个问题,幻读(Phantom Read)
, 是指事务执行期间可能读取到其他事务的新增数据
的现象。 例如同一条SQL语句,select * from table where id>10 ,第一次执行读出来5条,第二次执行可能读出来6条。
目前,主流的数据库(Mysql、Oracle)都通过多版本并发控制(MVCC,Multiversion Concurrency Control)机制解决了该问题。
#首先,更改隔离级别
set tx_isolation='repeatable-read';
select @@tx_isolation;
+-----------------+
| @@tx_isolation |
+-----------------+
| REPEATABLE-READ |
+-----------------+
#事务A:启动一个事务
start transaction;
select * from tx;
+------+------+
| id | num |
+------+------+
| 1 | 1 |
| 2 | 2 |
| 3 | 3 |
+------+------+
#事务B:开启一个新事务(那么这两个事务交叉了)
在事务B中更新数据,并提交
start transaction;
update tx set num=10 where id=1;
select * from tx;
+------+------+
| id | num |
+------+------+
| 1 | 10 |
| 2 | 2 |
| 3 | 3 |
+------+------+
commit;
#事务A:这时候即使事务B已经提交了,但A能不能看到数据变化?
select * from tx;
+------+------+
| id | num |
+------+------+
| 1 | 1 | --->还是看不到的!(这个级别2不一样,也说明级别3解决了不可重复读问题)
| 2 | 2 |
| 3 | 3 |
+------+------+
#事务A:只有当事务A也提交了,它才能够看到数据变化
commit;
select * from tx;
+------+------+
| id | num |
+------+------+
| 1 | 10 |
| 2 | 2 |
| 3 | 3 |
+------+------+
第四级别:Serializable
Serializable,事务串行执行,每次执行事务都对相关的数据加锁(一般来说是共享锁,其他事务可读不可写)。
该级别虽然不存在前面是三个级别提到的 脏读、不可重复读、幻读等问题,但同时由于存在大量的锁竞争,会使得吞吐量下降。
#首先修改隔离界别
set tx_isolation='serializable';
select @@tx_isolation;
+----------------+
| @@tx_isolation |
+----------------+
| SERIALIZABLE |
+----------------+
#事务A:开启一个新事务
start transaction;
#事务B:在A没有commit之前,这个交叉事务是不能更改数据的
start transaction;
insert tx values('4','4');
ERROR 1205 (HY000): Lock wait timeout exceeded; try restarting transaction
update tx set num=10 where id=1;
ERROR 1205 (HY000): Lock wait timeout exceeded; try restarting transaction
总结
当然,目前Repeatable Read级别也通过MVCC机制解决了幻读的现象。
MVCC机制可以在不需要使用锁的情况下完成并发读写,具体实现机制待更新。(▽)