在处理并发读或者写时,可以通过实现一个由两种类型的锁组成的锁系统来解决问题。这两种类型的锁通常被称为共享锁. (shared lock)和排他锁(exclusive lock),也叫读锁(read lock)和写锁(write lock)。
读锁是共享的,或者说是相互不阻塞的。多个客户在同一时刻可以同时读取同一个资源,而互不干扰。写锁则是排他的,也就是说一个写锁会阻塞其他的写锁和读锁,这是出于安全策略的考虑,只有这样,才能确保在给定的时间里,只有一个用户能执行写入,并防止其他用户读取正在写入的同一资源。
一种提高共享资源并发性的方式就是让锁定对象更有选择性。尽量只锁定需要修改的部分数据,而不是所有的资源。更理想的方式是,只对会修改的数据片进行精确的锁定。任何时候,在给定的资源上,锁定的数据量越少,则系统的并发程度越高,只要相互之间不发生冲突即可。
表锁(table lock)
表锁是MySQL中最基本的锁策略,并且是开销最小的策略。它会锁定整张表。一个用户在对表进行写操作(插入、删除、更新等)前,需要先获得写锁,这会阻塞其他用户对该表的所有读写操作。
尽管存储引擎可以管理自己的锁,MySQL本身还是会使用各种有效的表锁来实现不同的目的。例如,服务器会为诸如ALTER TABLE
之类的语句使用表锁,而忽略存储引擎的锁机制。
行锁(row lock)
行级锁可以最大程度地支持并发处理(同时也带来了最大的锁开销)。众所周知,在InnoDB和XtraDB,以及其他一些存储引擎中实现了行级锁。
事务就是一组原子性的SQL查询。要不都执行成功,要么都执行失败。
事务的司四大特征:ACID。ACID表示原子性(atomicity)、一致性(consistency)、 隔离性(isolation) 和持久性(durability)。
一个事务必须被视为一个不可分割的最小工作单元,整个事务中的所有操作要么全部提交成功,要么全部失败回滚,对于一个事务来说,不可能只执行其中的一部分操作。
数据库总是从一个一致性的状态转换到另外一个一致性的状态。
一个事务所做的修改在最终提交以前,对其他事务是不可见的。
一旦事务提交,则其所做的修改就会永久保存到数据库中。
在sQL标准中定义了四种隔离级别。较低的隔离通常可以执行更高的并发,系统的开销也更低。
READ UNCOMMITTED (未提交读)
事务中的修改,即使没有提交,对其他事务也都是可见的。事务可以读取未提交的数据,这也被称为脏读(Dity Rea)。
READ COMMITTED (提交读)
大多数数据的默认(MySQL不是)。一个事务从开始只能看到自己的提交的内容,对其他事务是不可见的。这种级别也被称作不可重复读,因为两次执行同样的查询,可能会得到不一样的结果。
REPEATABLE READ (可重复读)
主要解决脏读。该级别保证了在同一个事务中多次读取同样记录的结果是一致的。但是避免不掉幻读的问题。InnoDB和XtraDB存储引擎通过多版本并发控制(MVCC)解决了幻读的问题。
SERIALIZABLE (可串行化)
它通过强制事务串行执行,避免了前面说的幻读的问题。但是性能严重受到影响。
死锁是指两个或者多个事务在同一资源上相互占用,并请求锁定对方占用的资源,从而导致恶性循环的现象。
为了解决这种问题,数据库系统实现了各种死锁检测和死锁超时机制。
死锁发生以后,只有部分或者完全回滚其中一个事务,才能打破死锁。
InnoDB目前处理死锁的方法是,将持有最少行级排他锁的事务进行回滚
事务日志可以帮助提高事务的效率。使用事务日志,存储引擎在修改表的数据时只需要修改其内存拷贝,再把该修改行为记录到持久在硬盘上的事务日志中,而不用每次都将修改的数据本身持久到磁盘。事务日志采用的是追加的方式,因此写日志的操作是磁盘上一小块区域内的顺序I/O,而不像随机I/O需要在磁盘的多个地方移动磁头,所以采用日志会快很多。
MySQL默认采用自动提交的默认。即每个查询都会当作一个事务执行提交操作。可以通过设置 AUTOCOMMIT 变量开启用或关闭自动提交模式。
# 查看系统变量
show variable like 'AUTOCOMMIT';
# 关闭自动提交
SET AUTOCOMMIT = 0;
# 设置隔离级别
SET TRANSACTION ISOLATION LEVEL [READ COMMITED|...]
建议:除了事务中禁用了AUTOCOMMIT,可以使用LOCK TABLES 之外,其他任何时候都不要显式地执行LOCK TABLES, 不管使用的是什么存储引擎。
MySQL 的大多数事务型存储引擎实现的都不是简单的行级锁。基于提升并发性能的考虑,它们一般都同时实现了多版本并发控制(MVCC)。
可以认为MVCC是行级锁的一个变种,但是它在很多情况下避免了加锁操作,因此开销更低。虽然实现机制有所不同,但大都实现了非阻塞的读操作,写操作也只锁定必要的行。
MVCC的实现,是通过保存数据在某个时间点的快照来实现的。也就是说,不管需要执行多长时间,每个事务看到的数据都是一致的。根据事务开始的时间不同,每个事务对同一张表,同一时刻看到的数据可能是不一样的。如果之前没有这方面的概念,这句话听起来就有点迷惑。熟悉了以后会发现,这句话其实还是很容易理解的。
前面说到不同存储引擎的MVCC实现是不同的,典型的有乐观(optimistic) 并发控制和悲观(pessimistic) 并发控制。下面我们通过InnoDB的简化版行为来说明MVCC是如何工作的。
InnoDB的MVCC,是通过在每行记录后面保存两个隐藏的列来实现的。这两个列,一个保存了行的创建时间,一个保存行的过期时间(或删除时间)。当然存储的并不是实.际的时间值,而是系统版本号(system version number)。每开始一个新的事务,系统版本号都会自动递增。事务开始时刻的系统版本号会作为事务的版本号,用来和查询到的每行记录的版本号进行比较。下面看一下在REPEATABLE READ 隔离级别下,MVCC具体是如何操作的。
SELECT
InnoDB会根据以下两个条件检查每行记录:
a. InnoDB只查找版本早于当前事务版本的数据行(行的系统版本号小于或等于事务的系统版本号),这样可以确保事务读取的行,要么是在事务开始前已经存在的,要么是事务自身插入或者修改过的。
b.行的删除版本要么未定义,要么大于当前事务版本号。这可以确保事务读取到的行,在事务开始之前未被删除。只有符合上述两个条件的记录,才能返回作为查询结果。
INSERT
InnoDB为新插人的每一行保存当前系统版本号作为行版本号。
DELETE
InnoDB为删除的每一行保存当前系统版本号作为行删除标识。
UPDATE
InnoDB为插人一行新记录,保存当前系统版本号作为行版本号,同时保存当前系统版本号到原来的行作为行删除标识。
保存这两个额外系统版本号,使大多数读操作都可以不用加锁。这样设计使得读数据操作很简单,性能很好,并且也能保证只会读取到符合标准的行。不足之处是每行记录都需要额外的存储空间,需要做更多的行检查工作,以及一些额外的维护工作。
MVCC只在REPEATABLE READ
和READ COMMITTED
两个隔离级别下工作。其他两个隔离级别都和MVCC不兼容4,因为READ UNCOMITTED
总是读取最新的数据行,而不是符合当前事务版本的数据行。而SERIALIZABLE
则会对所有读