事务是数据库的一个重要功能。所谓的事务,就是指对数据进行读写的一系列操作。事务在执行时,会提供专门的属性保证,包括原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)和持久性(Durability),也就是 ACID 属性。这些属性既包括了对事务执行结果的
要求,也有对数据库在执行前后的数据状态变化的要求。
我们先了解下 ACID 属性对事务执行的具体要求,有了这个知识基础后,我们才能准确地判断 Redis 的事务机制能够保证 ACID 属性。
首先来看原子性。原子性的要求很明确,就是一个事务中的多个操作必须都完成,或者二都不完成。业务应用使用事务时,原子性也是被看重的一个属性。
假如用户在一个订单中购买了商品 A 和 B,那么数据库就需要把这两个商品的库存都进行扣减。如果只扣减了一个商品的库存,那么这个订单完成后,另一个商品的库存肯定就放错了。
第二个属性是一致性。这个很容易理解,就是指数据库中的事务执行前后是一致的。
第三个属性是隔离性。它要求数据库在执行一个事务时,其他操作无法存取到正在执行事务访问的数据。
还是用户下单的例子。假设商品 A 和 B 的现有库存分别是 5 和 10,用户 X 对 A、B 下单的数量分别是 3、6。如果事务不具备隔离性,在用户 X 下单事务执行的过程中,用户 Y 一下子购买了 5 件 B,这和 X 购买的 6 件 B 累加后,就超过 B 的总库存值了,这就不符合业务要求了。
最后一个属性是持久性。数据库执行事务后,数据的修改要被持久化保存下来。当数据重启后,数据的值需要是被修改后的值。
了解了 ACID 属性的具体要求后,我们看下 Redis 是如何实现事务机制的。
Redis 提供了 MULTI、EXEC 两个命令来完成这三个步骤。我们来分析下:
下面的代码显示了使用 MULTI、EXEC 执行一个事务的过程。
# 开启事务
127.0.0.1:6379> MULTI
OK
#将a:stock减1,
127.0.0.1:6379> DECR a:stock
QUEUED
#将b:stock减1
127.0.0.1:6379> DECR b:stock
QUEUED
#实际执行事务
127.0.0.1:6379> EXEC
1) (integer) 4
2) (integer) 9
假设 a:stock
、 b:stock
两个键的初始值是 5 和 10.在 MULTI 命令后执行的两个 DECR 命令,是把 a:stock
、 b:stock
两个键的值分别减 1,他们执行后的返回结果都是 QUEUED,这就表示这些操作都被暂存到了命令队列,还没有实际执行。等到执行了 EXEC 命令后,可以看到返回了 4、9,这就表明,两个 DECR 命令以及成功地执行了。
好了,通过使用 MULTI 和 EXEC 命令,我们可以实现多个操作的共同执行,但是这符合 ACID 属性吗? 我们来分析下。
如果事务正常执行,没有发生任何错误,那么 MULTI 和 EXEC 配合使用,就可以保证多个操作都完成。
但是,如果事务执行发生错误了,原子性是否还能保证?我们分三种情况来分析。
在执行 EXEC 命令前,客户端发送的操作命令本身有错误(比如语法错,使用了不存在的命令),在命令入队时就被 Redis 实例判断出来了。
对于这种情况,在命令入队时,Redis 就会报错,并且记录下这个错误。此时,还能继续提交命令。等到执行 EXEC 命令之后,Redis 就会拒绝执行所有提交的命令,返回事务失败的结果。这样一来,事务中的所有命令都不会再执行了,保证了原子性
。
#开启事务
127.0.0.1:6379> MULTI
OK
#发送事务中的第一个操作,但是Redis不支持该命令,返回报错信息
127.0.0.1:6379(TX)> PUT a:stock 5
(error) ERR unknown command `PUT`, with args beginning with: `a:stock`, `5`,
#发送事务中的第二个操作,这个操作是正确的命令,Redis把该命令入队
127.0.0.1:6379(TX)> DECR b:stock
QUEUED
#实际执行事务,但是之前命令有错误,所以Redis拒绝执行
127.0.0.1:6379(TX)> EXEC
(error) EXECABORT Transaction discarded because of previous errors.
127.0.0.1:6379>
在这个例子中,事务里包含了一个 Redis 本身不支持的 PUT 命令,所以在 PUT 命令入队时,Redis 就报错了。虽然,事务里还有一个正确的 DECR 命令,但是,在最后执行 EXEC 后,整个事务就放弃执行了。
和第一种情况不同,事务操作入队时,命令和操作的数据类型不匹配,但 Redis 实例没有检查出错误。在执行完 EXEC 命令以后,Redis 实际执行这些事务操作时,就会报错。不过,需要注意的是,虽然 Redis 会对命令报错,但是还会把正确的命令执行完。在这种情况下,事务的原子性就无法得到保证了。
举个例子。事务中的 LPOP 命令对 String 类型数据进行操作,入队时没有报错,但是在 EXEC 执行时报错了。LPOP 命令本身没有执行成功,但是事务中的 DECR 命令却执行成功了。
#开启事务
127.0.0.1:6379> MULTI
OK
#发送事务中的第一个操作,LPOP命令操作的数据类型不匹配,此时并不报错
127.0.0.1:6379(TX)> LPOP a:stock
QUEUED
#发送事务中的第二个操作
127.0.0.1:6379(TX)> DECR b:stock
QUEUED
#实际执行事务,事务第一个操作执行报错,第二个操作成功执行
127.0.0.1:6379(TX)> EXEC
1) (error) WRONGTYPE Operation against a key holding the wrong kind of value
2) (integer) 8
你可能会有疑问? 刚才的例子中,如果命令执行时报错了,是不是可以用回滚机制回复原来的数据呢?
其实 Redis 中并没有提供回滚机制。虽然提供了 DISCARD 命令,但是这个命令只能用来主动放弃事务执行,把暂存的命令队列清空,起不到回滚的效果。
DISCARD 命令的具体例子,我们来看下
#读取a:stock的值4
127.0.0.1:6379> GET a:stock
"4"
#开启事务
127.0.0.1:6379> MULTI
OK
#发送事务的第一个操作,对a:stock减1
127.0.0.1:6379(TX)> DECR a:stock
QUEUED
#执行DISCARD命令,主动放弃事务。执行完DISCARD放弃事务后,就不需要再执行EXEC了。
127.0.0.1:6379(TX)> DISCARD
OK
#再次读取a:stock的值,值没有被修改
127.0.0.1:6379> GET a:stock
"4"
这个例子中,a:stock
键的值一开始为 4,然后,我们执行一个事务,想对 a:stock
的值减 1。但是,在事务的最后,我们执行的是 DISCARD 命令,所以事务就被放弃了。我们再看 a:stock 的值,会发现仍为 4。
在执行事务的 EXEC 命令时,Redis 实例发生了故障,导致事务执行失败。
在这种情况下,如果 Redis 开启了 AOF 日志,那么,只会有部分的事务操作被记录到 AOF 日志中。我们需要使用 redis-check-aof
工具检查 AOF 日志文件,这个工具可以把未完成的事务操作从 AOF 文件中去除。这样一来,我们使用 AOF 恢复实例后,事务操作不会再被执行,从而保证了原子性。
当然,如果 AOF 日志并没有开启,那么实例重启后,数据也都没法恢复,此时,也就谈不上原子性了。
我们按照命令出错和实例故障的发生时机,分成三种情况来看。
情况一:命令入队时就报错。这种情况下,事务不会被执行,所以保证数据库的一致性。
情况二:命令入队时没报错,实际执行时报错。在这种情况下,有错误的命令不会被执行,正确的命令正常执行,也不会改变数据库的一致性。
情况三:EXEC 命令执行时实例发生故障。在这种情况下,实例故障后会进行重启,这就和数据恢复方式有关了。我们要根据 AOF 和 RDB 来分情况讨论。
如果没有开启 AOF 和 RDB,那么实例故障重启后,数据都没有了,数据库是一致的。
如果我们使用了 RDB 快照,因为 RDB 快照不会在事务执行时执行,所以事务命令操作的结果不会被保存到 RDB 快照中,使用 RDB 快照进行恢复时,数据库例的数据也是一致的。
如果使用了 AOF 日志,而事务操作还没有被记录到 AOF 日志时,实例就发送了故障,那么使用 AOF 日志恢复的数据库数据是一致的。如果只有部分操作被记录到了 AOF 日志,我们可以使用 redis-check-aof 清除事务中已经完成的操作,数据库恢复后也是一致的。
所以总结来说,在命令执行错误或 Redis 发生故障的情况下,Redis 事务机制对一致性属性是有保证的。
事务的隔离性保证,会受到和事务一起执行的并发操作的影响。而事务又可以分成命令入队和命令实际执行两个阶段。
此时,如果有其他的并发操作,就需要看看事务是否使用了 WATCH 机制
了。
WATCH 机制
的作用是,在事情执行前,监控一个或多个键值变化情况,当事务调用 EXEC 命令执行时,WATCH 机制
会先检查监控的键是否被其他客户端修改了。如果修改了,就放弃执行事务,避免事务的隔离性被破坏。然后,客户端可以再次执行事务,此时,如果没有并发修改是无数据的操作了,事务就能正常执行,隔离性也得到了保证。
客户端 X 在 EXEC 前分别执行了 WATCH、MULTI、DECR 命令
127.0.0.1:6379> WATCH a:stock
OK
127.0.0.1:6379> MULTI
OK
127.0.0.1:6379(TX)> DECR a:stock
QUEUED
此时 客户端 Y 执行了 DECR
127.0.0.1:6379> decr a:stock
(integer) 5
最后,客户端 X 执行 EXEC 命令,返回 nil
127.0.0.1:6379(TX)> EXEC
(nil)
当然,如果没有使用 WATCH 机制,在 EXEC 命令前执行的并发操作是会对数据进行读写的。而且,在执行 EXEC 的命令时,事务要操作的数据已经改变了,在这种情况下 Redis 并没有做到让事务对其他操作隔离,隔离性也就没有得到保障。
在 t2 时刻,客户端 X 发送的 EXEC 还没有执行,但是 客户端 Y 的 DECR 命令就执行了,此时,a:stock 的值被修改了,这样就无法保证 X 发起的事务的隔离性了。
因为 Redis 是用单线程执行命令,而且, EXEC 命令执行后,Redis 会保证先把命令队列中的所有命令执行完。所以,在这种情况下,并发操作不会破坏事务的隔离性。
因为 Redis 是内存数据库,所以,数据是否持久化保存完全取决于 Redis 的持久化配置模式。
如果 Redis 没有配置 RDB 或 AOF,那么事务的持久化属性肯定得不到保证。如果 Redis 使用了 RDB 模式,那么,在一个事务执行后,而下一次的 RDB 快照还未执行前,如果发生了实例宕机,这种情况下,事务修改的数据也是不能保证持久化的。
如果 Redis 采用了 AOF 模式,因为 AOF 模式的三种配置选项 no、everysec 和 always 都会存在数据丢失的情况,所以,事务的持久性属性也还是得不到保证。
所以,不管 Redis 采用什么持久化模式,事务的持久性属性是得不到保证的。
本节,学习 Redis 中的事务实现。Redis 通过 MULTI、EXEC、DISCARD 和 WATCH 四个命令来支持事务。
命令 | 作用 |
---|---|
MULTI | 开启一个事务 |
EXEC | 提交事务,从命令队列中取出提交的命令,进行实际执行 |
DISCARD | 放弃一个事务,清空命令队列 |
WATCH | 检查一个或多个键的值在事务执行期间是否发生变化,如果发生变化,那么当前事务放弃执行 |
Redis 事务机制可以保证一致性和隔离性,但是无法保证持久性。不过因为 Redis 本身就是内存数据库,持久性并不是一个必须的属性,我们更加关注的还是原子性、一致性和隔离性。
原子性比较复杂,只有当事务中使用的语法有误时,原子性得不到保证,在其他情况下,事务都可以原子性的执行。
所以,给你一个小建议:严格按照 Redis 命令规范进行程序开发,并且通过 code review 确保命令的正确性。