秒杀是一个非常典型的活动场景,比如,在双 11、618 等电商促销活动中,都会有秒杀场景。秒杀场景的业务特点是限时限量,业务系统要处理瞬时的大量高并发请求,而 Redis 就经常被用来支撑秒杀活动。
不过,秒杀场景包含了多个环节,可以分成秒杀前、秒杀中和秒杀后三个阶段,每个阶段的请求处理需求并不相同,Redis 并不能支撑秒杀场景的每一个环节。
秒杀活动售卖的商品通常价格非常优惠,会吸引大量用户进行抢购。但是商品库存量却远远小于购买该商品的用户数,而且会限定用户只能在一定的时间段内购买。这就给秒杀系统带来两个明显的负载特征,也对支撑系统提出了要求。
一般数据库每秒只能支撑千级别的并发请求,而 Redis 的并发处理能力(每秒处理请求数)能达到万级别,甚至更高。所以当有大量并发请求涌入秒杀系统时,需要使用 Redis 先拦截大部分请求,避免大量请求直接发送给数据库,把数据库压垮。
在秒杀场景下,用户需要先查验商品是否还有库存(也就是根据商品 ID 查询该商品的库存还有多少),只有库存有余量时,秒杀系统才能进行库存扣减和下单操作。
库存查验操作是典型的键值对查询,而 Redis 对键值对查询的高效支持,正好和这个操作的要求相匹配。
不过秒杀活动中只有少部分用户能成功下单,所以商品库存查询操作(读操作)要远多于库存扣减和下单操作(写操作)。
一般可以把秒杀活动分成三个阶段。在每一个阶段,Redis 所发挥的作用也不一样。
第一阶段是秒杀活动前。 用户会不断刷新商品详情页,这会导致详情页的瞬时请求量剧增。这个阶段的应对方案,一般是尽量把商品详情页的页面元素静态化,然后使用 CDN 或是浏览器把这些静态化的元素缓存起来。 使秒杀前的大量请求可以直接由 CDN 或是浏览器缓存服务,不会到达服务器端了,减轻了服务器端的压力。在这个阶段有 CDN 和浏览器缓存服务请求就足够了,还不需要使用 Redis。
第二阶段是秒杀活动开始。 此时大量用户点击商品详情页上的秒杀按钮,会产生大量的并发请求查询库存。一旦某个请求查询到有库存,紧接着系统就会进行库存扣减。然后系统会生成实际订单,并进行后续处理,例如订单支付和物流服务。如果请求查不到库存就会返回。用户通常会继续点击秒杀按钮,继续查询库存。这个阶段的操作就是三个:库存查验、库存扣减、订单处理。因为每个秒杀请求都会查询库存,而请求只有查到有库存余量后,后续的库存扣减和订单处理才会被执行。所以这个阶段中最大的并发压力都在库存查验操作上。为了支撑大量高并发的库存查验请求,需要在这个环节使用 Redis 保存库存量,请求可以直接从 Redis 中读取库存并进行查验。
订单处理可以在数据库中执行,但库存扣减操作,不能交给后端数据库处理。
在数据库中处理订单的原因: 订单处理会涉及支付、商品出库、物流等多个关联操作,这些操作本身涉及数据库中的多张数据表,要保证处理的事务性,需要在数据库中完成。而且订单处理时的请求压力已经不大了,数据库可以支撑这些订单处理请求。
库存扣减操作不能在数据库执行原因: 一旦请求查到有库存,就意味着发送该请求的用户获得了商品的购买资格,用户就会下单了。同时商品的库存余量也需要减少一个。如果把库存扣减的操作放到数据库执行,会带来两个问题。
所以需要直接在 Redis 中进行库存扣减。具体的操作是,当库存查验完成后,一 旦库存有余量,就立即在 Redis 中扣减库存。为了避免请求查询到旧的库存值,库存查验和库存扣减这两个操作需要保证原子性。
第三阶段就是秒杀活动结束后。 可能还会有部分用户刷新商品详情页,尝试等待有其他用户退单。而已经成 功下单的用户会刷新订单详情,跟踪订单的进展。不过这个阶段中的用户请求量已经下降很多了,服务器端一般都能支撑。
秒杀场景对 Redis 的需求: 秒杀场景分成秒杀前、秒杀中、秒杀后三个阶段。秒杀开始前后,高并发压力没有那么 大,不需要使用 Redis,但在秒杀进行中,需要查验和扣减商品库存,库存查验面临大量的高并发请求,而库存扣减又需要和库存查验一起执行,以保证原子性。
秒杀场景对 Redis 操作的根本要求有两个:
基于原子操作支撑秒杀场景在秒杀场景中,一个商品的库存对应了两个信息,分别是总库存量和已秒杀量。这种数据模型正好是一个 key(商品 ID)对应了两个属性(总库存量和已秒杀量),可以使用一个 Hash 类型的键值对来保存库存的这两个信息,如下所示:
key: itemID
value: {total: N, ordered: M}
其中 itemID 是商品的编号,total 是总库存量,ordered 是已秒杀量。因为库存查验和库存扣减这两个操作要保证一起执行,一个直接的方法就是使用 Redis 的 原子操作。原子操作可以是 Redis 自身提供的原子命令,也可以是 Lua 脚本。因为库存查验和库存扣减是两个操作,无法用一条命令来完成,所以需要使用 Lua 脚本原子性地执行这两个操作。
Lua 脚本中实现这两个操作:
#获取商品库存信息
local counts = redis.call("HMGET", KEYS[1], "total", "ordered");
#将总库存转换为数值
local total = tonumber(counts[1])
#将已被秒杀的库存转换为数值
local ordered = tonumber(counts[2])
#如果当前请求的库存量加上已被秒杀的库存量仍然小于总库存量,就可以更新库存
if ordered + k <= total then
#更新已秒杀的库存量
redis.call("HINCRBY",KEYS[1],"ordered",k)
end
return 0
有了 Lua 脚本后,可以在 Redis 客户端,使用 EVAL 命令来执行这个脚本。最后客户端会根据脚本的返回值,来确定秒杀是成功还是失败了。如果返回值是 k,就是成功了;如果是 0,就是失败。
使用分布式锁来支撑秒杀场景的具体做法是,先让客户端向 Redis 申请分布式锁,只有拿到锁的客户端才能执行库存查验和库存扣减。大量的秒杀请求就会在争夺分布式锁时被过滤掉。而且库存查验和扣减也不用使用原子操作了,因为多个并发客户端只有一个客户端能够拿到锁,已经保证了客户端并发访问的互斥性。
伪代码显示使用分布式锁来执行库存查验和扣减的过程:
//使用商品ID作为key
key = itemID
//使用客户端唯一标识作为value
val = clientUniqueID
//申请分布式锁,Timeout是超时时间
lock =acquireLock(key, val, Timeout)
//当拿到锁后,才能进行库存查验和扣减
if(lock == True) {
//库存查验和扣减
availStock = DECR(key, k)
//库存已经扣减完了,释放锁,返回秒杀失败
if (availStock < 0) {
releaseLock(key, val)
return error
}
//库存扣减成功,释放锁
else{
releaseLock(key, val)
//订单处理
}
}
//没有拿到锁,直接返回
else
return
需要注意的是在使用分布式锁时,客户端需要先向 Redis 请求锁,只有请求到了锁,才能进行库存查验等操作,这样客户端在争抢分布式锁时,大部分秒杀请求本身就会因为抢不到锁而被拦截。
建议使用切片集群中的不同实例来分别保存分布式锁和商品库存信息。使用这种保存方式后,秒杀请求会首先访问保存分布式锁的实例。如果客户端没有拿到锁,这些客户端就不会查询商品库存,可以减轻保存库存信息的实例的压力了。
秒杀场景有 2 个负载特征,分别是瞬时高并发请求和读多写少。Redis 良好的高并发处理能力,以及高效的键值对读写特性,正好可以满足秒杀场景的需求。
在秒杀场景中,可以通过前端 CDN 和浏览器缓存拦截大量秒杀前的请求。在实际秒杀活动进行时,库存查验和库存扣减是承受巨大并发请求压力的两个操作,同时这两个操作的执行需要保证原子性。Redis 的原子操作、分布式锁这两个功能特性可以有效地来支撑秒杀场景的需求。
对于秒杀场景来说,只用 Redis 是不够的。秒杀系统是一个系统性工程,Redis 实现了对库存查验和扣减这个环节的支撑,除此之外,还有 4 个环节需要处理:
建议:秒杀活动带来的请求流量巨大,需要把秒杀商品的库存信息用单独的实例保存,不要和日常业务系统的数据保存在同一个实例上,这样可以避免干扰业务系统的正常运行。