微信红包的设计实现

 

红包功能的设计实现是一个很有趣的话题,主要的功能是P个人抢总金额M的N个红包,满足先抢的N个人能抢到红包。如果这是一个leetcode的算法题目难度应该是easy,只要保证Ni抢到的金额区间在[0.01,2倍剩余金额平均值)就能ac。
将算法带入到真实的工程实现,问题就要复杂得多,如果达到微信的量级,明显要考虑的有以下几点。

  1. 拆红包
  2. 高并发读
  3. 并发写
  4. 网络流量峰值
  5. 对账
  6. 降级
  7. 故障恢复

拆红包

拆红包有预拆包和实时拆包2种策略

预拆包策略

预拆包的策略在发红包时将金额M的红包拆分成N份,将分配好的结果放入内存队列或者cache,通过incr操作在用户抢红包时分配预算好的红包slot,预算的策略可以避免对共享资源的操作,减少了锁竞争,服务本身是无状态的,设计和实现相对简单,伸缩性较好。劣势是需要额外的存储空间,如果存在大量活跃红包或者红包份数很多时会增加成本。

实时拆包

实时拆包的策略在用户抢红包时实时拆包计算金额,这样只需要保存剩余红包数量和金额,不需要额外保存每个预拆包的红包金额。使用预拆包的策略会面临并发写的问题,如果多个拆红包的请求同时执行会导致数据不一致引起超发的问题,可以使用CAS操作实现乐观锁保证并发拆包不会出现问题。

高并发读

应对高并发读的通常思路是业务层拦截过滤无效请求,使用有效的缓存。可以使用Cache层decr功能记录请求红包的用户数,当decr到0后就拦截后面的请求直接返回,对DAO层也要增加相应的缓存减少数据库的压力。

并发写

应对并发写的通常思路是串行化和乐观锁。在用户抢红包时实时拆包计算金额,每抢到一个红包,就cas更新剩余金额和红包个数,同时在DB中记录凭证,考虑到DB的写入压力,需要做分库分表,冷热分离。

网络流量峰值

大量用户同时抢红包是否会造成网络拥塞,发红包和抢红包最好在同一个IDC。

对账

考虑到拆红包凭证和入账是异步的2套系统,以及出现故障的可能,需要定时对账保证数据的一致性。

降级

在cache故障时有限流的使用DB进行服务,在资源紧张的时候关闭掉非核心流程,在实时入账请求量过大时,延迟批量入账。

 

背景:有某个朋友在朋友圈咨询微信红包的架构,于是乎有了下面的文字(有误请提出,谢谢)

概况:2014年微信红包使用数据库硬抗整个流量,2015年使用cache抗流量。

  1. 微信的金额什么时候算? 
    答:微信金额是拆的时候实时算出来,不是预先分配的,采用的是纯内存计算,不需要预算空间存储。。 
    采取实时计算金额的考虑:预算需要占存储,实时效率很高,预算才效率低。

  2. 实时性:为什么明明抢到红包,点开后发现没有? 
    答:2014年的红包一点开就知道金额,分两次操作,先抢到金额,然后再转账。 
    2015年的红包的拆和抢是分离的,需要点两次,因此会出现抢到红包了,但点开后告知红包已经被领完的状况。进入到第一个页面不代表抢到,只表示当时红包还有。

  3. 分配:红包里的金额怎么算?为什么出现各个红包金额相差很大? 
    答:随机,额度在0.01和剩余平均值*2之间。 
    例如:发100块钱,总共10个红包,那么平均值是10块钱一个,那么发出来的红包的额度在0.01元~20元之间波动。 
    当前面3个红包总共被领了40块钱时,剩下60块钱,总共7个红包,那么这7个红包的额度在:0.01~(60/7*2)=17.14之间。 
    注意:这里的算法是每被抢一个后,剩下的会再次执行上面的这样的算法(Tim老师也觉得上述算法太复杂,不知基于什么样的考虑)。

    这样算下去,会超过最开始的全部金额,因此到了最后面如果不够这么算,那么会采取如下算法:保证剩余用户能拿到最低1分钱即可。

    如果前面的人手气不好,那么后面的余额越多,红包额度也就越多,因此实际概率一样的。

  4. 红包的设计 
    答:微信从财付通拉取金额数据郭莱,生成个数/红包类型/金额放到redis集群里,app端将红包ID的请求放入请求队列中,如果发现超过红包的个数,直接返回。根据红包的裸祭处理成功得到令牌请求,则由财付通进行一致性调用,通过像比特币一样,两边保存交易记录,交易后交给第三方服务审计,如果交易过程中出现不一致就强制回归。

  5. 发性处理:红包如何计算被抢完? 
    答:cache会抵抗无效请求,将无效的请求过滤掉,实际进入到后台的量不大。cache记录红包个数,原子操作进行个数递减,到0表示被抢光。财付通按照20万笔每秒入账准备,但实际还不到8万每秒。

  6. 通如何保持8w每秒的写入? 
    答:多主sharding,水平扩展机器。

  7. 据容量多少? 
    答:一个红包只占一条记录,有效期只有几天,因此不需要太多空间。

  8. 询红包分配,压力大不? 
    答:抢到红包的人数和红包都在一条cache记录上,没有太大的查询压力。

  9. 一个红包一个队列? 
    答:没有队列,一个红包一条数据,数据上有一个计数器字段。

  10. 有没有从数据上证明每个红包的概率是不是均等? 
    答:不是绝对均等,就是一个简单的拍脑袋算法。

  11. 拍脑袋算法,会不会出现两个最佳? 
    答:会出现金额一样的,但是手气最佳只有一个,先抢到的那个最佳。

  12. 每领一个红包就更新数据么? 
    答:每抢到一个红包,就cas更新剩余金额和红包个数。

  13. 红包如何入库入账? 
    数据库会累加已经领取的个数与金额,插入一条领取记录。入账则是后台异步操作。

  14. 入帐出错怎么办?比如红包个数没了,但余额还有? 
    答:最后会有一个take all操作。另外还有一个对账来保障。

你可能感兴趣的:(java)