字节跳动高工面试:以商品超卖为例讲解Redis分布式锁,爱了爱了

前言:

说到算法,相信每一个程序员和接触过程序员的朋友都不会陌生,直到现在算法一直占着面试必问的地位,而算法面试也仍是当前最适合公司筛选程序员的方法之一,在阿里,字节跳动、华为等公司带动下,无论是求职者还是面试官,都逐渐认识到算法面试其实是相对高效、准确且公平的筛选机制**,可能你会觉得算法面试有几个实际工作中用到的,不过是“面试造火箭,工作拧螺丝”**罢了,那我想说你并没有认识到算法面试的真正目的。

说简单点,算法面试就是为了筛选出足够聪明要么足够勤奋的人,在一个算法题中,不仅考察你的沟通能力,你的逻辑思维能力,同时也在考察你的**代码质量。**因此,无论在哪种情况下,都不是单纯刷题背题就能应付的,关于算法相关的内容,Alibaba肯定还是很有话语权的,所以今天我们要分享的内容,正是阿里P8的十年开发经验总结,写出来的这本“大师级算法宝典”看完你也会不得不感叹这份极品手册的!

由于每个章节都有更详细的章节内容,文章篇幅受限,只能展示部分的章节内容和核心截图,有需要完整笔记的朋友可以点赞文章关注我支持一下,获取方式在文末!!!

事故背景

公司最近安排了一波商品抢购活动,由于后台小哥操作失误最终导致活动效果差,被用户和代理商投诉了。经理让我带同事们一起复盘这次线上事故。

什么原因造成的?

抢购活动计划是零点准时开始,

22:00 运营人员通过后台将商品上线

23:00后台小哥已经将商品导入缓存中,提前预热

抢购开始的瞬间流量非常大,按计划是通过Redis承担大部分用户查询请求,避免请求全部落在数据库上。

字节跳动高工面试:以商品超卖为例讲解Redis分布式锁,爱了爱了_第1张图片

如上图预期大部分请求会命中缓存,但是由于后台小哥预热缓存的时候将所有商品的缓存时间都设置为2小时过期,所有的商品在同一个时间点全部失效,瞬间所有的请求都落在数据库上,导致数据库扛不住压力崩溃,用户所有的请求都超时报错。

实际上所有的请求都直接落到数据库,如下图:

字节跳动高工面试:以商品超卖为例讲解Redis分布式锁,爱了爱了_第2张图片

什么时候发现的?

凌晨01:02 SRE 收到系统告警,登录运维管理系统发现数据库节点 CPU和内存飙升超过阈值,迅速联系后台开发人员定位排查。

为什么没有早点发现?

由于缓存设置过期时间是2小时,凌晨1点前缓存可以命中大部分请求,数据库服务处于正常状态。

发现时采取了什么措施?

后台小哥通过日志定位排查发现问题后,进行了一系列操作:

首先通过API Gateway(网关)限制大部分流量进来

接着将宕机的数据库服务重启

再重新预热缓存

确认缓存和数据库服务正常后将网关流量正常放开,大约01:30 抢购活动恢复正常。

如何避免下次出现?

这次事故的原因其实就是出现了缓存雪崩,查询数据量巨大,请求直接落到数据库上,引起数据库压力过大宕机。

在业界解决缓存雪崩的方法其实比较成熟了,比如有:

  • 均匀过期
  • 加互斥锁
  • 缓存永不过期

(1)均匀过期

设置不同的过期时间,让缓存失效的时间点尽量均匀。通常可以为有效期增加随机值或者统一规划有效期。

字节跳动高工面试:以商品超卖为例讲解Redis分布式锁,爱了爱了_第3张图片

(2)加互斥锁

跟缓存击穿解决思路一致,同一时间只让一个线程构建缓存,其他线程阻塞排队。

字节跳动高工面试:以商品超卖为例讲解Redis分布式锁,爱了爱了_第4张图片

(3)缓存永不过期

跟缓存击穿解决思路一致,缓存在物理上永远不过期,用一个异步的线程更新缓存。

字节跳动高工面试:以商品超卖为例讲解Redis分布式锁,爱了爱了_第5张图片

最后

如果大家需要这份清华大牛整理的进大厂必备的redis视频、面试题和技术文档的话,可以戳这里即可免费获取!

祝大家早日进入大厂,拿到满意的薪资和职级~~~加油!!

感谢大家的支持!!

字节跳动高工面试:以商品超卖为例讲解Redis分布式锁,爱了爱了_第6张图片

祝大家早日进入大厂,拿到满意的薪资和职级~~~加油!!

感谢大家的支持!!

[外链图片转存中…(img-GyP9y7SL-1618801676133)]

你可能感兴趣的:(程序员,java,后端,面试)