一行注释导致的生产bug

搬砖不停,bug不断;一个注释造成的bug,万幸没有影响核心业务,否则别说年终奖了,这年头,就要说:拜拜了您嘞

bug现场

业务方反馈有线上问题,开发排查发现定时任务调度失败,查看xxljob控制台调度日志,一个时间点后的定时任务全部失败,如下图:


调度日志.png

排查发现,定时任务已经断跑了几乎24小时,什么原因?

bug原因

经过分析,找到了bug点。导致bug的直接原因:一个小伙伴本地注释了xxx-job ConfigBean,并提交到远程分支上

bug解决

知道了原因后,那就赶快恢复分支,发布,问题解决;随着定时任务的恢复业务数据也正常了

bug影响

系统的所有定时任务没有按时执行,导致相关业务数据无法正常流转

bug复盘分析

1. xxljob告警配置 -飞书告警(至关重要)

job告警配置.png

2. 加强Code Review
3. 开发者的自我约束:对自己的代码负责
4. service和task拆分

你可能感兴趣的:(一行注释导致的生产bug)