记一次失败的发布过程

拖着沉重的身体回到宿舍,启动电脑,双眼干涩。打开Notion开始反省今天的发布过程。

很明显,这是一次失败的发布过程。

这个过程是这样的:

  • 09:00 提交代码
  • 09:05 Jenkins执行完成部署逻辑
  • 09:09 应用滚动更新完成。同时我们也发现了问题
  • 09:40 找出问题所在,修改配置代码,并提交代码
  • 09:46 Jenkins执行完成部署逻辑,问题解决
  • 09:49 测试团队开始测试
  • 11:29 通过测试

整个过程耗时2个半小时。部署过程总耗时49分钟。其中,找问题过程耗时31分钟。

问题最终发现是出在一个istio的vs配置忘记修改了。也就是应用配置修改了,但是应用相关的路由忘记修改了。

我们应该如何避免下次出现这样的问题呢?

从两个方面下手:

  1. 启动调用链,可以加快找出问题速度。
  2. 避免忘记修改配置。

我认为应该优先从第2点下手。这是非常难的,配置项只会越来越多。如果没有智能化的提示,不管是使用界面的方式配置,还是使用代码的方式进行配置都会遇到同样的问题。

所谓的智能化提示,就是当你要修改配置的时候,存在一个系统会提示还有留意或者修改哪些其它的配置。

可是,具体如何做?现在已接近凌晨两点,大脑已经糊,下次再写。

你可能感兴趣的:(记一次失败的发布过程)