价值几个亿的K8S升级方案

价值几个亿的K8S升级方案_第1张图片

替换升级方案不用说了,一般有一定规模的公司都是采用这种方案;DD采用的这种成本相对较低原地升级方式本质上也没有太大问题,但是风险系数相对比较高。感觉DD肯定是在很多个集群这样干过了,成本比较低加上侥幸没有出现任何问题,所以这种升级方式就一直沿用下来。看之前DD内部的实践已经升级到1.20,根据这次出现问题的修复时长,合理推断是不小心对K8S master做了降级,并且降级了多个版本,然后导致ETCD中的数据污染,最后导致整个集群中的服务被Kill。不过滴滴万万没想到自己的K8S升级方案有一天是以这样的方式被他人熟知。


不可否认,互联网公司最大的成本就是人力成本,但是通过开源节流实现降本增效根本是不可能的。众所周知,就目前大厂的这种严刑拷打的面试方式,特别是程序员,能够进行互联网大厂的员工能力绝对强于多数人,否则根本无法进入大厂,当你是一个能力不俗的员工,看到身边人都走了、被裁员了、被降薪了,试问他们还有心思干活吗?正常人肯定会时刻在准备何时跑路,谁还有心情保证自己服务的质量和稳定性。

作为老板不要盲目引入复杂度,经常产生各种没有经过仔细思考的落地方案、一直加各种需求,如果遭到员工挑战,美其名曰,小步快跑,快速试错。如果做到最后真的错了,大不了让程序员多加班,成本相对比较低。其实这就是个局,最后坑的是自己,随着时间的推移,软件的复杂度会越来越高,接着就会需要越来越多的人,否则就会产生忽然崩塌的可能。试想如果把软件建设当成房屋建设去做,老板们还敢推倒重建吗?

国内的企业裁员,基本走的都是真正的技术人员,留下的都是人情世故,这些有技术的直男,会做一些实事,但不懂得讨好别人,最后只能默默走人。愿所有的公司都能敬畏裁员、尊重技术,少一点PPT,多一点真落地,要让默默奉献的员工有所收获。

一个公司是否可以赚钱,关键在于公司的战略方向,是否抓住了市场机遇,员工只是充当到达目的的主要推手。公司没有实现盈利,底层员工无法承担主要责任。而应该从中高层进行反思问题出在了什么地方。


原创不易,随手关注或者”在看“,诚挚感谢!

你可能感兴趣的:(kubernetes,容器,云原生)