大家好,我是老杨。
都说IT行业最容易被甩锅的就是网工,这是有科学依据的,比如:
纵观我网工群的群友聊天,“锅”不离口,很难不说明一点什么问题。
遇到甩锅,我相信没有哪位朋友的心情是愉悦的。
到底怎么避免甩锅,或许你要从最源头开始追溯本源,找到根本解决之道。
今天就来和你聊上一聊。
今日文章阅读福利:《10年网工1v1答疑名额(5个)》
不知道网工要怎么发展,不明白怎么做职业规划,还是想入行没方向?别急,私信我,发送暗号“咨询”,我给你捋捋。
很多人都觉得,自己干活干的好好的,结果干的越好背锅也多,为什么?
你肯定在这个时候忘记了一句老话,网络工程师工作的最高境界,就是全公司最好都当你不存在。
一旦有一丁点小的网络故障或者问题,你永远都是逃不掉的第一个。
网络坏了找你,电脑黑屏了找你,网线乱七八糟找你,软件下不下来还找你……
想当透明网工人,不存在的。
简单举个例子:
网络故障定位,是很多网工的必修课之一。
但定位的快准狠,不是每个网工都做得到的,更别谈定位之后强大的处理和解决问题的能力了。
就在这个基础工作里,锅就挺多。
首先,网络故障发生的原因会有很多。
可能是客户的问题,可能是机房维护的问题,也有可能是第三方服务出现了问题,当然也有可能是网工自己本身的疏忽,以及设备本身的问题。
由于设备本身的软件或者硬件出现问题而导致的故障,其实是比较少见的,90%的网络故障都是人为的。
要么配置配的不合理,要么规划不合理,才会导致这样或那样的问题。
就像刑侦剧一样,每一个案件背后,都充满了未被探寻的多个线索,网络故障也是。
不管到底是谁的锅,只要你没有第一时间处理得当,最后都会变成你的锅。
这个背后折射的真相,除了技术问题本身,更多的其实也是沟通问题。
除开正常工作对接上的锅,很多时候也要背上网友的锅。
就像一遇到什么app崩了,什么网站也崩了,什么功能打不开,统统都找网工的麻烦。
广大网工:“求放过行不行?”
所以,我经常看到xx崩了,一会儿有网友喊程序员快点加班秃头处理的,一会儿喊网络工程师快出来搞清楚的……
我就很想拍拍他们的肩膀,微笑:“别闹了,洗洗睡吧。”
很多网工的性格都是比较内向的,毕竟搞IT的哥儿几个,哪里有什么花花肠子,都是埋头苦干型。
在做项目的过程里,最容易产生的问题,就是“沟通不明”产生的。
可能老板想要的是一个样,你做的是另外一个样;
可能同事和你一起组网,你想做的和他需要做的都不是一回事;
还有可能,在和项目经理的沟通里,你常常搞不懂到底他在讲什么……
我曾经遇到过一个年轻同事,就背过一个很经典的沟通黑锅。
他帮忙维护甲方的业务系统,晚上下班回去休息。
系统突然凌晨3点中断,火急火燎的被打电话叫醒,迷迷糊糊的处理好了,业务也恢复正常了,但最后还是出了问题。
客户过了几天开始追问故障原因,甩锅甩的满天飞,最后还是落在了这位年轻同事头上。
他错哪儿?
他没有要到客户明确的纸质授权处理书,也没有在解决故障之后第一时间出具分析报告,更没有和上级进行及时的交流,最后才导致了锅从天上来的结局。
如果第一时间明确了到底故障的原因是什么,比如是流量突增占满带宽,或者是哪个端口被重用,你都好把锅甩回去。
但你没有第一时间判断清楚,只是为了解决问题而解决问题,最后就容易变得难以收尾。
从第一点我们可以得出,想要拥有完美抵御黑锅的能力,就要从技术能力和沟通能力两方面入手。
有了两个方向维度,你可以优先选择自己想选的,进行优化和改进。
比如,你觉得自己老是被甩锅,是因为技术不如其他同事好,心不如其他同事细致。
那么,对于你来说,最完美的甩锅方法,就是有理有据有条理的做好每件事情。
你说得出前因后果,甚至能说出同事工作上的逻辑错误,黑锅自然远离你。
而且,很多黑锅都是因为你没有备份的习惯,那你就养成一个习惯,要修改数据时,先备份,比如.conf的配置文件。
另外,修改配置文件时,建议注释原选项,然后再复制修改不就好了?
当然,关于网络故障分析大法,我已分享了不少在公众号内,比如这一篇,你就可以参考:《这6个网络故障,每位网工都曾遇到过》
我个人比较难忘的项目经历有不少。
这10年来,我做过很多项目,比如腾讯MAN,国家电网的广域网,运营商网络,阿里专有云,各种私有云等等等等……出差最高长达1年。
熬夜通宵过,睡一半被客户打电话骂起来过,还在机房过过生日,感觉毕业后的大半时间都在项目里度过。
要说印象最深的,就是有一次折腾到凌晨三点的突发故障了。
客户是国内某TOP新能源行业相关公司,下午出的故障,故障表现为访问SAP服务器卡顿。
他们那边就召集了所有相关技术人员进行排错,做了简单的测试之后发现,ping服务器丢包,锅全给到网络这边。
因为觉得是小问题,所以没有找我们这边的原厂工程师求助,但是就这么点小问题,折腾到了凌晨1点多2点……是在没办法了,才求助了原厂。
我就是在凌晨3点接到领导电话的,被抓起来大半夜联系客户,问了下基本情况,得知测试PC到服务器中间核心交换机有个接口有丢包统计。
到这里,其实有经验的网工都大概知道端倪了,我分享下我的个人思路:
1. 确定接口是电口还是光口,核心设备是某厂的xx型号,基本是光口,但是还是确定一下。
2.查看接口光衰,得知收光功率-19,所以基本是硬件问题,光纤损坏了。
3. 确认是否双链路,一般核心肯定是,将故障链路所在接口关闭,再次测试发现不丢包了。
4. 至此,业务恢复,为了不影响第二天业务,接口先进行关闭,第二天替换故障光纤。
虽然问题不大,但的确对我来说印象深刻,希望对你能有所启发。
毕竟,在什么黑锅面前,强大的业务能力和沟通能力,才是一名网工最好的保护伞。
原创:老杨丨10年资深网络工程师,更多网工提升干货,请关注公众号:网络工程师俱乐部