从不带电话的顺丰快递员来说说系统运维时记录问题和事件的要素。

1、今天中午,一个顺丰快递人员走进我们办公室大厅。其他同事都开会去了,就我一个人在写文档。

他问我:“你们这里有谁要发快递么?”

我回复:“我不需要哦。这办公室有人给你打过电话么?”

他答道:“打过了,他说在5楼大厅。”

我再问:“他姓什么?电话号码多少?”

他回复:“不知道,我手机放在车里了。本以为他就在大厅,很容易找到的。”

我笑着说:“如果这样的话,我也没办法帮你找人了。”

 

好吧,这就是中国最佳快递公司老员工的做事风格。他以前每次在大厅叫一声就能找到预约的客户,但这一次失灵了,因为他提供的信息不全,无法判断他当前的那位客户是谁。

 

这个几年我们除了做软件系统需求外还在做系统的问题管理和分析,以及提供解决方案。

在上千个问题处理过中发现一些问题很难有分析结果,因为当时接线员记录的信息很不全,无法重现问题的发生过程和找到问题发生时的日志片段。

这些问题只有等下次出现时,才有能有机会把它抓住。这对系统来说是个重大隐患。从运维角度来说,问题最好是越早发生,越早解决,免留后患。

 

做为一个一线工程师(接线员),接到一类未处理过的事件时,应该问最哪些要素并记录下来更有助于问题分析和解决呢?

 

建议要素:

1、报故人员信息:姓名,电话,岗位

2、系统信息:系统名,模块,功能、错误截图

3、操作流程:出错前做了哪业操作?期待的正确结果应该是什么?

4、业务数据:做什么业务?业单号?

5、时间和硬件:对方电脑IP,电脑上的系统时间

6、……一些还没想到的……

 

 

你可能感兴趣的:(系统运维)