记一次有趣的bug查找

大概一年多之前,当时还开发系统,就发现在系统下载文件时候,经常会下载多份文件(点击一次),pm和测试都反映过,线下正常的,只有上了生产才会。花过一点时间寻找,没找到。由于不影响使用,而且需求紧急,pm赶着做其他,就没在意。
个月前,我开发的系统出现了bug,导出文件下载(对数据处理后进行excel导出)时,在线上有时会失败。我一直很纳闷,我线下的很正常啊。然后发现cpu used会异常飙升。于是看日志,只有个写入文件的异常。这更纳闷。按理说线上线下数据量差不多,lib版本一样,咋就这样。在这里给大家建议,遇到线上bug,一定多细致看下日志,别太略过。我要是一开始仔细的话,可以节省挺多时间。后面用tail log文件,手动点击,查看日志。发现异常了,点击一次,会导致多次请求,两次或者三次。。这就更奇怪了。。我在线下无法重现这个。。但是知道问题所在是个进步。。一步步来。。然后查看nginx日志。也是记录了多次请求。。这个时候头大了。。说明是应用请求的。。但是这无法解释线下正常啊。。于是乎。。我按了f12,查看network。。这个时候奇怪的东西出现了。。
果然也是请求了三次。。同时。。还显示加载了一个叫flash.js文件。。我在线下是没这个文件的。我也没写过这文件。。我以为遭到木马移植了。。马上看文件的来源。。显示的是内网下载的。。然后看文件的内容。去谷歌下。。也有人反映在公司下载东西会加载这个文件。。我细看这个文件内容。。不是什么恶意js。。只是记录设备的东西。。于是乎我明白了些。这个应该是公司在网关做的统计之类的工具。。
后面问了网络处的人。果然这样。。请他开了个白名单。。解决了
于是顿时,挺多开发急忙找他开白名单哈哈。我也算解决了公司一个未解之谜嘻嘻。。。
其实这件事挺小的。也不是啥大问题。。就是觉得有趣把。。总结
在线上遇到问题,第一时间保存环境,第二应该要细心看日志。。不止是看错误信息。还要看普通日志。。。

你可能感兴趣的:(测试)