【bug 回顾】上传图片超时

测试 bug 问题分析 - 上传图片超时

最近在测试上遇到一个莫名奇妙的问题,最后也没有得到具体是哪块的原因,看各位大佬有没有思路??

一 、背景

现在我们有三台服务器,用来布两套环境。其中另外一台服务器3配置的 tomcat ,用来做文件管理之类的。两套环境完全一样的代码和配置,环境1部在服务器1,环境2部在服务器2。

二、问题

上传照片大于4MB的图片时候服务器2会卡顿 tomcat 报超时,但是服务器1没有任何问题。

三、排查过程

1、排查服务器 cpu内存 问题

服务器 cpu 和 内存,发现没有异常,故排除

2、排查线程问题

在上传时候开了多线程,没有用线程池(老代码),arthas 和 dunp文件看线程没有任何问题

3、更改 tomcat 超时时间 20s -> 40s

因为主要报的是超时,所以更改了超时时间,但是是治标不治本的。

4、用别的服务器 ping 服务器 3, 均出现丢包问题 loss 在 5 左右

在这里大致就排除了代码的问题,为了验证这个问题,就用同样的代码在别的服务器运行,就没有发现有这个问题。因此在此时就锁定了是服务器本身的问题,但是具体是网络还是网卡还是其他的问题,还需要进行深度的排查。

5、排查服务器本身问题

在发现 ping 出 loss 的情况下,然后就在两个测试服务器调同一个接口,发现相应时间有很大的差别,一个是 100 ms 左右,但是有问题的都在 800 ms 上下。

因为我们用的是阿里云服务器,有可视化监控,可以看到网速能达到 10 M/S,可以看出网络的速度是没有问题的。

四、问题解决

最后尝试重启服务器,问题就解决了。。但是具体的问题我们现在推测是网卡的问题,但是无法的到验证了。

重启大法好!!!!

你可能感兴趣的:(bug,bug)