使用异步HttpClient时线程hang住

某次处理问题,发现线上的某个线程池全部hang住,jstack发现堆栈如下

"pool-3-thread-50" #70 prio=5 os_prio=0 tid=0x00007fa451317800 nid=0x5f23 in Object.wait() [0x00007fa44e6e5000]
   java.lang.Thread.State: WAITING (on object monitor)
        at java.lang.Object.wait(Native Method)
        at java.lang.Object.wait(Object.java:502)
        at org.apache.http.concurrent.BasicFuture.get(BasicFuture.java:82)
        - locked <0x000000064203a720> (a org.apache.http.concurrent.BasicFuture)
以下省略

可以看到全部挂在httpClient等待响应完成时,排查代码时,发现我们所有的HttpClient都设置了超时时间(包括connectionTimeout/soTimeout)觉得不会发生这种错误;于是决定写代码模拟一下,发现在网络不可达的情况下很容易能复现这个问题,线程10分钟了依然在get这卡住;问题修复比较简单,org.apache.http.concurrent.BasicFuture有带超时参数的get方法,替换即可修复。

https://stackoverflow.com/questions/14700315/apache-httpasyncclient-hangs-under-load 也碰到类似的情况。

学习到的就是,做网络编程时,经常会把关注点放在连接属性的设置上,之前看各种超时都设置了,觉得应该没问题了,但是HttpClient本身的bug,导致异常情况下不会回调到org.apache.http.concurrent.BasicFuture.failed(Exception)或者org.apache.http.concurrent.BasicFuture.completed(T)方法,就会导致get()一直卡这导致线程挂死

你可能感兴趣的:(面试&&经历)