JVM TI学习(1)----如何中断weblogic中stuck thread

JVM TI学习(1)----如何中断weblogic中stuck thread
      JPDA(Java Platform Debugger Architecture)是sun推出的一套工具接口,有了这些接口,debugger、profile工具可以attach到target JVM,进而可以监控、调试我们的程序。JPDA包括三部分:JVM TI, JDI, JDWP。TI可以使用native语言,通过调用jvmti.c提供的系列库函数,实现debug工作,而JDI是TI面向Java开发人员提供的高层开发接口。TI代替了早期的DI,每个版本都做了一定的功能增强。随着JDK的发展,JPDA变得越发强大,比如thread信息检查、method调用跟踪、memory walk-through、perm内存区检查等,有了这些接口,我们完全可以自己造出类似于:jhat、jmap、jstack、jconsole这样的车子。用一句过时话来说:JPDA,很好很强大。

        在Weblogic中,我们通常能看到像下面这样的警告信息:
BEA-000337 Feb 1, 2007 11:01:05 AM EST Error WebLogicServer ExecuteThread: '14' for queue: 'weblogic.kernel.Default' has been busy for "72" seconds working on the request "connection82.session95", which is more than the configured time (StuckThreadMaxTime) of "60" seconds.

         这样的信息只是一个提示,告诉最终用户某个执行线程执行了多长时间(只有执行时间超过StuckThread-MaxTime,默认600秒),用户可以根据这些信息,分析对应的请求执行了这么长时间是否正常,如果在预期或可以接受范围内,不用作任何干预,否则我们需要借助于thread dump分析执行时间的瓶颈。出现这样的警告信息,weblogic不会对这样的线程作任何操作(weblogic无法识别这么长的执行时间是不是用户所预期的,比如报表操作、文件传输等本身可能就很耗时),直到线程结束。线程能执行结束还好,如果是死锁呢? 这样的线程会一直被挂着,直到weblogic重启。重启对于很多生产系统而言是最后的选择,那么我们有什么方法来避免重启呢? Weblogic9以后,线程管理方面work manager代替了早期的thread pool,而且work manager提供了stuck thread的管理,比如出现几个stuck thread后,我们可以要求work manager停止应用,避免更多的线程被stuck。weblogic停止应用只是不提供服务,但还是不会影响正在执行的线程。

         曾经不止一次的被客户问道我们能否中断这样的线程,从weblogic层面来看,这是mission impossible。现在有了TI,我们可以通过它中断这样的线程。

          要中断这样的线程,首先要借助thread dump拿到线程名,我们将以线程名为filter。Thread dump信息如下:

"[ACTIVE] ExecuteThread: '2' for queue: 'weblogic.kernel.Default (self-tuning)'" daemon prio=6 tid=0x2b25a800 nid=0x3c0 waiting on condition [0x2e08f000..0x2e08fa14]
 java.lang.Thread.State: TIMED_WAITING (sleeping)
      at java.lang.Thread.sleep(Native Method)
      ......
上面这个线程的名字就是:[ACTIVE] ExecuteThread: '2' for queue: 'weblogic.kernel.Default (self-tuning)'

         为了能正确的attach上JVM,启动的时候需要加上如下的JAVA_OPTIONS,
         -Xdebug -Xrunjdwp:transport=dt_socket,address=9191,server=y,suspend=n

         现在我们就可以下面的方法attach到target JVM,
 1       private  VirtualMachine connectVM(){
 2              VirtualMachineManager vmm  =  Bootstrap.virtualMachineManager();
 3              List connectors  =  vmm.attachingConnectors();
 4              Connector conn  =   null ;
 5              AttachingConnector socketAttachingConnector  =   null
 6               /*
 7              * host and port should be set here
 8               */
 9              .
10         try {
11            vm  =  socketAttachingConnector.attach(arguments);
12        } catch (Exception e){
13            e.printStackTrace();
14        }
15         return   this .vm;
16      }

        有了线程名、connection,我们就可以用下面的方法去中断挂死线程了,
 1       public   void  terminateThread(String threadPattern){
 2           if (vm  !=   null ){
 3              List threads  =  vm.allThreads();
 4              ThreadReference tr  =   null ;
 5               int  loop  =   - 1 ;
 6               for (loop = 0 ; loop < threads.size(); loop ++ ){
 7                   if (tr.toString().indexOf(threadPattern)  !=   - 1 ){
 8                      tr.interrupt();
 9                      System.out.println(threadPattern  +   "  is terminated! " );
10                       break ;
11                  }
12              }
13               if (loop  ==  threads.size())
14                  System.out.println( " no matched thread was found in target VM! " );
15          }
16      }
        
        线程被中断的时候,会收到InterruptedExcetpion,比如我在测试中让线程sleep,然后利用上面的程序去中断sleep,收到的异常如下:

java.lang.InterruptedException: sleep interrupted
        at java.lang.Thread.sleep(Native Method)
        at test.jpda.clazz.Test2.run(Test2.java:14)
        at test.jpda.clazz.Test1.run(Test1.java:10)
        at test.jpda.clazz.Test.run(Test.java:9)
        at jsp_servlet.__index._jspService(__index.java:91)
        at weblogic.servlet.jsp.JspBase.service(JspBase.java:34)
        at weblogic.servlet.internal.StubSecurityHelper$ServletServiceAction.run(StubSecurityHelper.java:227)
        at weblogic.servlet.internal.StubSecurityHelper.invokeServlet(StubSecurityHelper.java:125)
        at weblogic.servlet.internal.ServletStubImpl.execute(ServletStubImpl.java:292)
        at weblogic.servlet.internal.ServletStubImpl.execute(ServletStubImpl.java:175)
        at weblogic.servlet.internal.WebAppServletContext$ServletInvocationAction.ru(WebAppServletContext.java:3498)
        at weblogic.security.acl.internal.AuthenticatedSubject.doAs(AuthenticatedSubject.java:321)
        at weblogic.security.service.SecurityManager.runAs(Unknown Source)
        at weblogic.servlet.internal.WebAppServletContext.securedExecute(WebAppServletContext.java:2180)
        at weblogic.servlet.internal.WebAppServletContext.execute(WebAppServletContext.java:2086)
        at weblogic.servlet.internal.ServletRequestImpl.run(ServletRequestImpl.java:1406)
        at weblogic.work.ExecuteThread.execute(ExecuteThread.java:201)
        at weblogic.work.ExecuteThread.run(ExecuteThread.java:173)        


注意:线程名一定不能写错啊,否则就可能误杀了,老板批你别怨俺。

你可能感兴趣的:(JVM TI学习(1)----如何中断weblogic中stuck thread)