JVM TI学习(1)----如何中断weblogic中stuck thread
JPDA(Java Platform Debugger Architecture)是sun推出的一套工具接口,有了这些接口,debugger、profile工具可以attach到target JVM,进而可以监控、调试我们的程序。JPDA包括三部分:JVM TI, JDI, JDWP。TI可以使用native语言,通过调用jvmti.c提供的系列库函数,实现debug工作,而JDI是TI面向Java开发人员提供的高层开发接口。TI代替了早期的DI,每个版本都做了一定的功能增强。随着JDK的发展,JPDA变得越发强大,比如thread信息检查、method调用跟踪、memory walk-through、perm内存区检查等,有了这些接口,我们完全可以自己造出类似于:jhat、jmap、jstack、jconsole这样的车子。用一句过时话来说:JPDA,很好很强大。
在Weblogic中,我们通常能看到像下面这样的警告信息:
BEA-000337 Feb 1, 2007 11:01:05 AM EST Error WebLogicServer ExecuteThread: '14' for queue: 'weblogic.kernel.Default' has been busy for "72" seconds working on the request "connection82.session95", which is more than the configured time (StuckThreadMaxTime) of "60" seconds.
这样的信息只是一个提示,告诉最终用户某个执行线程执行了多长时间(只有执行时间超过StuckThread-MaxTime,默认600秒),用户可以根据这些信息,分析对应的请求执行了这么长时间是否正常,如果在预期或可以接受范围内,不用作任何干预,否则我们需要借助于thread dump分析执行时间的瓶颈。出现这样的警告信息,weblogic不会对这样的线程作任何操作(weblogic无法识别这么长的执行时间是不是用户所预期的,比如报表操作、文件传输等本身可能就很耗时),直到线程结束。线程能执行结束还好,如果是死锁呢? 这样的线程会一直被挂着,直到weblogic重启。重启对于很多生产系统而言是最后的选择,那么我们有什么方法来避免重启呢? Weblogic9以后,线程管理方面work manager代替了早期的thread pool,而且work manager提供了stuck thread的管理,比如出现几个stuck thread后,我们可以要求work manager停止应用,避免更多的线程被stuck。weblogic停止应用只是不提供服务,但还是不会影响正在执行的线程。
曾经不止一次的被客户问道我们能否中断这样的线程,从weblogic层面来看,这是mission impossible。现在有了TI,我们可以通过它中断这样的线程。
要中断这样的线程,首先要借助thread dump拿到线程名,我们将以线程名为filter。Thread dump信息如下:
"[ACTIVE] ExecuteThread: '2' for queue: 'weblogic.kernel.Default (self-tuning)'" daemon prio=6 tid=0x2b25a800 nid=0x3c0 waiting on condition [0x2e08f000..0x2e08fa14]
java.lang.Thread.State: TIMED_WAITING (sleeping)
at java.lang.Thread.sleep(Native Method)
......
上面这个线程的名字就是:[ACTIVE] ExecuteThread: '2' for queue: 'weblogic.kernel.Default (self-tuning)'
为了能正确的attach上JVM,启动的时候需要加上如下的JAVA_OPTIONS,
-Xdebug -Xrunjdwp:transport=dt_socket,address=9191,server=y,suspend=n
现在我们就可以下面的方法attach到target JVM,
1
private
VirtualMachine connectVM(){
2 VirtualMachineManager vmm = Bootstrap.virtualMachineManager();
3 List connectors = vmm.attachingConnectors();
4 Connector conn = null ;
5 AttachingConnector socketAttachingConnector = null ;
6 /*
7 * host and port should be set here
8 */
9 .
10 try {
11 vm = socketAttachingConnector.attach(arguments);
12 } catch (Exception e){
13 e.printStackTrace();
14 }
15 return this .vm;
16 }
2 VirtualMachineManager vmm = Bootstrap.virtualMachineManager();
3 List connectors = vmm.attachingConnectors();
4 Connector conn = null ;
5 AttachingConnector socketAttachingConnector = null ;
6 /*
7 * host and port should be set here
8 */
9 .
10 try {
11 vm = socketAttachingConnector.attach(arguments);
12 } catch (Exception e){
13 e.printStackTrace();
14 }
15 return this .vm;
16 }
有了线程名、connection,我们就可以用下面的方法去中断挂死线程了,
1
public
void
terminateThread(String threadPattern){
2 if (vm != null ){
3 List threads = vm.allThreads();
4 ThreadReference tr = null ;
5 int loop = - 1 ;
6 for (loop = 0 ; loop < threads.size(); loop ++ ){
7 if (tr.toString().indexOf(threadPattern) != - 1 ){
8 tr.interrupt();
9 System.out.println(threadPattern + " is terminated! " );
10 break ;
11 }
12 }
13 if (loop == threads.size())
14 System.out.println( " no matched thread was found in target VM! " );
15 }
16 }
2 if (vm != null ){
3 List threads = vm.allThreads();
4 ThreadReference tr = null ;
5 int loop = - 1 ;
6 for (loop = 0 ; loop < threads.size(); loop ++ ){
7 if (tr.toString().indexOf(threadPattern) != - 1 ){
8 tr.interrupt();
9 System.out.println(threadPattern + " is terminated! " );
10 break ;
11 }
12 }
13 if (loop == threads.size())
14 System.out.println( " no matched thread was found in target VM! " );
15 }
16 }
线程被中断的时候,会收到InterruptedExcetpion,比如我在测试中让线程sleep,然后利用上面的程序去中断sleep,收到的异常如下:
java.lang.InterruptedException: sleep interrupted
at java.lang.Thread.sleep(Native Method)
at test.jpda.clazz.Test2.run(Test2.java:14)
at test.jpda.clazz.Test1.run(Test1.java:10)
at test.jpda.clazz.Test.run(Test.java:9)
at jsp_servlet.__index._jspService(__index.java:91)
at weblogic.servlet.jsp.JspBase.service(JspBase.java:34)
at weblogic.servlet.internal.StubSecurityHelper$ServletServiceAction.run(StubSecurityHelper.java:227)
at weblogic.servlet.internal.StubSecurityHelper.invokeServlet(StubSecurityHelper.java:125)
at weblogic.servlet.internal.ServletStubImpl.execute(ServletStubImpl.java:292)
at weblogic.servlet.internal.ServletStubImpl.execute(ServletStubImpl.java:175)
at weblogic.servlet.internal.WebAppServletContext$ServletInvocationAction.ru(WebAppServletContext.java:3498)
at weblogic.security.acl.internal.AuthenticatedSubject.doAs(AuthenticatedSubject.java:321)
at weblogic.security.service.SecurityManager.runAs(Unknown Source)
at weblogic.servlet.internal.WebAppServletContext.securedExecute(WebAppServletContext.java:2180)
at weblogic.servlet.internal.WebAppServletContext.execute(WebAppServletContext.java:2086)
at weblogic.servlet.internal.ServletRequestImpl.run(ServletRequestImpl.java:1406)
at weblogic.work.ExecuteThread.execute(ExecuteThread.java:201)
at weblogic.work.ExecuteThread.run(ExecuteThread.java:173)
注意:线程名一定不能写错啊,否则就可能误杀了,老板批你别怨俺。