教你如何快速排查死锁,如何避免死锁!

文章目录

  • 前言
  • 实例
  • 通过jdk工具jps、jstack排查死锁问题
    • 步骤一:使用jsp查找程序进行
    • 通过jdk提供的工具jconsole排查死锁问题
    • 通过jdk提供的工具VisualVM排查死锁问题
  • 如何避免死锁?
    • 1. 正确的顺序获得锁
    • 2. 超时放弃
  • 总结

前言

相信程序员都会碰上这样的问题,Java死锁如何排查?又如何解决呢?那么,何为死锁呢?死锁是指两个或两个以上的进程在执行过程中,由于竞争资源或者由于彼此通信而造成的一种阻塞的现象。今天老顾一次性来帮助大家解决Java死锁的有关问题。

实例

死锁的本质,举个例子如果此时有一个线程 A ,按照先获持有锁 a 再获取锁 b的顺序获得锁,同时另外一个线程 B,按照先获取锁 b 再获取锁 a 的顺序获取锁。如下图所示:
教你如何快速排查死锁,如何避免死锁!_第1张图片
接着我们用代码模拟上线的执行过程
教你如何快速排查死锁,如何避免死锁!_第2张图片
直接运行,发现主线程一直处于执行中,一直无法结束
教你如何快速排查死锁,如何避免死锁!_第3张图片

通过jdk工具jps、jstack排查死锁问题

步骤一:使用jsp查找程序进行

jps:jdk提供的一个工具,可以查看到正在运行的java进程
教你如何快速排查死锁,如何避免死锁!_第4张图片
步骤二:使用jstack查看线程堆栈信息

jstack:jdk提供的一个工具,可以查看java进程中线程堆栈信息。更详细的用法见文档最后。

$ jstack 96521

教你如何快速排查死锁,如何避免死锁!_第5张图片
从上面的堆栈信息中我们可以发现这个内容:“Found one Java-level deadlock”,表示程序中发现了一个死锁,后面包含更多详细的信息,重点下面:
教你如何快速排查死锁,如何避免死锁!_第6张图片
死锁的代码是在DeadLock.java的32行和18行,此时我们就可以去优化代码,解决死锁问题。

通过jdk提供的工具jconsole排查死锁问题

jconsole:jdk提供的一个可视化的工具,方便排查程序的一些问题,如:程序内存溢出、死锁问题等等。更详细的用法见文档最后。jconsole位于jdk的bin目录中

$ jconsole

教你如何快速排查死锁,如何避免死锁!_第7张图片
可以看到我们的程序,点击连接。
教你如何快速排查死锁,如何避免死锁!_第8张图片
点击“检测死锁”,可以看到程序死锁信息
教你如何快速排查死锁,如何避免死锁!_第9张图片
上图中可以看到详细的死锁信息,和jstack中信息类似。

通过jdk提供的工具VisualVM排查死锁问题

VisualVM:jdk提供的一个非常强大的排查java程序问题的一个工具,可以监控程序的性能、查看jvm配置信息、堆快照、线程堆栈信息。算是程序优化的必备工具。工具位于jdk的bin目录中。

$ jvisualvm

教你如何快速排查死锁,如何避免死锁!_第10张图片
切换到“线程”窗口
教你如何快速排查死锁,如何避免死锁!_第11张图片
执行提示有死锁情况。在线程窗口中点击“线程Dump”按钮。
查看堆栈信息
教你如何快速排查死锁,如何避免死锁!_第12张图片
线程堆栈快照的信息和jstack查看到的信息一样,即可发现死锁代码。

如何避免死锁?

我们知道了死锁如何产生的,那么就知道该如何去预防。如果一个线程每次只能获取一个锁,那么就不会出现由于嵌套持有锁顺序导致的死锁

1. 正确的顺序获得锁

如果必须获取多个锁,我们就要考虑不同线程获取锁的顺序。

上面的例子出现死锁的根本原因就是获取所的顺序是乱序的,超乎我们控制的。上面例子最理想的情况就是把业务逻辑抽离出来,把获取锁的代码放在一个公共的方法里面,让这两个线程获取锁都是从我的公共的方法里面获取

当Thread1线程进入公共方法时,获取了A锁,另外Thread2又进来了,但是A锁已经被Thread1线程获取了,所以只能阻塞等待。Thread1接着又获取锁B,Thread2线程就不能再获取不到了锁A,更别说再去获取锁B了,这样就有一定的顺序了。只有当线程1释放了所有锁,线程B才能获取。

比如前面的例子我们改成
教你如何快速排查死锁,如何避免死锁!_第13张图片
查看打印结果,我们发现 线程0 获取成功然后线程1才能继续获取
教你如何快速排查死锁,如何避免死锁!_第14张图片

2. 超时放弃

当线程获取锁超时了则放弃,这样就避免了出现死锁获取的情况。当使用synchronized关键词提供的内置锁时,只要线程没有获得锁,那么就会永远等待下去,然而Lock接口提供了boolean tryLock(long time, TimeUnit unit) throws InterruptedException方法,该方法可以按照固定时长等待锁,因此线程可以在获取锁超时以后,主动释放之前已经获得的所有的锁。通过这种方式,也可以很有效地避免死锁。

总结

死锁就是“两个任务以不合理的顺序互相争夺资源”造成,因此为了规避死锁,应用程序需要妥善处理资源获取的顺序。另外有些时候,死锁并不会马上在应用程序中体现出来,在通常情况下,都是应用在生产环境运行了一段时间后,才开始慢慢显现出来,在实际测试过程中,由于死锁的隐蔽性,很难在测试过程中及时发现死锁的存在,而且在生产环境中,应用出现了死锁,往往都是在应用状况最糟糕的时候——在高负载情况下。因此,开发者在开发过程中要谨慎分析每个系统资源的使用情况,合理规避死锁。

你可能感兴趣的:(Java,多线程,JDK)