java 并发死锁产生原因与诊断

一、 死锁的产生原因

并发死锁产生的原因一般是由于加锁顺序不一致引起的,假设一个事物需要获得连续获得两个资源的锁,如果执行事物的两个线程获得这两个锁的顺序不一致,就有可能产生死锁。


下面是我画的一个简单的说明图:


java 并发死锁产生原因与诊断_第1张图片
 

 在Dead lock point, 第一个线程拥有A锁,想获得B锁, 第二个线程拥有B锁,想获得A锁,两个线程相互拥有另一个线程所等待的资源。

造成这种局面的原因就是两个线程加锁的顺序不一样,一旦程序中产生死锁,唯一能做的就是杀死进程,重启应用。

 

二、用java代码实现死锁

 

运行以下代码,程序会一直运行,不退出。

 

 

package concurrent.deadlock;

import java.util.concurrent.TimeUnit;
import java.util.concurrent.locks.Lock;
import java.util.concurrent.locks.ReentrantLock;

/**
 * Created by vincent on 2015/9/3.
 */
public class TestDeadLock {
    private static Lock lockA = new ReentrantLock();
    private static Lock lockB = new ReentrantLock();

    public static void main(String args[]){
        new Thread(new Runnable() {
            @Override
            public void run() {
                try{
                    lockA.lock();
                    TimeUnit.SECONDS.sleep(2);
                    try{
                        lockB.lock();
                    }finally {
                        lockB.unlock();
                    }
                }catch (InterruptedException e) {

                }finally {
                    lockA.unlock();
                }
            }
        }).start();
        new Thread(new Runnable() {
            @Override
            public void run() {
                try{
                    lockB.lock();
                    TimeUnit.SECONDS.sleep(2);
                    try{
                        lockA.lock();
                    }finally {
                        lockA.unlock();
                    }
                }catch (InterruptedException e) {

                }finally {
                    lockB.unlock();
                }
            }
        }).start();
    }
} 

 代码链接: https://github.com/HongkaiWen/study/blob/master/src/main/java/concurrent/deadlock/TestDeadLock.java

 

三、程序产生死锁后的排查

 

产生死锁的现象就是程序停在那里,不会对调用者产生反馈。以我上边写的例子来说,就是程序无法退出。

下面以我这个例子来说明如何确定程序是因为死锁才停在那里。(这个程序是我故意写的死锁,一般的应用中是没有人会故意写死锁的,所以程序发生阻塞时,需要定位问题的原因)

 

windows平台:

我在我本机windows平台下运行我的死锁程序, 程序停在那里不动。

这时我打开jvisualvm.exe (jdk的bin目录下),这是一个图形界面程序,截图如下:

 

 java 并发死锁产生原因与诊断_第2张图片

关于此界面的说明:

首先左侧是一个JVM的进程列表,在列表中我可以找到我的应用的进程,单击目标进程即可查看进程详细信息。

右边很明显了,红色字体提示检测到死锁,点击线程Dump就可以查看进一步的详细信息了。

下面是一条一条的时间线是所有线程的状态了,Thread-1 和 Thread-2是我们的用户线程,黄色代表等待状态。

 

下面是线程dump的信息,信息比较多,我贴出关键部分:

Found one Java-level deadlock:
=============================
"Thread-1":
  waiting for ownable synchronizer 0x09df1d10, (a java.util.concurrent.locks.ReentrantLock$NonfairSync),
  which is held by "Thread-0"
"Thread-0":
  waiting for ownable synchronizer 0x09df1ef8, (a java.util.concurrent.locks.ReentrantLock$NonfairSync),
  which is held by "Thread-1"

 意思就是线程1等待线程2持有的资源,线程2等待线程1持有的资源,再下面的信息可以定位到具体代码的哪一行:

"Thread-1":
	at sun.misc.Unsafe.park(Native Method)
	- parking to wait for  <0x09df1d10> (a java.util.concurrent.locks.ReentrantLock$NonfairSync)
	at java.util.concurrent.locks.LockSupport.park(LockSupport.java:175)
	at java.util.concurrent.locks.AbstractQueuedSynchronizer.parkAndCheckInterrupt(AbstractQueuedSynchronizer.java:836)
	at java.util.concurrent.locks.AbstractQueuedSynchronizer.acquireQueued(AbstractQueuedSynchronizer.java:870)
	at java.util.concurrent.locks.AbstractQueuedSynchronizer.acquire(AbstractQueuedSynchronizer.java:1199)
	at java.util.concurrent.locks.ReentrantLock$NonfairSync.lock(ReentrantLock.java:209)
	at java.util.concurrent.locks.ReentrantLock.lock(ReentrantLock.java:285)
	at concurrent.TestDeadLock$2.run(TestDeadLock.java:40)
	at java.lang.Thread.run(Thread.java:745)
"Thread-0":
	at sun.misc.Unsafe.park(Native Method)
	- parking to wait for  <0x09df1ef8> (a java.util.concurrent.locks.ReentrantLock$NonfairSync)
	at java.util.concurrent.locks.LockSupport.park(LockSupport.java:175)
	at java.util.concurrent.locks.AbstractQueuedSynchronizer.parkAndCheckInterrupt(AbstractQueuedSynchronizer.java:836)
	at java.util.concurrent.locks.AbstractQueuedSynchronizer.acquireQueued(AbstractQueuedSynchronizer.java:870)
	at java.util.concurrent.locks.AbstractQueuedSynchronizer.acquire(AbstractQueuedSynchronizer.java:1199)
	at java.util.concurrent.locks.ReentrantLock$NonfairSync.lock(ReentrantLock.java:209)
	at java.util.concurrent.locks.ReentrantLock.lock(ReentrantLock.java:285)
	at concurrent.TestDeadLock$1.run(TestDeadLock.java:22)
	at java.lang.Thread.run(Thread.java:745)

 

linux平台

 一般linux平台不太方便用图形界面的工具,而一般java的程序都是部署在linux平台上的,这种环境程序发生阻塞时要怎么办呢,和windows思路是一样的,只不过是工具不同而已。

首先我在linux上运行我的java程序,程序如期卡住。



 

这时,我运行进程查看命令,找到我的进程:



 

此时可以通过jstack命令导出jvm的栈调用信息:

 

java 并发死锁产生原因与诊断_第3张图片
 
 

 下面是stack.txt中导出的信息(部分):

 找到了和之前windows一样的信息。

Found one Java-level deadlock:
=============================
"Thread-1":
  waiting for ownable synchronizer 0x00000000d6c68848, (a java.util.concurrent.locks.ReentrantLock$NonfairSync),
  which is held by "Thread-0"
"Thread-0":
  waiting for ownable synchronizer 0x00000000d6c68878, (a java.util.concurrent.locks.ReentrantLock$NonfairSync),
  which is held by "Thread-1"

Java stack information for the threads listed above:
===================================================
"Thread-1":
	at sun.misc.Unsafe.park(Native Method)
	- parking to wait for  <0x00000000d6c68848> (a java.util.concurrent.locks.ReentrantLock$NonfairSync)
	at java.util.concurrent.locks.LockSupport.park(LockSupport.java:186)
	at java.util.concurrent.locks.AbstractQueuedSynchronizer.parkAndCheckInterrupt(AbstractQueuedSynchronizer.java:834)
	at java.util.concurrent.locks.AbstractQueuedSynchronizer.acquireQueued(AbstractQueuedSynchronizer.java:867)
	at java.util.concurrent.locks.AbstractQueuedSynchronizer.acquire(AbstractQueuedSynchronizer.java:1197)
	at java.util.concurrent.locks.ReentrantLock$NonfairSync.lock(ReentrantLock.java:214)
	at java.util.concurrent.locks.ReentrantLock.lock(ReentrantLock.java:290)
	at concurrent.deadlock.TestDeadLock$2.run(TestDeadLock.java:40)
	at java.lang.Thread.run(Thread.java:745)
"Thread-0":
	at sun.misc.Unsafe.park(Native Method)
	- parking to wait for  <0x00000000d6c68878> (a java.util.concurrent.locks.ReentrantLock$NonfairSync)
	at java.util.concurrent.locks.LockSupport.park(LockSupport.java:186)
	at java.util.concurrent.locks.AbstractQueuedSynchronizer.parkAndCheckInterrupt(AbstractQueuedSynchronizer.java:834)
	at java.util.concurrent.locks.AbstractQueuedSynchronizer.acquireQueued(AbstractQueuedSynchronizer.java:867)
	at java.util.concurrent.locks.AbstractQueuedSynchronizer.acquire(AbstractQueuedSynchronizer.java:1197)
	at java.util.concurrent.locks.ReentrantLock$NonfairSync.lock(ReentrantLock.java:214)
	at java.util.concurrent.locks.ReentrantLock.lock(ReentrantLock.java:290)
	at concurrent.deadlock.TestDeadLock$1.run(TestDeadLock.java:22)
	at java.lang.Thread.run(Thread.java:745)

Found 1 deadlock.

 

 四、死锁程序的预防与处理

 避免 死锁的方法就是不要写 顺序不一致加锁 的代码

 如果 必须要写顺序不一致的加锁的代码,可以采用 trylock 方法,避免程序一直等待。

 预防 死锁可以采用finddebug插件去扫描代码发现死锁。

 处理 死锁,如果运行中的程序已经发生死锁,据我所知没有别的办法,只能停止程序,代价非常大,所以要尽量避免死锁。

 

关于死锁的避免与预防有时间我再整理一下分享一下我的心得。

关于并发编程,想要写出正确可靠高性能的程序实在比较难,我知道的也是一些皮毛,欢迎大家批评指正,互相学习。

如需转载请注明出处:  http://waitingkkk-163-com.iteye.com/blog/2240412

 

 

 

你可能感兴趣的:(java,concurrency)