Java并发编程之Condition

1. 前言

任意一个Java对象,都有一组监视器方法(定义在java.lang.Object上),主要包括wait()、wait(long timeout)、notify()以及notifyAll()方法,这些方法与synchronized同步关键字配合,可以 实现等待/通知模式。Condition接口也提供了类似Object的监视器方法,与Lock配合可以实现等 待/通知模式,但是这两者在使用方式以及功能特性上还是有差别的。


Object的监视器方法与Condition接口的对比

2. Condition的基本使用

Condition 是一个多线程协调通信的工具类,可以让某些线程一起等待某个条件(condition),只有满足条件时,线程才会被唤醒。

2.1 ConditionWait

public class ConditionDemoWait implements Runnable{
    
    private Lock lock;

    private Condition condition;

    public ConditionDemoWait(Lock lock, Condition condition) {
        this.lock = lock;
        this.condition = condition;
    }
    
    @Override
    public void run() {
        System.out.println("begin - ConditionDemoWait");
        try {
            lock.lock();
            condition.await();
            System.out.println("end - ConditionDemoWait");
        } catch (InterruptedException e) {
            e.printStackTrace();
        } finally {
            lock.unlock();
        }
    }
}

2.2 ConditionSignal

public class ConditionDemoSignal implements Runnable{

    private Lock lock;
    private Condition condition;
    public ConditionDemoSignal(Lock lock, Condition condition){
        this.lock=lock;
        this.condition=condition;
    }

    @Override
    public void run() {
        System.out.println("begin - ConditionDemoSignal");
        try {
            lock.lock();
            condition.signal();
            System.out.println("end - ConditionDemoSignal");
        } finally {
            lock.unlock();
        }
    }
}

通过这个案例简单实现了 wait 和 notify 的功能,当调用await 方法后,当前线程会释放锁并等待,而其他线程调用condition 对象的 signal 或者 signalall 方法通知并被阻塞的线程,然后自己执行 unlock 释放锁,被唤醒的线程获得之前的锁继续执行,最后释放锁。所以,condition 中两个最重要的方法,一个是 await,一个是 signal 方法。
await:把当前线程阻塞挂起
signal:唤醒阻塞的线程

3. Condition源码分析

Condition 与 Object 的 wait()/notify()作用是相似的:都是使得一个线程等待某个条件(Condition),只有当该条件具备(signal 或者 signalAll 方法被调用)时等待线程才会被唤醒,从而重新争夺锁。
不同的是:Object 的 wait()/notify()由 JVM 底层的实现,而 Condition 接口与实现类完全使用Java代码实现。当需要进行线程间的通信时,建议结合使用 ReetrantLock与Condition,通过 Condition 的 await()和 signal()方法进行线程间的阻塞与唤醒。ConditionObject 类是实现条件队列的关键,每个 ConditionObject 对象都维护一个单独的条件等待队列。每个 ConditionObject 对应一个条件队列,它记录该队列的头节点和尾节点。


Condition

一个 Condition 对象是一个单条件的等待队列,如图所示:


一个 Condition 单条件的等待队列

在一个显式锁上,我们可以创建多个等待任务队列,这点和内置锁不同,Java 内置锁上只有唯一的一个等待队列。比如,我们可以使用 newCondition 创建两个等待队列,具体如下:
private Lock lock = new ReentrantLock();
 //创建第一个等待队列 
 private Condition firstCond = lock.newCondition();
 //创建第二个等待队列 
 private Condition secondCond = lock.newCondition();

Condition 条件队列与 AQS 同步队列的关系,如图所示:


Condition 条件队列与 AQS 同步队列的关系

调用 Condition,需要获得 Lock 锁,所以意味着会存在一个 AQS 同步队列,在上面那个案例中,假如两个线程同时运行的话,那么 AQS 的队列可能是下面这种情况:


AQS 队列可能出现的情况

那么这个时候 ThreadA 调用了 condition.await 方法,它做了什么事情呢?

3.1 condition.await

调用 Condition 的 await()方法(或者以 await 开头的方法),会使当前线程进入等待队列并释放锁,同时线程状态变为等待状态。当从 await()方法返回时,当前线程一定获取了Condition 相关联的锁。

       public final void await() throws InterruptedException {
            //表示 await 允许被中断
            if (Thread.interrupted())
                throw new InterruptedException();
            //创建一个新的节点,节点状态为 condition,采用的数据结构仍然是链表
            Node node = addConditionWaiter();
            //释放当前的锁,得到锁的状态,并唤醒 AQS 队列中的一个线程
            int savedState = fullyRelease(node);
            int interruptMode = 0;
            //如果当前节点没有在同步队列上,即还没有被 signal,则将当前线程阻塞
            //判断这个节点是否在 AQS 队列上,第一次判断的是 false,因为前面已经释放锁了
            while (!isOnSyncQueue(node)) {
                //通过 park 挂起当前线程
                LockSupport.park(this);
                if ((interruptMode = checkInterruptWhileWaiting(node)) != 0)
                    break;
            }
            // 当这个线程醒来,会尝试拿锁, 当 acquireQueued返回 false 就是拿到锁了.
            // interruptMode != THROW_IE -> 表示这个线程没有成功将 node 入队,但 signal 执行了 enq 方法让其入队了.
            // 将这个变量设置成 REINTERRUPT.
            if (acquireQueued(node, savedState) && interruptMode != THROW_IE)
                interruptMode = REINTERRUPT;
            // 如果 node 的下一个等待者不是 null, 则进行清理,清理 Condition 队列上的节点.
            // 如果是 null ,就没有什么好清理的了.
            if (node.nextWaiter != null) // clean up if cancelled
                unlinkCancelledWaiters();
            // 如果线程被中断了,需要抛出异常.或者什么都不做
            if (interruptMode != 0)
                reportInterruptAfterWait(interruptMode);
        }

3.1.1 addConditionWaiter

这个方法的主要作用是把当前线程封装成 Node,添加到等待队列。这里的队列不再是双向链表,而是单向链表。

        private Node addConditionWaiter() {
            Node t = lastWaiter;
            // If lastWaiter is cancelled, clean out.
            // 如果lastWaiter不等于空并且waitStatus 不等于 CONDITION 时,把这个节点从链表中移除
            if (t != null && t.waitStatus != Node.CONDITION) {
                unlinkCancelledWaiters();
                t = lastWaiter;
            }
            //构建一个 Node,waitStatus=CONDITION。这里的链表是一个单向的,所以相比 AQS 来说会简单很多
            Node node = new Node(Thread.currentThread(), Node.CONDITION);
            if (t == null)
                firstWaiter = node;
            else
                t.nextWaiter = node;
            lastWaiter = node;
            return node;
        }

3.1.2 图解分析

执行完 addConditionWaiter 这个方法之后,就会产生一个这样的 condition 队列


condition 队列

3.1.3 fullyRelease

fullRelease,就是彻底的释放锁,什么叫彻底呢,就是如果当前锁存在多次重入,那么在这个方法中只需要释放一次就会把所有的重入次数归零。

    final int fullyRelease(Node node) {
        boolean failed = true;
        try {
            //获得重入的次数
            int savedState = getState();
            // 释放锁并且唤醒下一个同步队列中的线程
            if (release(savedState)) {
                failed = false;
                return savedState;
            } else {
                throw new IllegalMonitorStateException();
            }
        } finally {
            if (failed)
                node.waitStatus = Node.CANCELLED;
        }
    }

3.1.4 图解分析

此时,同步队列会触发锁的释放和重新竞争。ThreadB 获得了锁。


image.png

3.1.5 isOnSyncQueue

判断当前节点是否在同步队列中,返回 false 表示不在,返回 true 表示在,如果不在 AQS 同步队列,说明当前节点没有唤醒去争抢同步锁,所以需要把当前线程阻塞起来,直到其他的线程调用 signal 唤醒,如果在 AQS 同步队列,意味着它需要去竞争同步锁去获得执行程序执行权限。
为什么要做这个判断呢?
原因是在 condition 队列中的节点会重新加入到 AQS 队列去竞争锁。也就是当调用 signal的时候,会把当前节点从 condition 队列转移到 AQS 队列。
如何去判断ThreadA 这个节点是否存在于 AQS 队列中呢?

  1. 如果 ThreadA 的 waitStatus 的状态为 CONDITION,说明它存在于 condition 队列中,不在 AQS 队列。因为AQS 队列的状态一定不可能有 CONDITION
  2. 如果 node.prev 为空,说明也不存在于 AQS 队列,原因是 prev=null 在 AQS 队列中只有一种可能性,就是它是head 节点,head 节点意味着它是获得锁的节点。
  3. 如果 node.next 不等于空,说明一定存在于 AQS 队列中,因为只有 AQS 队列才会存在 next 和 prev 的关系
  4. findNodeFromTail,表示从 tail 节点往前扫描 AQS 队列,一旦发现 AQS 队列的节点和当前节点相等,说明节点一定存在于 AQS 队列中。
    final boolean isOnSyncQueue(Node node) {
        if (node.waitStatus == Node.CONDITION || node.prev == null)
            return false;
        if (node.next != null) // If has successor, it must be on queue
            return true;
        /*
         * node.prev can be non-null, but not yet on queue because
         * the CAS to place it on queue can fail. So we have to
         * traverse from tail to make sure it actually made it.  It
         * will always be near the tail in calls to this method, and
         * unless the CAS failed (which is unlikely), it will be
         * there, so we hardly ever traverse much.
         */
        return findNodeFromTail(node);
    }

3.2 Condition.signal

await 方法会阻塞 ThreadA,然后 ThreadB 抢占到了锁获得了执行权限,这个时候在 ThreadB 中调用了 Condition的 signal()方法,将会唤醒在等待队列中节点。

        public final void signal() {
            //先判断当前线程是否获得了锁,这个判断比较简单,直接用获得锁的线程和当前线程相比即可
            if (!isHeldExclusively())
                throw new IllegalMonitorStateException();
            // 拿到 Condition队列上第一个节点
            Node first = firstWaiter;
            if (first != null)
                doSignal(first);
        }

3.2.1 Condition.doSignal

对 condition 队列中从首部开始的第一个 condition 状态的节点,执行 transferForSignal 操作,将 node 从 condition队列中转换到 AQS 队列中,同时修改 AQS 队列中原先尾节点的状态

       private void doSignal(Node first) {
            do {
                //从 Condition 队列中删除 first 节点
                if ( (firstWaiter = first.nextWaiter) == null)
                    // 将 next 节点设置成 null
                    lastWaiter = null;
                first.nextWaiter = null;
            } while (!transferForSignal(first) &&
                     (first = firstWaiter) != null);
        }

3.2.2 AQS.transferForSignal

该方法先是 CAS 修改了节点状态,如果成功,就将这个节点放到 AQS 队列中,然后唤醒这个节点上的线程。此时,那个节点就会在 await 方法中苏醒

    final boolean transferForSignal(Node node) {
        /*
         * If cannot change waitStatus, the node has been cancelled.
         */
        //更新节点的状态为 0,如果更新失败,只有一种可能就是节点被 CANCELLED 了
        if (!compareAndSetWaitStatus(node, Node.CONDITION, 0))
            return false;

        /*
         * Splice onto queue and try to set waitStatus of predecessor to
         * indicate that thread is (probably) waiting. If cancelled or
         * attempt to set waitStatus fails, wake up to resync (in which
         * case the waitStatus can be transiently and harmlessly wrong).
         */
        //调用 enq,把当前节点添加到AQS 队列。并且返回返回按当前节点的上一个节点,也就是原tail 节点
        Node p = enq(node);
        int ws = p.waitStatus;
        // 如果上一个节点的状态被取消了, 或者尝试设置上一个节点的状态为 SIGNAL 失败了
        // (SIGNAL表示: 他的 next节点需要停止阻塞),
        if (ws > 0 || !compareAndSetWaitStatus(p, ws, Node.SIGNAL))
            // 唤醒节点上的线程.
            LockSupport.unpark(node.thread);
        //如果 node 的 prev 节点已经是signal 状态,那么被阻塞的 ThreadA 的唤醒工作由 AQS 队列来完成
        return true;
    }

3.2.3 图解分析

执行完 doSignal 以后,会把 condition 队列中的节点转移到 aqs 队列上,逻辑结构图如下


逻辑结构图

这个时候会判断 ThreadA 的 prev 节点也就是 head 节点的 waitStatus,如果大于 0 或者设置 SIGNAL 失败,表示节点被设置成了 CANCELLED 状态。这个时候会唤醒ThreadA 这个线程。否则就基于 AQS 队列的机制来唤醒,也就是等到 ThreadB 释放锁之后来唤醒 Thread。

3.3 被阻塞的线程唤醒后的逻辑

前面在分析 await 方法时,线程会被阻塞。而通过 signal被唤醒之后又继续回到上次执行的逻辑中标注为红色部分的代码
checkInterruptWhileWaiting 这个方法是干嘛呢?其实从名字就可以看出来,就是 ThreadA 在 condition 队列被阻塞的过程中,有没有被其他线程触发过中断请求。

3.3.1 checkInterruptWhileWaiting

如果当前线程被中断,则调用transferAfterCancelledWait 方法判断后续的处理应该是抛出 InterruptedException 还是重新中断。
如果第一次 CAS 失败了,则不能判断当前线程是先进行了中断还是先进行了 signal 方法的调用,可能是先执行了 signal 然后中断,也可能是先执行了中断,后执行了 signal,当然,这两个操作肯定是发生在 CAS 之前。这时需要做的就是等待当前线程的 node被添加到 AQS 队列后,也就是 enq 方法返回后,返回false 告诉 checkInterruptWhileWaiting 方法返回REINTERRUPT(1),后续进行重新中断。
简单来说,该方法的返回值代表当前线程是否在 park 的时候被中断唤醒,如果为 true 表示中断在 signal 调用之前,signal 还未执行,那么这个时候会根据 await 的语义,在 await 时遇到中断需要抛出interruptedException,返回 true 就是告诉checkInterruptWhileWaiting 返回 THROW_IE(-1)。如果返回 false,否则表示 signal 已经执行过了,只需要重新响应中断即可。

       private int checkInterruptWhileWaiting(Node node) {
            return Thread.interrupted() ?
                (transferAfterCancelledWait(node) ? THROW_IE : REINTERRUPT) :
                0;
        }
    final boolean transferAfterCancelledWait(Node node) {
        // 使用 cas 修改节点状态,如果还能修改成功,说明线程被中断时,signal 还没有被调用。
        // 线程被唤醒,并不一定是在 java 层面执行了locksupport.unpark,
        // 也可能是调用了线程的 interrupt()方法,这个方法会更新一个中断标识,并且会唤醒处于阻塞状态下的线程
        if (compareAndSetWaitStatus(node, Node.CONDITION, 0)) {
            // //如果 cas 成功,则把node 添加到 AQS 队列
            enq(node);
            return true;
        }
        /*
         * If we lost out to a signal(), then we can't proceed
         * until it finishes its enq().  Cancelling during an
         * incomplete transfer is both rare and transient, so just
         * spin.
         */
        // 如果 cas 失败,则判断当前 node 是否已经在 AQS 队列上,如果不在,则让给其他线程执行
        // 当 node 被触发了 signal 方法时,node 就会被加到 aqs 队列上
        // 循环检测 node 是否已经成功添加到 AQS 队列中。如果没有,则通过 yield,
        while (!isOnSyncQueue(node))
            Thread.yield();
        return false;
    }

3.3.2 acquireQueued

当前被唤醒的节点ThreadA 去抢占同步锁,并且要恢复到原本的重入次数状态,调用完这个方法之后,AQS 队列的状态如下:将 head 节点的 waitStatus 设置为-1,Signal 状态。


image.png

3.3.3 reportInterruptAfterWait

根据 checkInterruptWhileWaiting 方法返回的中断标识来进行中断上报。如果是 THROW_IE,则抛出中断异常如果是 REINTERRUPT,则重新响应中断

        private void reportInterruptAfterWait(int interruptMode)
            throws InterruptedException {
            if (interruptMode == THROW_IE)
                throw new InterruptedException();
            else if (interruptMode == REINTERRUPT)
                selfInterrupt();
        }

4 Condition总结

await 和 signal 的总结
线程 awaitThread 先通过 lock.lock()方法获取锁成功后调用了 condition.await 方法进入等待队列,而另一个线程 signalThread 通过 lock.lock()方法获取锁成功后调用了 condition.signal 或者 signalAll 方法,使得线程awaitThread 能够有机会移入到同步队列中,当其他线程释放 lock 后使得线程 awaitThread 能够有机会获取lock,从而使得线程 awaitThread 能够从 await 方法中退出执行后续操作。如果 awaitThread 获取 lock 失败会直接进入到同步队列。

整体的结构图

阻塞:await()方法中,在线程释放锁资源之后,如果节点不在 AQS 等待队列,则阻塞当前线程,如果在等待队列,则自旋等待尝试获取锁
释放:signal()后,节点会从 condition 队列移动到 AQS等待队列,则进入正常锁的获取流程

你可能感兴趣的:(Java并发编程之Condition)