前言
JDK1.5 之后发布了JUC(java.util.concurrent),用于解决多线程并发问题。AQS 是一个特别重要的同步框架,很多同步类都借助于 AQS 实现了对线程同步状态的管理。
AQS 中最主要的就是独占锁和共享锁的获取和释放,以及提供了一些可中断的获取锁,超时等待锁等方法。
ReentranLock 是基于 AQS 独占锁的一个实现。ReentrantReadWriteLock 是基于 AQS 共享锁的一个读写锁实现。本来打算一篇文章里面写完独占锁和共享锁,但是发现篇幅太长了,也不易于消化。
因此,本篇就先结合 ReentrantLock 源码,分析 AQS 的独占锁获取和释放。以及 ReentrantLock 的公平锁和非公平锁实现。
下一篇再写 ReentrantReadWriteLock 读写锁源码,以及 AQS 共享锁的获取和释放。
在正式讲解源码之前,墙裂建议读者做一些准备工作,最好对以下知识有一定的了解,这样阅读起来源码会比较轻松(因为,我当初刚开始接触多线程时,直接看 AQS 简直是一脸懵逼,就像读天书一样。。)。
- 了解双向链表的数据结构,以及队列的入队出队等操作。
- LockSupport 的 park,unpark 方法,以及对线程的 interrupt 几个方法了解(可参考:LockSupport的 park 方法是怎么响应中断的?)。
- 对 CAS 和自旋机制有一定的了解。
AQS 同步队列
AQS 内部维护了一个 FIFO(先进先出)的双向队列。它的内部是用双向链表来实现的,每个数据节点(Node)中都包含了当前节点的线程信息,还有它的前后两个指针,分别指向前驱节点和后继节点。下边看一下 Node 的属性和方法:
static final class Node {
//可以认为是一种标记,表明了这个 node 是以共享模式在同步队列中等待
static final Node SHARED = new Node();
//也是一种标记,表明这个 node 是以独占模式在同步队列中等待
static final Node EXCLUSIVE = null;
/** waitStatus 常量值 */
//说明当前节点被取消,原因有可能是超时,或者被中断。
//节点被取消的状态是不可逆的,也就是说此节点会一直停留在取消状态,不会转变。
static final int CANCELLED = 1;
//说明后继节点的线程被 park 阻塞,因此当前线程需要在释放锁或者被取消时,唤醒后继节点
static final int SIGNAL = -1;
//说明线程在 condition 条件队列等待
static final int CONDITION = -2;
//在共享模式中用,表明下一个共享线程应该无条件传播
static final int PROPAGATE = -3;
//当前线程的等待状态,除了以上四种值,还有一个值 0 为初始化状态(条件队列的节点除外)。
//注意这个值修改时是通过 CAS ,以保证线程安全。
volatile int waitStatus;
//前驱节点
volatile Node prev;
//后继节点
volatile Node next;
//当前节点中的线程,通过构造函数初始化,出队时会置空(这个后续说,重点强调)
volatile Thread thread;
//有两种情况。1.在 condition 条件队列中的后一个节点
//2. 一个特殊值 SHARED 用于表明当前是共享模式(因为条件队列只存在于独占模式)
Node nextWaiter;
//是否是共享模式,理由同上
final boolean isShared() {
return nextWaiter == SHARED;
}
//返回前驱节点,如果为空抛出空指针
final Node predecessor() throws NullPointerException {
Node p = prev;
if (p == null)
throw new NullPointerException();
else
return p;
}
Node() { // Used to establish initial head or SHARED marker
}
Node(Thread thread, Node mode) { // Used by addWaiter
this.nextWaiter = mode;
this.thread = thread;
}
Node(Thread thread, int waitStatus) { // Used by Condition
this.waitStatus = waitStatus;
this.thread = thread;
}
}
另外,在 AQS 类中,还会记录同步队列的头结点和尾结点:
//同步队列的头结点,是懒加载的,即不会立即创建一个同步队列,
//只有当某个线程获取不到锁,需要排队的时候,才会初始化头结点
private transient volatile Node head;
//同步队列的尾结点,同样是懒加载。
private transient volatile Node tail;
独占锁
这部分就结合 ReentrantLock 源码分析 AQS 的独占锁是怎样获得和释放锁的。
非公平锁
首先,我们从 ReentrantLock 开始分析,它有两个构造方法,一个构造,可以传入一个 boolean 类型的参数,表明是用公平锁还是非公平锁模式。另一个构造方法,不传入任何参数,则默认用非公平锁。
public ReentrantLock() {
sync = new NonfairSync();
}
public ReentrantLock(boolean fair) {
sync = fair ? new FairSync() : new NonfairSync();
}
NonfairSync 和 FairSync 都继承自 Sync ,它们都是 ReentranLock 的内部类。而Sync 类又继承自 AQS (AbstractQueuedSynchronizer)。
static final class NonfairSync extends Sync {
}
static final class FairSync extends Sync {
}
abstract static class Sync extends AbstractQueuedSynchronizer {
}
知道了它们之间的继承关系,我们就从非公平锁的加锁方法作为入口,跟踪源码。因为非公平锁的流程讲明白之后,公平锁大致流程都一样,只是多了一个条件判断(这个,一会儿后边细讲,会做对比)。
NonfairSync.lock
我们看下公平锁的获取锁的方法:
final void lock() {
//通过 CAS 操作把 state 设置为 1
if (compareAndSetState(0, 1))
//如果设值成功,说明加锁成功,保存当前获得锁的线程
setExclusiveOwnerThread(Thread.currentThread());
else
//如果加锁失败,则执行 AQS 的acquire 方法
acquire(1);
}
public final void acquire(int arg) {
if (!tryAcquire(arg) &&
acquireQueued(addWaiter(Node.EXCLUSIVE), arg))
selfInterrupt();
}
acquire
这个方法的逻辑是:
- 通过 tryAcquire 方法,尝试获取锁,如果成功,则返回 true,失败返回 false 。
- tryAcquire 失败之后,会先调用 addWaiter 方法,把当前线程封装成 node 节点,加入同步队列(独占模式)。
- acquireQueued 方法会把刚加入队列的 node 作为参数,通过自旋去获得锁。
tryAcquire
这是一个模板方法,具体的实现需要看它的子类,这里对应的就是 ReentrantLock.NonfairSync.tryAcquire 方法。我们看一下:
protected final boolean tryAcquire(int acquires) {
return nonfairTryAcquire(acquires);
}
final boolean nonfairTryAcquire(int acquires) {
//当前线程
final Thread current = Thread.currentThread();
//获取当前的同步状态,若为 0 ,表示无锁状态。若大于 0,表示已经有线程抢到了锁。
int c = getState();
if (c == 0) {
//然后通过 CAS 操作把 state 的值改为 1。
if (compareAndSetState(0, acquires)) {
// CAS 成功之后,保存当前获得锁的线程
setExclusiveOwnerThread(current);
return true;
}
}
// 如果 state 大于0,则判断当前线程是否是获得锁的线程,是的话,可重入。
else if (current == getExclusiveOwnerThread()) {
//由于 ReentrantLock 是可重入的,所以每重入一次 state 就加 1 。
int nextc = c + acquires;
if (nextc < 0)
throw new Error("Maximum lock count exceeded");
setState(nextc);
return true;
}
return false;
}
addWaiter
如果获取锁失败之后,就会调用 addWaiter 方法,把当前线程加入同步队列。
private Node addWaiter(Node mode) {
//把当前线程封装成 Node ,并且是独占模式
Node node = new Node(Thread.currentThread(), mode);
//尝试快速入队,如果失败,则会调用 enq 入队方法。enq 会初始化队列。
Node pred = tail;
//如果 tail 不为空,说明当前队列中已经有节点
if (pred != null) {
//把当前 node 的 prev 指针指向 tail
node.prev = pred;
//通过 CAS 把 node 设置为 tail,即添加到队尾
if (compareAndSetTail(pred, node)) {
//把旧的 tail 节点的 next 指针指向当前 node
pred.next = node;
return node;
}
}
//当 tail 为空时,把 node 添加到队列,如果需要的话,先进行队列初始化
enq(node);
//入队成功之后,返回当前 node
return node;
}
enq
通过自旋,把当前节点加入到队列中
private Node enq(final Node node) {
for (;;) {
Node t = tail;
//如果 tail为空,说明队列未初始化
if (t == null) {
//创建一个空节点,通过 CAS把它设置为头结点
if (compareAndSetHead(new Node()))
//此时只有一个 head头节点,因此把 tail也指向它
tail = head;
} else {
//第二次自旋时,tail不为空,于是把当前节点的 prev指向 tail节点
node.prev = t;
//通过 CAS把 tail节点设置为当前 node节点
if (compareAndSetTail(t, node)) {
//把旧的 tail节点的 next指向当前 node
t.next = node;
return t;
}
}
}
}
acquireQueued
入队成功之后,就会调用 acquireQueued 方法自旋抢锁。
final boolean acquireQueued(final Node node, int arg) {
boolean failed = true;
try {
boolean interrupted = false;
for (;;) {
//获取当前节点的前驱节点
final Node p = node.predecessor();
//如果前驱节点就是 head 节点,就调用 tryAcquire 方法抢锁
if (p == head && tryAcquire(arg)) {
//如果抢锁成功,就把当前 node 设置为头结点
setHead(node);
p.next = null; // help GC
failed = false;
//抢锁成功后,会把线程中断标志返回出去,终止for循环
return interrupted;
}
//如果抢锁失败,就根据前驱节点的 waitStatus 状态判断是否需要把当前线程挂起
if (shouldParkAfterFailedAcquire(p, node) &&
//线程被挂起时,判断是否被中断过
parkAndCheckInterrupt())
//注意此处,如果被线程被中断过,需要把中断标志重新设置一下
interrupted = true;
}
} finally {
if (failed)
//如果抛出异常,则取消锁的获取,进行出队操作
cancelAcquire(node);
}
}
setHead
通过代码,我们可以看到,当前的同步队列中,只有第二个节点才有资格抢锁。如果抢锁成功,则会把它设置为头结点。
private void setHead(Node node) {
head = node;
node.thread = null;
node.prev = null;
}
需要注意的是,这个方法,会把头结点的线程设置为 null 。想一下,为什么?
因为,此时头结点的线程已经抢锁成功,需要出队了。自然的,队列中也就不应该存在这个线程了。
PS:由 enq 方法,还有 setHead 方法,我们可以发现,头结点的线程总是为 null。这是因为,头结点要么是刚初始化的空节点,要么是抢到锁的线程出队了。因此,我们也常常把头结点叫做虚拟节点(不存储任何线程)。
shouldParkAfterFailedAcquire
以上是抢锁成功的情况,那么抢锁失败了呢?这时,我们需要判断是否应该把当前线程挂起。
private static boolean shouldParkAfterFailedAcquire(Node pred, Node node) {
//获取当前节点的前驱节点的 waitStatus
int ws = pred.waitStatus;
if (ws == Node.SIGNAL)
//如果 ws = -1 ,说明当前线程可以被前驱节点正常唤醒,于是就可以安全的 park了
return true;
if (ws > 0) {
//如果 ws > 0,说明前驱节点被取消,则会从当前节点依次向前查找,
//直到找到第一个没有被取消的节点,把那个节点的 next 指向当前 node
//这一步,是为了找到一个可以把当前线程唤起的前驱节点
do {
node.prev = pred = pred.prev;
} while (pred.waitStatus > 0);
pred.next = node;
} else {
//如果 ws 为 0,或者 -3(共享锁状态),则把它设置为 -1
//返回 false,下次自旋时,就会判断等于 -1,返回 true了
compareAndSetWaitStatus(pred, ws, Node.SIGNAL);
}
return false;
}
parkAndCheckInterrupt
如果 shouldParkAfterFailedAcquire 返回 true,说明当前线程需要被挂起。因此,就执行此方法,同时检查线程是否被中断。
private final boolean parkAndCheckInterrupt() {
//把当前线程挂起,则 acquireQueued 方法的自旋就会暂停,等待前驱节点 unpark
LockSupport.park(this);
//返回当前节点是否被中断的标志,注意此方法会把线程的中断标志清除。
//因此,返回上一层方法时,需要设置 interrupted = true 把中断标志重新设置,以便上层代码可以处理中断
return Thread.interrupted();
}
想一下,为什么抢锁失败后,需要判断是否把线程挂起?
因为,如果抢不到锁,并且还不把线程挂起,acquireQueued 方法就会一直自旋下去,这样你的CPU能受得了吗。
cancelAcquire
当不停的自旋抢锁时,若发生了异常,就会调用此方法,取消正在尝试获取锁的线程。node 的位置分为三种情况,见下面注释,
private void cancelAcquire(Node node) {
if (node == null)
return;
// node 不再指向任何线程
node.thread = null;
Node pred = node.prev;
//从当前节点不断的向前查找,直到找到一个有效的前驱节点
while (pred.waitStatus > 0)
node.prev = pred = pred.prev;
Node predNext = pred.next;
//把 node 的 ws 设置为 -1
node.waitStatus = Node.CANCELLED;
// 1.如果 node 是 tail,则把 tail 更新为 pred,并把 pred.next 指向 null
if (node == tail && compareAndSetTail(node, pred)) {
compareAndSetNext(pred, predNext, null);
} else {
int ws;
//2.如果 node 既不是 tail,也不是 head 的后继节点,就把 node的前驱节点的 ws 设置为 -1
//最后把 node 的前驱节点的 next 指向 node 的后继节点
if (pred != head &&
((ws = pred.waitStatus) == Node.SIGNAL ||
(ws <= 0 && compareAndSetWaitStatus(pred, ws, Node.SIGNAL))) &&
pred.thread != null) {
Node next = node.next;
if (next != null && next.waitStatus <= 0)
compareAndSetNext(pred, predNext, next);
} else {
//3.如果 node是 head 的后继节点,则直接唤醒 node 的后继节点。
//这个也很好理解,因为 node 是队列中唯一有资格尝试获取锁的节点,
//它放弃了资格,当然有义务把后继节点唤醒,以让后继节点尝试抢锁。
unparkSuccessor(node);
}
node.next = node; // help GC
}
}
unparkSuccessor
这个唤醒方法就比较简单了,
private void unparkSuccessor(Node node) {
int ws = node.waitStatus;
if (ws < 0)
compareAndSetWaitStatus(node, ws, 0);
Node s = node.next;
if (s == null || s.waitStatus > 0) {
s = null;
//从尾结点向前依次遍历,直到找到距离当前 node 最近的一个有效节点
for (Node t = tail; t != null && t != node; t = t.prev)
if (t.waitStatus <= 0)
s = t;
}
if (s != null)
//把这个有效节点的线程唤醒,
//唤醒之后,当前线程就可以继续自旋抢锁了,(回到 park 的地方)
LockSupport.unpark(s.thread);
}
下面画一个流程图更直观的查看整个获取锁的过程。
![img]()
公平锁
公平锁和非公平锁的整体流程大致相同,只是在抢锁之前先判断一下是否已经有人排在前面,如果有的话,就不执行抢锁。我们通过源码追踪到 FairSync.tryAcquire 方法。会发现,多了一个 hasQueuedPredecessors 方法。
hasQueuedPredecessors
这个方法判断逻辑稍微有点复杂,有多种情况。
public final boolean hasQueuedPredecessors() {
Node t = tail;
Node h = head;
Node s;
return h != t &&
((s = h.next) == null || s.thread != Thread.currentThread());
}
- 如果 h == t,说明 h 和 t 都为空(此时队列还未初始化)或者它们是同一个节点(说明队列已经初始化,并且只有一个节点,此时为 enq 方法第一次自旋成功后)。此时,返回false。
- 如果 h != t,则判断 head.next == null 是否成立,如果成立,则返回 true。这种情况发生在有其他线程第一次入队时。在 AQS 的 enq 入队方法,设置头结点成功之后 compareAndSetHead(new Node()) ,还未执行 tail = head 时(仔细想一想为什么?)。此时 tail = null , head = new Node(),head.next = null。
- 如果 h != t,并且 head.next != null,说明此时队列中至少已经有两个节点,则判断 head.next 是否是当前线程。如果是,返回 false(注意是 false哦,因为用了 !),否则返回 true 。
总结:以上几种情况,只有最终返回 false 时,才会继续往下执行。因为 false,说明没有线程排在当前线程前面,于是通过 CAS 尝试把 state 值设置为 1。若成功,则方法返回。若失败,同样需要去排队。
公平锁和非公平锁区别
举个例子来对比公平锁和非公平锁。比如,现在到饭点了,大家都到食堂打饭。把队列中的节点比作排队打饭的人,每个打饭窗口都有一个管理员,只有排队的人从管理员手中抢到锁,才有资格打饭。打饭的过程就是线程执行的过程。
![img]()
如果,你发现前面没有人在排队,那么就可以直接从管理员手中拿到锁,然后打饭。对于公平锁来说,如果你前面有人在打饭,那么你就要排队到他后面(图中B),等他打完之后,把锁还给管理员。那么,你就可以从管理员手中拿到锁,然后打饭了。后面的人依次排队。这就是FIFO先进先出的队列模型。
对于非公平锁来说,如果你是图中的 B,当 A 把锁还给管理员后,有可能有另外一个 D 插队过来直接把锁抢走。那么,他就可以打饭,你只能继续等待了。
所以,可以看出来。公平锁是严格按照排队的顺序来的,先来后到嘛,你来的早,就可以早点获取锁。优点是,这样不会造成某个线程等待时间过长,因为大家都是中规中矩的在排队。而缺点呢,就是会频繁的唤起线程,增加 CPU的开销。
非公平锁的优点是吞吐量大,因为有可能正好锁可用,然后线程来了,直接抢到锁了,不用排队了,这样也减少了 CPU 唤醒排队线程的开销。但是,缺点也很明显,你说我排队排了好长时间了,终于轮到我打饭了,凭什么其他人刚过来就插到我前面,比我还先打到饭,也太不公平了吧,后边一大堆排队的人更是怨声载道。这要是每个人来了都插到我前面去,我岂不是要饿死了。
独占锁的释放
我们从 ReentrantLock 的 unlock 方法看起:
public void unlock() {
//调用 AQS 的 release 方法
sync.release(1);
}
public final boolean release(int arg) {
if (tryRelease(arg)) {
Node h = head;
//如果头结点不为空,并且 ws 不为 0,则唤起后继节点
if (h != null && h.waitStatus != 0)
unparkSuccessor(h);
return true;
}
return false;
}
这段逻辑比较简单,当线程释放锁之后,就会唤醒后继节点。unparkSuccessor 已讲,不再赘述。然后看下 tryRelease 方法,公平锁和非公平锁走的是同一个方法。
protected final boolean tryRelease(int releases) {
//每释放一次锁,state 值就会减 1,因为之前可能有锁的重入
int c = getState() - releases;
//如果当前线程不是抢到锁的线程,则抛出异常
if (Thread.currentThread() != getExclusiveOwnerThread())
throw new IllegalMonitorStateException();
boolean free = false;
if (c == 0) {
//只有 state 的值减到 0 的时候,才会全部释放锁
free = true;
setExclusiveOwnerThread(null);
}
setState(c);
return free;
}
因为,ReentrantLock 支持锁的重入,所以每次重入 state 值都会加 1,相应的每次释放锁, state 的值也会减 1 。所以,这也是为什么每个 lock 方法最后都要有一个 unlock 方法释放锁,它们的个数需要保证相同。
当 state 值为 0 的时候,说明锁完全释放。其他线程才可以有机会抢到锁。
结语
以上已经讲解了独占锁主要的获取方法 acquire ,另外还有一些其他相关方法,不再赘述,因为主要逻辑都是一样的,只有部分稍有不同,只要理解了 acquire ,这些都是相通的。如 acquireInterruptibly 方法,它可以在获取锁的时候响应中断。还有超时获取锁的方法 doAcquireNanos 可以设定获取锁的超时时间,超时之后就返回失败。
下篇预告:分析 ReentrantReadWriteLock 读写锁源码,以及 AQS 共享锁的获取和释放,敬请期待 。。。