目录
一、悲观锁 VS 乐观锁
二、自旋锁 VS 适应性自旋锁
2.1、自旋锁
2.2、自适应锁
三、无锁 VS 偏向锁 VS 轻量级锁 VS 重量级锁
3.1、无锁
3.2、偏向锁
3.3、轻量级锁
3.4、重量级锁
四、公平锁 VS 非公平锁
4.1、公平锁
4.2 非公平锁
五、可重入锁 VS 非重入锁
六、独享锁 VS 共享锁
面试的时候,一般大型互联网或者数据公司都对并发很重视,但是为了保证线程安全,就需要锁来控制同一时刻一个线程访问资源。锁的知识也就是面试必问的知识了。这一章可能比较长,因为咱们着重介绍下各种锁。其实吧Synchronized和Volatile称作锁也没关系因为很多面试官都把他们也当成锁去提问。我们说的锁现在就只在jdk1.8的基础上面来说了。
从代码层级来说。锁总体可以分为2类:
1、Synchronized JVM内部实现(cpp)通过操作系统指令实现,属于内核态。
2、Lock 在JUC包下面,基于jdk实现的,有源码可以阅读。没有内核态。
总体说性能差不多,没有好坏之分。
这2类在工作中如何选取呢?
个人见解:
1、Synchronized 简单,方便,加个关键字就行了
2、Lock 需要手动释放锁,有一部分高级功能。
也就是说:Synchronized的功能,Lock都有,
Lock的功能,Synchronized有一部分没有。
但是一般人工作中Synchronized全能满足,当Synchronized满足不了的时候再使用Lock。比如使用公平锁,sync就不行了。
在网上浏览的时候发现了一张脑图,虽然感觉总结的不是很到位,但是整体把各种锁都涵盖了。我们这节可以按照这幅图来展开。
乐观锁和悲观锁是一种广义上的概念。对线程不同角度的描述,数据库也有这2个概念。
悲观锁认为在自己使用数据的时候一定会有别的线程来修改数据。因此在获取数据的时候会先加锁,确保数据不会被别的线程修改。Java中,synchronized关键字和Lock的实现类都是悲观锁。
乐观锁正好相反认为在自己使用数据的时候不会有别的线程来修改数据。所以不会添加锁。只是在更新数据的时候去判断之前有没有别的线程更新了这个数据。如果这个数据没有被更新,当前线程将自己修改的数据成功写入。如果数据已经被其他线程更新,则根据不同的实现方式执行不同的操作(例如报错或者自动重试)。乐观锁在Java中是通过使用无锁编程来实现,最常采用的是CAS算法,Java原子类中的递增操作就通过CAS自旋实现的。
使用方式:
---------------------- 悲观锁 -------------------
//synchronized
public synchronized void methed(){
xxxxxxxxxx
}
//ReentrantLock,需要保证多个线程用一个lock不要new 多个lock;
private ReentrantLock lock = new ReentrantLock();
public void lockmethod(){
lock.lock();
xxxxxxx
lock.unlock();
}
-------------------- 乐观锁 ----------------------------
//保证多线程用同一个AtomicInteger
private AtomicInteger atomicInteger = new AtomicInteger();
atomicInteger.incrementAndGet();
阻塞或唤醒一个Java线程需要操作系统切换CPU状态来完成,这种状态转换需要耗费处理器时间。如果同步代码块中的内容过于简单,状态转换消耗的时间有可能比用户代码执行的时间还要长。
在许多场景中,同步资源的锁定时间很短,为了这一小段时间去切换线程,线程挂起和恢复现场的花费可能会让系统得不偿失。如果物理机器有多个处理器,能够让两个或以上的线程同时并行执行,我们就可以让后面那个请求锁的线程不放弃CPU的执行时间,看看持有锁的线程是否很快就会释放锁。
而为了让当前线程“稍等一下”,我们需让当前线程进行自旋,比如执行几个空循环,如果在自旋完成后前面锁定同步资源的线程已经释放了锁,那么当前线程就可以不必阻塞而是直接获取同步资源,从而避免切换线程的开销。这就是自旋锁。
自旋锁本身是有缺点的,它不能代替阻塞。自旋等待虽然避免了线程切换的开销,但它要占用处理器时间。如果锁被占用的时间很短,自旋等待的效果就会非常好。反之,如果锁被占用的时间很长,那么自旋的线程只会白浪费处理器资源。所以,自旋等待的时间必须要有一定的限度,如果自旋超过了限定次数(默认是10次,可以使用-XX:PreBlockSpin来更改)没有成功获得锁,就应当挂起线程。
自旋锁的实现原理同样也是CAS,AtomicInteger中调用unsafe进行自增操作的源码中的do-while循环就是一个自旋操作,如果修改数值失败则通过循环来执行自旋,直至修改成功。
JDK 6中变为默认开启自旋锁,并且引入了自适应的自旋锁(适应性自旋锁)。
自适应意味着自旋的时间(次数)不再固定,而是由前一次在同一个锁上的自旋时间及锁的拥有者的状态来决定。如果在同一个锁对象上,自旋等待刚刚成功获得过锁,并且持有锁的线程正在运行中,那么虚拟机就会认为这次自旋也是很有可能再次成功,进而它将允许自旋等待持续相对更长的时间。如果对于某个锁,自旋很少成功获得过,那在以后尝试获取这个锁时将可能省略掉自旋过程,直接阻塞线程,避免浪费处理器资源。
自适应锁用到的很少,大家了解这个东西就行了。不用深究。
在synchronized 一节中介绍过这四种锁状态。这四种锁是指锁的状态,专门针对synchronized的。
无锁就是不对资源进行锁定。所有的线程都能访问并修改同一个资源,但同时只有一个线程能修改成功。同一时刻大家应该理解的就是同时修改那一瞬间,当然多线程操作 会被修改好多次。
无锁的特点就是修改操作在循环内进行,线程会不断的尝试修改共享资源。如果没有冲突就修改成功并退出,否则就会继续循环尝试。如果有多个线程修改同一个值,必定会有一个线程能修改成功,而其他修改失败的线程会不断重试直到修改成功。上面我们介绍的CAS原理及应用即是无锁的实现。无锁无法全面代替有锁,但无锁在某些场合下的性能是非常高的。
偏向锁顾名思义就是偏向于第一次获取它的线程。所以会能够被一个线程不断占有。大多数情况下,锁总是由同一个线程多次获得,不存在竞争,所以叫偏向。其目标就是在只有一个线程执行同步代码块时能够提高性能。
当一个线程访问同步代码块并获取锁时,会在Mark Word里存储锁偏向的线程ID。在线程进入和退出同步块时不再通过CAS操作来加锁和解锁,而是检测Mark Word里是否存储着指向当前线程的偏向锁。引入偏向锁是为了在无多线程竞争的情况下尽量减少不必要的轻量级锁执行,因为轻量级锁的获取及释放依赖多次CAS原子指令,而偏向锁只需要在置换ThreadID的时候依赖一次CAS原子指令即可。
在运行过程中,当其他的线程抢占锁的时候,持有偏向锁的线程会被挂起,JVM会消除它身上的偏向锁,将锁升级到轻量级锁。可以使用CAS算法去升级偏向锁,偏向锁与无锁状态的执行时间很接近,所以竞争不激烈的情况可以使用偏向锁。
线程有交替使用,互斥性不是很强的时候可以去使用它,CAS检测失败就将锁标记00。
当锁是偏向锁的时候,被另外的线程所访问,偏向锁就会升级为轻量级锁,其他线程会通过自旋的形式尝试获取锁,不会阻塞,从而提高性能。
Markword 存储对象的hashCode或锁信息(这里把Synchronized那一节的知识挪过来下)
下面简单说下如何升级成轻量级锁,不过大家不用太过度研究,了解下就行了:
在代码进入同步块的时候,如果同步对象锁状态为无锁状态(锁标志位为“01”状态,是否为偏向锁为“0” 因为偏向锁和无锁的锁标志位一样,靠是否偏向标志位区分),1)建空间。虚拟机首先将在当前线程的栈帧中建立一个名为锁记录(Lock Record)的空间,用于存储锁对象目前的Mark Word的拷贝,2)拷贝。然后拷贝对象头中的Mark Word复制到锁记录中。
拷贝成功后,3)更改指向。虚拟机将使用CAS操作尝试将对象的Mark Word更新为指向Lock Record的指针,并将Lock Record里的owner指针指向对象的Mark Word。
如果这个更新动作成功了,那么这个线程就拥有了该对象的锁,并且对象Mark Word的锁标志位设置为“00”,表示此对象处于轻量级锁定状态。
如果轻量级锁的更新操作失败了,虚拟机首先会检查对象的Mark Word是否指向当前线程的栈帧,如果是就说明当前线程已经拥有了这个对象的锁,那就可以直接进入同步块继续执行,否则说明多个线程竞争锁。
若当前只有一个等待线程,则该线程通过自旋进行等待。但是当自旋超过一定的次数,或者一个线程在持有锁,一个在自旋,又有第三个来访时,轻量级锁升级为重量级锁。
升级为重量级锁时,锁标志的状态值变为“10”,此时Mark Word中存储的是指向重量级锁的指针,此时等待锁的线程都会进入阻塞状态。
整体的锁状态升级流程如下:
综上
偏向锁通过对比Mark Word解决加锁(会记录线程id)问题,避免执行CAS操作。
轻量级锁是通过用CAS操作和自旋来解决加锁问题,避免线程阻塞和唤醒而影响性能。
重量级锁是将除了拥有锁的线程以外的线程都阻塞。
因为重量级锁调用了操作系统的函数,而偏量锁没有。
公平锁是指多个线程按照申请锁的顺序来获取锁,线程直接进入队列中排队,队列中的第一个线程才能获得锁。类似FIFO。公平锁的优点是等待锁的线程不会饿死。缺点是整体吞吐效率相对非公平锁要低,等待队列中除第一个线程以外的所有线程都会阻塞,CPU唤醒阻塞线程的开销比非公平锁大。为什么呢?
公平锁lock源码:
// 公平锁FairSync
final void lock() {
acquire(1);
}
非公平锁: 比公平锁多了一个CAS获取锁的步骤。如果失败在acquire
// 非公平锁NonfairSync
final void lock() {
// 在调用acquire()方法获取锁之前,先CAS抢锁
if (compareAndSetState(0, 1)) // state=0时,CAS设置state=1
setExclusiveOwnerThread(Thread.currentThread());
else
acquire(1);
}
释放公平锁的过程大体描述如下:
1)AQS.release()方法:state 改为 0,exclusiveOwnerThread 设置为 null
2)唤醒 AQS 队列中 head 的后继结点线程去获取锁
如果在线程 2 在线程 1 释放锁的过程中调用 lock()方法获取锁,
对于公平锁:线程 2 只能先加入同步队列的队尾,等队列中在它之前的线程获取、释放锁之后才有机会去抢锁。这也就保证了公平,先到先得。这样自己必须先要挂起,等到自己的时候才被唤醒。
对于非公平锁:线程 1 释放锁过程执行到一半,“state 改为 0,exclusiveOwnerThread 设置为 null”已经完成,此时线程 2 调用 lock(),那么 CAS 就抢锁成功。这种情况下线程 2 是可以先获取非公平锁而不需要进入队列中排队的,也就不用被挂起和等待唤醒了。对前面的线程不公平。
从代码角度看公平锁和非公平锁区别大体有2处:
非公平锁和公平锁只有两处不同:
1)lock()方法: 公平锁直接调用 acquire(),当前线程到同步队列中排队等锁。 非公平锁会先利用 CAS 抢锁,抢不到锁才会调用 acquire()。
2) tryAcquire()方法: 公平锁在同步队列还有线程等锁时,即使锁没有被占用,也不能获取锁。非公平锁不管同步队列中是什么情况,直接去抢锁。
非公平锁是多个线程加锁时直接尝试获取锁,获取不到才会到等待队列的队尾等待。但如果此时锁刚好可用,那么这个线程可以无需阻塞直接获取到锁,所以非公平锁有可能出现后申请锁的线程先获取锁的场景。非公平锁的优点是可以减少唤起线程的开销,整体的吞吐效率高,因为线程有几率不阻塞直接获得锁,CPU不必唤醒所有线程。缺点是处于等待队列中的线程可能会饿死,或者等很久才会获得锁。
ReentrantLock默认状态下是非公平锁(1.8jdk)。但是可以设置变成为公平锁。所以ReentrantLock很具有研究性。我们从源码角度来分析下。
public ReentrantLock() {
sync = new NonfairSync();
}
根据代码可知,ReentrantLock里面有一个内部类Sync,Sync继承AQS(AbstractQueuedSynchronizer),添加锁和释放锁的大部分操作实际上都是在Sync中实现的。它有公平锁FairSync和非公平锁NonfairSync两个子类。ReentrantLock默认使用非公平锁,也可以通过构造器来显示的指定使用公平锁。
通过上图中的源代码对比,我们可以明显的看出公平锁与非公平锁的lock()方法唯一的区别就在于公平锁在获取同步状态时多了一个限制条件:hasQueuedPredecessors()。
再进入hasQueuedPredecessors(),可以看到该方法主要做一件事情:hasQueuedPredecessors()方法是判断 AQS 队列中是否还有结点,如果队列中没有结点返回 false。
综上,公平锁就是通过同步队列来实现多个线程按照申请锁的顺序来获取锁,从而实现公平的特性。非公平锁加锁时不考虑排队等待问题,直接尝试获取锁,所以存在后申请的却先获得锁的情况。
可重入锁又名递归锁,是指在同一个线程在外层方法获取锁的时候,再进入该线程的内层方法会自动获取锁(前提锁对象得是同一个对象或者class),不会因为之前已经获取过还没释放而阻塞。Java中ReentrantLock和synchronized都是可重入锁,可重入锁的一个优点是可一定程度避免死锁。下面用示例代码来进行分析:
public synchronized void method1(){
System.out.println("method1");
method2();
}
public synchronized void method2(){
System.out.println("method2");
}
在上面的代码中,类中的两个方法都是被内置锁synchronized修饰的,method1()方法中调用method2()方法。因为内置锁是可重入的,所以同一个线程在调用method2()时可以直接获得当前对象的锁,进入method2()进行操作。
如果是一个不可重入锁,那么当前线程在调用method2()之前需要将执行method1()时获取当前对象的锁释放掉,实际上该对象锁已被当前线程所持有,且无法释放。所以此时会出现死锁。
什么可重入锁就可以在嵌套调用时可以自动获得锁呢?我们通过源码来分别解析一下。
说道重入有想到了ReentrantLock。
ReentrantLock和synchronized都是重入锁,那么我们通过重入锁ReentrantLock以及非可重入锁NonReentrantLock的源码来对比分析一下为什么非可重入锁在重复调用同步资源时会出现死锁。
首先ReentrantLock和NonReentrantLock都继承父类AQS,其父类AQS中维护了一个同步状态status来计数重入次数,status初始值为0。
当线程尝试获取锁时,可重入锁先尝试获取并更新status值,如果status == 0表示没有其他线程在执行同步代码,则把status置为1,当前线程开始执行。如果status != 0,则判断当前线程是否是获取到这个锁的线程,如果是的话执行status+1,且当前线程可以再次获取锁。而非可重入锁是直接去获取并尝试更新当前status的值,如果status != 0的话会导致其获取锁失败,当前线程阻塞。
释放锁时,可重入锁同样先获取当前status的值,在当前线程是持有锁的线程的前提下。如果status-1 == 0,则表示当前线程所有重复获取锁的操作都已经执行完毕,然后该线程才会真正释放锁。而非可重入锁则是在确定当前线程是持有锁的线程之后,直接将status置为0,将锁释放。
独享锁和共享锁同样是一种概念。我们先介绍一下具体的概念,然后通过ReentrantLock和ReentrantReadWriteLock(读写锁)的源码来介绍独享锁和共享锁。
独享锁也叫排他锁,是指该锁一次只能被一个线程所持有。如果线程T对数据A加上排它锁后,则其他线程不能再对A加任何类型的锁。获得排它锁的线程即能读数据又能修改数据。JDK中的synchronized和JUC中Lock的实现类就是互斥锁。
共享锁是指该锁可被多个线程所持有。如果线程T对数据A加上共享锁后,则其他线程只能对A再加共享锁,不能加排它锁。获得共享锁的线程只能读数据,不能修改数据。
独享锁与共享锁也是通过AQS来实现的,通过实现不同的方法,来实现独享或者共享。
简单看下ReentrantReadWriteLock 源码
我们看到ReentrantReadWriteLock有两把锁:ReadLock和WriteLock,由词知意,一个读锁一个写锁,合称“读写锁”。再进一步观察可以发现ReadLock和WriteLock是靠内部类Sync实现的锁。Sync是AQS的一个子类,这种结构在CountDownLatch、ReentrantLock、Semaphore里面也都存在。
在ReentrantReadWriteLock里面,读锁和写锁的锁主体都是Sync,但读锁和写锁的加锁方式不一样。读锁是共享锁,写锁是独享锁。读锁的共享锁可保证并发读非常高效,而读写、写读、写写的过程互斥,因为读锁和写锁是分离的。所以ReentrantReadWriteLock的并发性相比一般的互斥锁有了很大提升。
获取读锁,但是不能获取写锁; 如果获取了写锁就可以继续获取写锁或者读锁。锁是可以降级的,不能升级。
所谓降级就是:加了写锁再加读锁;升级:加了读锁再加写锁
为什么不能升级呢?会造成死循环。
看如下伪代码:
ReadWriteLock lock = new ReentrantReadWriteLock();
lock.readLock().lock();
xxxx;
lock.writeLock().lock();
xxxxx
如果多个线程都是这样写的代码,thread1,thread2都能够获取读锁,但是写锁是排他的,所以当执行到 lock.writeLock().lock();的时候就会等待所有线程都释放了读锁,所以thread1等待thread2,thread2等待thread1.从而造成死锁。
可以降级
ReadWriteLock lock = new ReentrantReadWriteLock();
lock.writeLock().lock();
xxxx;
lock.readLock().lock();
xxxxx
因为写锁是排他的,此时只有一个线程获取,当在加读锁的时候,是可以的,因为读锁是共享的。
那读锁和写锁的具体加锁方式有什么区别呢?在了解源码之前我们需要回顾一下其他知识。
在最开始提及AQS的时候我们也提到了state字段(int类型,32位),该字段用来描述有多少线程获持有锁。
在独享锁中这个值通常是0或者1(如果是重入锁的话state值就是重入的次数),在共享锁中state就是持有锁的线程的数量。但是在ReentrantReadWriteLock中有读、写两把锁,所以需要在一个整型变量state上分别描述读锁和写锁的数量(或者也可以叫状态)。于是将state变量“按位切割”切分成了两个部分,高16位表示读锁状态(读锁个数),低16位表示写锁状态(写锁个数)。如下图所示:
了解了概念之后我们再来看代码,先看写锁的加锁源码:
tryAcquire()除了重入条件(当前线程为获取了写锁的线程)之外,增加了一个读锁是否存在的判断。如果存在读锁,则写锁不能被获取,原因在于:必须确保写锁的操作对读锁可见,如果允许读锁在已被获取的情况下对写锁的获取,那么正在运行的其他读线程就无法感知到当前写线程的操作。
因此,只有等待其他读线程都释放了读锁,写锁才能被当前线程获取,而写锁一旦被获取,则其他读写线程的后续访问均被阻塞。写锁的释放与ReentrantLock的释放过程基本类似,每次释放均减少写状态,当写状态为0时表示写锁已被释放,然后等待的读写线程才能够继续访问读写锁,同时前次写线程的修改对后续的读写线程可见。
接着是读锁的代码:
可以看到在tryAcquireShared(int unused)方法中,如果其他线程已经获取了写锁,则当前线程获取读锁失败,进入等待状态。如果当前线程获取了写锁或者写锁未被获取,则当前线程(线程安全,依靠CAS保证)增加读状态,成功获取读锁。读锁的每次释放(线程安全的,可能有多个读线程同时释放读锁)均减少读状态,减少的值是“1<<16”。所以读写锁才能实现读读的过程共享,而读写、写读、写写的过程互斥。
是否共享在源码级别体现主要是是否是当前线程占用。
此时,我们再回头看一下互斥锁ReentrantLock中公平锁和非公平锁的加锁源码:
我们发现在ReentrantLock虽然有公平锁和非公平锁两种,但是它们添加的都是独享锁。根据源码所示,当某一个线程调用lock方法获取锁时,如果同步资源没有被其他线程锁住,那么当前线程在使用CAS更新state成功后就会成功抢占该资源。而如果公共资源被占用且不是被当前线程占用,那么就会加锁失败。所以可以确定ReentrantLock无论读操作还是写操作,添加的锁都是都是独享锁。
源码这里看不懂没啥事,下一章我着重讲AQS的源码,到时候会着重讲解的。