volatile和synchronized底层实现原理

相关的CPU术语

术语 英文单词 术语描述
内存屏障 memory barriers 是一组处理器指令,用于实现对内存操作的顺序限制
缓冲行 cache line 缓存中可以分配的最小存储单位。处理器填写缓存线时会加载整个缓存线,需要使用多个主内存读周期
原子操作 atomic operation 不可中断的一个或一系列操作
缓存行填充 cache line fill 当处理器识别到从内存中读取操作数时可缓存的,处理器读取真哥哥缓存行到适当的缓存(L1,L2,L3或所有)
缓存命中 cache hit 如果进行高速缓存行填充操作的内存位置仍然是下次处理器访问的地址时,处理器从缓存中读取操作数,而不是从内存读取
写命中 write hit 当处理器将操作数写回到一个内存缓存的区域时,它首先回检查这个缓存的内存地址是否在缓存行中,如果存在一个有效的缓存行,则处理器将这个操作数写回到缓存,而不是内存,这个操作称为写命中
写缺失 write miss the cache 一个有效的缓存行被写入到不存在的内存区域

volatile

volatile是轻量级的synchronized,在多处理器开发中保证了共享变量的可见性。不会引起线程上下文切换和调度。

volatile的定义与实现原理

有volatile修饰的共享变量进行写操作的时候会多出一行lock前缀的指令。
lock前缀的指令在多核处理器下会引发两件事:

  1. 将当前处理器缓存行的数据写回到系统内存。

lock 前缀的指令导致在执行指令期间,声言处理器的LOCK#信号。在多处理器环境中,LOCK#信号确保在声言该信号期间,处理器可以独占任何共享内存。但是,在最近的处理器,LOCK#信号一般不锁总线,而是锁缓存,锁总线开销大。

  1. 这个写回内存的操作回事其他CPU里缓存了该内存地址的数据无效。

处理器使用嗅探技术保证它的内部缓存、系统内存和其他处理器的缓存的数据在总线上保持一致。如果一个正在共享的状态的地址被嗅探到其他处理器打算写内存地址,那么正在嗅探的处理器将使它的缓存行无效,在下次访问相同内存地址时,强制执行缓存行填充。

为了提高处理速度,处理器不直接和内存进行通信,而是先将系统内的数据读到内部缓存(L1、L2或其他)后再进行操作,但操作完不知道何时会写到内存。

volatile使用优化

追加字节优化性能:一些处理器的缓存行是64字节款,追加字节能减少不必要参数锁的对象被加载到缓存行导致锁并发效率低。
LinkedTransferqueue,用追加到64位字节的方式来填满高速缓冲区的缓存行,避免头节点和尾戒戴呢加载到同一个缓存行,使,头围节点在修改时不会互相锁定。
但不是所有使用volatile变量时都因该追加到64字节:

  1. 缓存行非64字节宽度:一些处理器的缓存行是32个字节宽度
  2. 共享变量不会被频繁地写:因为追加字节的方式需要处理器读取更多的字节到高速缓冲区,这本身会带来一定的性能消耗,如果共享变量不会频繁写的话,锁的几率也会非常小,就没有必要通过追加字节的方式来避免相互锁定。

这种追加字节的方式在Java7下可能不生效。因为它会淘汰或重新排列无用字段。

synchronized的实现原理

重量级锁。但随着JDK版本迭代,synchronized并没有那么重了。
synchronized实现同步的形式

  1. 对于普通同步方法,锁是当前实例对象
  2. 对于静态同步方法,锁是当前的Class对象
  3. 对于同步方法块,锁是Synchronized括号里配置的对象
    synchronized是JVM层的实现,JVM基于进入和退出Monitor对象来实现方法同步和代码块同步。
    代码块同步:使用monitorenter和monitorexit指令实现
    方法同步:使用另一种方式实现(JVM规范里没讲)但是也可以使用这两个指令实现。
    monitorenter指令是在编译后插入到同步代码块开始的位置,monitorexit是插入到方法结束处的异常处
    任何一个对象都有一个monitor与之关联,当且一个monotor被持有后,它将处于锁定状态。线程只从到monitorenter指令时,将会藏式回去对象所对应的monitor的所有权,即藏式获取对象的锁。

java对象头

synchronized用的锁存在Java对象头里。如果对象时数组类型,则虚拟机用3个字宽(Word)存储对象头,如果对象时飞数组类型,则用2个字宽存储对象头。在32位虚拟机里,1字宽等于4字节,即32bit。

对象头的长度

长度 内容 说明
32/64bit Mark Word 存储对象的hashCode或锁信息等
32/64bit Class Metadata Address 存储对象类型数据的指针
32/32bit Array length 数组铲毒(如果当前对象时数组)

Java对象头里的Mark Word里默认存储对象的HashCode、分代年龄和锁标记位。
Java对象头存储结构(32位JVM)

锁状态 25bit 4bit 1bit 是否是偏向锁 2bit 锁标志位
无锁状态 对象的hashCode 对象的分代年龄 0 01

Java对象头存储结构(64位JVM)

锁状态 25bit 31bit 1bit cms_free 4bit 对象的分代年龄 1bit 是否是偏向锁 2bit 锁标志位
无锁状态 unused 对象的hashCode 0 01
偏向锁 ThreadID(54bit)Epoch(2bit) ThreadID(54bit)Epoch(2bit) 1 01

Mark Word的状态变化
volatile和synchronized底层实现原理_第1张图片

锁的升级与对比

偏向锁

大多数情况下,锁不仅不存在多线程竞争,而且总是由统一线程多次获得,为了让线程获得锁的代价更低而引入了偏向锁。
当一个线程访问同步块获得锁时,对象头和栈帧中锁记录里存储锁偏向的线程ID,以后线程在进入和退出同步块是不需要进行CAS操作来加锁和解锁,只需要简单地测试一下对象头的Mark Word里是否存储这指向当前线程的偏向锁,如果测试成功,表示线程已经获得了锁。入股哦测试失败,则需要在测试胰腺癌Mark Word中偏向锁的标识适度设置成1(表示当前是偏向锁):如果没有设置苛责使用CAS竞争锁;入股哦设置了,则藏式使用CAS将对象头的偏向锁指向当前线程。

偏向锁的初始化和撤销
volatile和synchronized底层实现原理_第2张图片
偏向锁使用了一种等到竞争出现才释放锁的机制,所以当其他线程藏式竞争偏向锁时,持有偏向锁的线程才会释放锁。
偏向锁的撤销需要等待全局安全点(在这个时间点上没有正在执行的字节码)。它会首先暂停暂停拥有偏向锁的线程,然后检查持有偏向锁的线程是否活着,如果线程不处于活动状态,则将对象头设置成无锁状态;如果线程仍然活着,拥有偏向锁的栈会被执行,遍历偏向对象的锁记录,栈中的锁记录和推向头的Mark Word要么重新偏向于其他线程,要么恢复到无锁或者对象不适合作为偏向锁,最后唤醒暂停的线程。
关闭偏向锁
偏向锁在java6和7是默认开启的,但是在应用程序启动几秒之后才激活。可以使用JVM参数:-XX:BiasedLockingStartupDelay=0。如果确定程序里所有的锁通常情况下处于竞争状态,可以通过JVM参数:-XX:-UseBiasedLocking=false,那么应用程序会进入轻量级锁状态。

轻量级锁

volatile和synchronized底层实现原理_第3张图片

轻量级锁加锁
线程在执行同步块之前,JVM回先在当前线程的栈帧中创建用于存储锁记录的空间,并将对象头中Mark Word复制到锁记录中,官方称为“Displaced Mark Word”。然后线程尝试使用CAS将对象头中的Mark Word替换为指向锁记录的指针。如果成功,当前线程获得锁,如果失败,表示其他线程竞争锁,当前线程便尝试使用自旋来获取锁。
轻量级锁解锁
轻量级锁解锁时,会使用原子的CAS操作将Displaced Mark Word替换回到对象头,如果成功,则表示没有竞争发生。如果失败,表示当前锁存在竞争,锁就会膨胀成重量级锁

因为自旋会消耗CPU,为了避免无用的自旋(比如获得锁的线程被阻塞住了)一旦锁升级成重量级锁,就不会在恢复到轻量级锁状态。当锁处于这个状态下,其他线程试图获取锁时,都会被阻塞住,当持有锁的线程释放锁之后会唤醒这些线程,被唤醒的线程会进行新一轮的夺锁之争。

锁的优缺点对比

优点 缺点 适用场景
偏向锁 加锁和解锁不需要额外的消耗,和执行非同步方法相比仅存在纳秒级的差距 如果线程间存在锁竞争,会带来额外的锁撤销操作 适用于只有一个线程访问同步块场景
轻量级锁 竞争的线程不会阻塞,提高了程序的响应速度 始终得不到锁竞争的线程,使用自旋会消耗CPU 追求响应时间,同步块执行速度非常快
重量级锁 线程竞争不使用自旋,不会消耗CPU 线程阻塞,响应时间缓慢 追求吞吐量,同步块执行速度较长

你可能感兴趣的:(并发编程,并发编程)