目录
一、Java内存模型
1.JMM相关
2.内存操作
3.原子性、可见性、有序性
二、线程安全与锁优化
1.线程基础
2.线程安全
1)Java语言中的线程安全
2)线程安全的实现方式
3.锁
三、参考文章
Java内存模型(Java Memory Model,JMM)作用:用来屏蔽掉各 种硬件和操作系统的内存访问差异,以实现让Java程序在各种平台下都能达到一致的内存访问效果。
Java内存模型的主要目标是定义程序中各个变量的访问规则,即在虚拟机中将变量存储到内存和从内存中取出变量这样的底层细节。
Java内存模型规定了所有的变量都存储在主内存(Main Memory)中,每条线程还有自己的工作内存(Working Memory),线程的工作内存中保存了被该线程使用到的变量的主内存副本拷贝,线程对变量的 所有操作(读取、赋值等)都必须在工作内存中进行,而不能直接读写主内存中的变量。 不同的线程之间也无法直接访问对方工作内存中的变量,线程间变量值的传递均需要通过主 内存来完成,线程、主内存、工作内存三者的交互关系如图
JMM是操作系统内存模型的类比
这8种内存访问操作以及上述规则限定,再加上稍后介绍的对volatile的一些特殊规定,完全确定了Java程序中哪些内存访问操作在并发下是安全的
8种内存访问操作:
1)lock(锁定):作用于主内存的变量,它把一个变量标识为一条线程独占的状态。
2)unlock(解锁):作用于主内存的变量,它把一个处于锁定状态的变量释放出来,释放后的变量才可以被其他线程锁定。
3)read(读取):作用于主内存的变量,它把一个变量的值从主内存传输到线程的工作内存中,以便随后的load动作使用。
4)load(载入):作用于工作内存的变量,它把read操作从主内存中得到的变量值放入工作内存的变量副本中。
5)use(使用):作用于工作内存的变量,它把工作内存中一个变量的值传递给执行引擎,每当虚拟机遇到一个需要使用到变量的值的字节码指令时将会执行这个操作。
6)assign(赋值):作用于工作内存的变量,它把一个从执行引擎接收到的值赋给工作内存的变量,每当虚拟机遇到一个给变量赋值的字节码指令时执行这个操作。
7)store(存储):作用于工作内存的变量,它把工作内存中一个变量的值传送到主内存中,以便随后的write操作使用。
8)write(写入):作用于主内存的变量,它把store操作从工作内存中得到的变量的值放入主内存的变量中。
如果要把一个变量从主内存复制到工作内存,那就要顺序地执行read和load操作,如果要把变量从工作内存同步回主内存,就要顺序地执行store和write操作。注意,Java内存模型只要求上述两个操作必须按顺序执行,而没有保证是连续执行。也就是说,read与load之间、store与write之间是可插入其他指令的,如对主内存中的变量a、b进行访问时,一种可能出现顺序是read a、read b、load b、load a。除此之外,
Java内存模型还规定了在执行上述8种基本操作时必须满足如下8条规则:
不允许read和load、store和write操作之一单独出现,即不允许一个变量从主内存读取了但工作内存不接受,或者从工作内存发起回写了但主内存不接受的情况出现。
不允许一个线程丢弃它的最近的assign操作,即变量在工作内存中改变了之后必须把该变化同步回主内存。
不允许一个线程无原因地(没有发生过任何assign操作)把数据从线程的工作内存同步回主内存中。
一个新的变量(共享变量)只能在主内存中“诞生”,不允许在工作内存中直接使用一个未被初始化(load或assign)的变量,换句话说,就是对一个变量实施use、store操作之前,必须先执行过了assign和load操作。
一个变量在同一个时刻只允许一条线程对其进行lock操作,但lock操作可以被同一条线程重复执行多次,多次执行lock后,只有执行相同次数的unlock操作,变量才会被解锁。
如果对一个变量执行lock操作,那将会清空工作内存中此变量的值,在执行引擎使用这个变量前,需要重新执行load或assign操作初始化变量的值。
如果一个变量事先没有被lock操作锁定,那就不允许对它执行unlock操作,也不允许去unlock一个被其他线程锁定住的变量。
对一个变量执行unlock操作之前,必须先把此变量同步回主内存中(执行store、write操作)。
1)原子性(Atomicity):由Java内存模型来直接保证的原子性变量操作包括read、load、assign、use、store和write
synchronized块之间的操作也具备原子性。
2)可见性(Visibility):指当一条线程修改了这个变量的值,新值对于其他线程来说是可以立即得知的。
(对应内存访问规则的第6条)如果对声明了volatile的变量进行写操作,JVM就会向处理器发送一条Lock前缀的指令,将这个变量所在缓存行的数据写回到系统内存。但是,就算写回到内存,如果其他处理器缓存的值还是旧的,再执行计算操作就会有问题。所以,在多处理器下,为了保证各个处理器的缓存是一致的,就会实现缓存一致性协议,每个处理器通过嗅探在总线上传播的数据来检查自己缓存的值是不是过期了,当处理器发现自己缓存行对应的内存地址被修改,就会将当前处理器的缓存行设置成无效状态,当处理器对这个数据进行修改操作的时候,会重新从系统内存中把数据读到处理器缓存里。
这条规则说明了可见性不代表线程安全,只能说明变量立即可见。
synchronized的同步块的可见性是由“对一个变量执行unlock操作之前,必须先把此变量同步回主内存中(执行store、write操作)”这条规则获得的。
final关键字的可见性是指(常量共享):被final修饰的字段在构造器中一旦初始化完成,并且构造器没有把“this”的引用传递出去(this引用逃逸是一件很危险的事情,其他线程有可能通过这个引用访问到“初始化了一半”的对象),那在其他线程中就能看见final字段的值。
3)有序性(Ordering):a.一个线程中的所有操作必须按照程序的顺序来执行。b.(不管程序是否同步)所有线程都只能看到一个单一的操作执行顺序,每个操作都必须原子执行且立刻对所有线程可见。
Java内存模型的有序性可以总结为一句话:如果在本线程内观察,所有的操作都是有序的;如果在一个线程中观察另一个线程,所有的操作都是无序的。前半句是指“线程内表现为串行的语义”(Within-Thread As-If-Serial Semantics),后半句是指“指令重排序”现象 和“工作内存与主内存同步延迟”现象。
Java利用volatile和synchronized两个关键字来保证线程之间操作的有序性,volatile关键字本身就包含了禁止指令重排序的语义,而synchronized则是由“一个变量在同一个时刻只允许一条线程对其进行lock操作”这条规则获得的,这条规则决定了持有同一个锁的两个同步块只能串行地进入。
4)“先行发生”(happens-before)的原则:判断数据是否存在竞争、线程是否安全的主要依据
作用:指定两个操作之间的执行顺序。由于这两个操作可以在一个线程之内,也可以是在不同线程之间。因此,JMM可以通过happens-before关系向程序员提供跨线程的内存可见性保证(如果A线程的写操作a与B线程的读操作b之间存在happens-before关系,尽管a操作和b操作在不同的线程中执行,但JMM向程序员保证a操作将对b操作可见)
JMM对程序员的承诺:
a.如果一个操作happens-before另一个操作,那么第一个操作的执行结果将对第二个操作可见,而且第一个操作的执行顺序排在第二个操作之前。
JMM对编译器和处理器重排序的约束原则:
b.两个操作之间存在happens-before关系,并不意味着Java平台的具体实现必须要按照happens-before关系指定的顺序来执行。如果重排序之后的执行结果,与按happens-before关系来执行的结果一致,那么这种重排序并不非法(只要不改变程序的执行结果——指的是单线程程序和正确同步的多线程程序,编译器和处理器怎么优化都行)
1)as-if-serial语义的意思是:
不管怎么重排序(编译器和处理器为了提高并行度),(单线程)程序的执行结果不能被改变
2)as-if-serial与happens-before对比:
as-if-serial语义保证单线程内程序的执行结果不被改变,
as-if-serial语义给编写单线程程序的程序员创造了一个幻境:单线程程序是按程序的顺序来执行的。
happens-before关系保证正确同步的多线程程序的执行结果不被改变。
happens-before关系给编写正确同步的多线程程序的程序员创造了一个幻境:
正确同步的多线程程序是按happens-before指定的顺序来执行的。
3)as-if-serial语义和happens-before共同目的:都是为了在不改变程序执行结果的前提下,尽可能地提高程序执行的并行度。
happens-before规则:
a)程序顺序规则:一个线程中的每个操作,happens-before于该线程中的任意后续操作。
b)监视器锁规则:对一个锁的解锁,happens-before于随后对这个锁的加锁。
c)volatile变量规则:对一个volatile域的写,happens-before于任意后续对这个volatile域的 读。
d)传递性:如果A happens-before B,且B happens-before C,那么A happens-before C。
e)start()规则:如果线程A执行操作ThreadB.start()(启动线程B),那么A线程的 ThreadB.start()操作happens-before于线程B中的任意操作。
f)join()规则:如果线程A执行操作ThreadB.join()并成功返回,那么线程B中的任意操作 happens-before于线程A从ThreadB.join()操作成功返回。
线程主要有3种方式:使用内核线程实现、使用用户线程实现和使用用户线程加轻量级进程混合实现
线程的六个状态:
线程状态转换关系:
按照线程安全的“安全程度”由强至弱来排序,将Java语言中各种操作共享的数据分为以下5类:不可变、绝对线程安全、相对线程安全、线程兼容和线程对立。
a.不可变
不可变(Immutable)的对象一定是线程安全的,无论是对象的方法实现还是方法的调用者,都不需要再采取任何的线程安全保障措施。例如final关键字带来的可见性,只要一个不可变的对象被正确地构建出来(没有发生this引用逃逸的情况),那其外部的可见状态永远也不会改变,永远也不会看到它在多个线程之中处于不一致的状态。“不可变”带来的安全性是最简单和最纯粹的。
b.绝对线程安全
一个类要达到“不管运行时环境如何,调用者都不需要任何额外的同步措施”通常需要付出很大的,甚至有时候是不切实际的代价。
c.相对的线程安全
相对的线程安全就是我们通常意义上所讲的线程安全,它需要保证对这个对象单独的操作是线程安全的,我们在调用的时候不需要做额外的保障措施,但是对于一些特定顺序的连续调用,就可能需要在调用端使用额外的同步手段来保证调用的正确性。
大部分的线程安全类都属于这种类型,例如Vector、HashTable、Collections的synchronizedCollection()方法包装的集合等。
d.线程兼容
线程兼容是指对象本身并不是线程安全的,但是可以通过在调用端正确地使用同步手段 来保证对象在并发环境中可以安全地使用,我们平常说一个类不是线程安全的,绝大多数时 候指的是这一种情况。Java API中大部分的类都是属于线程兼容的,如集合类的ArrayList和HashMap等。
e.线程对立
线程对立是指无论调用端是否采取了同步措施,都无法在多线程环境中并发使用的代码。由于Java语言天生就具备多线程特性,线程对立这种排斥多线程的代码是很少出现的,而且通常都是有害的,应当尽量避免。
一个线程对立的例子是Thread类的suspend()和resume()方法,如果有两个线程同时持有一个线程对象,一个尝试去中断线程,另一个尝试去恢复线程,如果并发进行的话,无论调用时是否进行了同步,目标线程都是存在死锁风险的,如果suspend()中断的线程就是即将要执行resume()的那个线程,那就肯定要产生死锁了。也正是由于这个原因,suspend()和resume()方法已经被JDK声明废弃(@Deprecated)了。
互斥同步非阻塞同步无同步方案
a.互斥同步
互斥同步(Mutual Exclusion&Synchronization)是常见的一种并发正确性保障手段。同步 是指在多个线程并发访问共享数据时,保证共享数据在同一个时刻只被一个(或者是一些, 使用信号量的时候)线程使用。而互斥是实现同步的一种手段,临界区(Critical Section)、互斥量(Mutex)和信号量(Semaphore)都是主要的互斥实现方式。因此,在这 4个字里面,互斥是因,同步是果;互斥是方法,同步是目的。
Java中可以使用了synchronized关键字或java.util.concurrent(J.U.C)包中的重入锁(ReentrantLock)来实现同步
互斥同步最主要的问题就是进行线程阻塞和唤醒所带来的性能问题,因此这种同步也称 为阻塞同步(Blocking Synchronization)。从处理问题的方式上说,互斥同步属于一种悲观的并发策略,总是认为只要不去做正确的同步措施(例如加锁),那就肯定会出现问题,无论 共享数据是否真的会出现竞争,它都要进行加锁(实际上虚拟机会优化掉很大一部分不必要的加锁)、用户态核心态转换、维护锁计数器和检查是否有被阻塞 的线程需要唤醒等操作
b.非阻塞同步
非阻塞同步:基于冲突检测的乐观并发策略,通俗地说,就是先进行操作,如果没有其他线程争用共享数据,那操作就成功了;如果共享数据有争用,产生了冲突,那就再采取其他的补偿措施(最常见的补偿措施 就是不断地重试,直到成功为止),这种乐观的并发策略的许多实现都不需要把线程挂起, 因此这种同步操作称为非阻塞同步(Non-Blocking Synchronization)。
例如CAS(A旧值,B预期值,V新值;如果A=B,那么将A更新为V)比较和交换操作
c.无同步方案
要保证线程安全,并不是一定就要进行同步,两者没有因果关系。同步只是保证共享数据争用时的正确性的手段,如果一个方法本来就不涉及共享数据,那它自然就无须任何同步措施去保证正确性,因此会有一些代码天生就是线程安全的
两类天生就是线程安全代码:
a.可重入代码(Reentrant Code):这种代码也叫做纯代码(Pure Code),可以在代码执行的任何时刻中断它,转而去执行另外一段代码(包括递归调用它本身),而在控制权返回 后,原来的程序不会出现任何错误。相对线程安全来说,可重入性是更基本的特性,它可以保证线程安全,即所有的可重入的代码都是线程安全的,但是并非所有的线程安全的代码都 是可重入的。
可重入代码有一些共同的特征,例如不依赖存储在堆上的数据和公用的系统资源、用到 的状态量都由参数中传入、不调用非可重入的方法等。我们可以通过一个简单的原则来判断代码是否具备可重入性:如果一个方法,它的返回结果是可以预测的,只要输入了相同的数 据,就都能返回相同的结果,那它就满足可重入性的要求,当然也就是线程安全的。
b.线程本地存储(Thread Local Storage):如果一段代码中所需要的数据必须与其他代码 共享,那就看看这些共享数据的代码是否能保证在同一个线程中执行?如果能保证,我们就可以把共享数据的可见范围限制在同一个线程之内,这样,无须同步也能保证线程之间不出 现数据争用的问题。
锁优化技术:适应性自旋(Adaptive Spinning)、锁消除 (Lock Elimination)、锁粗化(Lock Coarsening)、轻量级锁(Lightweight Locking)和偏向锁(Biased Locking)等,这些技术都是为了在线程之间更高效地共享数据,以及解决竞争问 题,从而提高程序的执行效率
锁升级:
无锁状态
偏向锁状态
轻量级锁状态
重量级锁状态
四种状态会随着竞争的情况逐渐升级,而且是不可逆的过程,即不可降级。
三种锁对比
通俗来讲就是:
偏向锁:仅有一个线程进入临界区
轻量级锁:多个线程交替进入临界区
重量级锁:多个线程同时进入临界区
[1] 周志明.深入理解Java虚拟机(第二版)[D]
[2] Java并发编程艺术[D]
[3] java 中的锁 -- 偏向锁、轻量级锁、自旋锁、重量级锁
https://blog.csdn.net/zqz_zqz/article/details/70233767
[4] 偏向锁、轻量级锁、重量级锁的升级以及区别
https://www.jianshu.com/p/9998a9db17f7