注：本文内容会有部分涉及上节的硬件知识：【Java并发学习二】多线程编程的硬件基础知识总结

1. 内存屏障

上一节讲过，为了解决写缓冲器和无效化队列带来的有序性和可见性问题，我们引入了内存屏障。

内存屏障是被插入两个CPU指令之间的一种指令，用来禁止处理器指令发生重排序（像屏障一样），从而保障有序性的。另外，为了达到屏障的效果，它也会使处理器写入、读取值之前，将写缓冲器的值写入高速缓存，清空无效队列，从而“附带”的保障了可见性。

举个例子说明：
Store1 Store2 Load1 StoreLoad屏障 Store3 Load2 Load3

对于上面的一组CPU指令（Store表示写入指令，Load表示读取指令），StoreLoad屏障之前的Store指令无法与StoreLoad屏障之后的Load指令进行交换位置，即重排序。但是StoreLoad屏障之前和之后的指令是可以互换位置的，即Store1可以和Store2互换，Load2可以和Load3互换。

StoreLoad屏障的目的在于使屏障前的写操作的结果，对于屏障后的读操作是可见的。为了保障这一点，除了指令不能重排序外，StoreLoad屏障还会在写操作完之后，将写缓冲器中的条目冲刷入高速缓存或主内存；在读操作之前，清空无效化队列，从主内存或其他处理器的高速缓存中读取最新值到自己的内存。从而保障了数据在不同处理器之间是一致的，即可见性。

1.1 基本内存屏障

基本内存屏障可以分为：LoadLoad屏障、LoadStore屏障、StoreStore屏障和StoreLoad屏障。这些屏障可统一用XY来表示，XY屏障的作用是禁止屏障左侧的任何X操作与屏障右侧的任何Y操作之间进行重排序。

LoadLoad屏障：
对于这样的语句 Load1; LoadLoad; Load2，在Load2及后续读取操作要读取的数据被访问前，保证Load1要读取的数据被读取完毕。
StoreStore屏障：
对于这样的语句 Store1; StoreStore; Store2，在Store2及后续写入操作执行前，保证Store1的写入操作对其它处理器可见。
LoadStore屏障：
对于这样的语句Load1; LoadStore; Store2，在Store2及后续写入操作被执行前，保证Load1要读取的数据被读取完毕。
StoreLoad屏障：
对于这样的语句Store1; StoreLoad; Load2，在Load2及后续所有读取操作执行前，保证Store1的写入对所有处理器可见。它的开销是四种屏障中最大的（冲刷写缓冲器，清空无效化队列）。在大多数处理器的实现中，这个屏障是个万能屏障，兼具其它三种内存屏障的功能。

1.2 内存屏障的分类

按照可见性保障来划分
内存屏障可分为：加载屏障（Load Barrier）和存储屏障（Store Barrier）。
加载屏障：StoreLoad屏障可充当加载屏障，作用是刷新处理器缓存，即清空无效化队列，使处理器在读取共享变量时，先从主内存或其他处理器的高速缓存中读取相应变量，更新到自己的缓存中
存储屏障：StoreLoad屏障可充当存储屏障，作用是冲刷处理器缓存，即将写缓冲器内容写入高速缓存中，使处理器对共享变量的更新写入高速缓存或者主内存中
这两个屏障一起保证了数据在多处理器之间是可见的。
按照有序性保障来划分
内存屏障分为：获取屏障（Acquire Barrier）和释放屏障（Release Barrier）。
获取屏障：相当于LoadLoad屏障与LoadStore屏障的组合。在读操作后插入，禁止该读操作与其后的任何读写操作发生重排序；
释放屏障：相当于LoadStore屏障与StoreStore屏障的组合。在一个写操作之前插入，禁止该写操作与其前面的任何读写操作发生重排序。
这两个屏障一起保证了临界区中的任何读写操作不可能被重排序到临界区之外。

2. volatile原理

Java中，volatile保障了所修饰变量的可见性和有序性，下面用内存屏障来解释下它的具体实现原理。

2.1 volatile变量的读写过程

写操作：

如上图，释放屏障（LoadStore屏障与StoreStore屏障）保证了volatile写操作与该操作之前的任何读、写操作都不会进行重排序。从而保证了volatile写操作之前，任何的读写操作都会先于volatile被提交。

而存储屏障（StoreLoad屏障）除了使volatile写操作不会与之后的读操作重排序外，还会冲刷处理器缓存，使volatile变量的写更新对其他线程可见，该内存屏障与读操作的加载屏障一起保障了可见性。

读操作：

如上图，加载屏障（StoreLoad屏障）除了使volatile读操作不会与之前的写操作发生重排序外，还会刷新处理器缓存，使volatile变量读取的为最新值。

获取屏障（LoadLoad屏障与LoadStore屏障）禁止了volatile读操作与其之后的任何读写操作进行重排序。保障了volatile变量读操作之后的任何读写操作，volatile的写线程的更新已经对其可见。

2.2 举例说明

volatile对有序性的保障，看了上面的图后，可能还是有点乱，下面我们举个例子来说明：

写线程	读线程
A = 1; B = 2; [LoadStore + StoreStore] //释放屏障 V = true;
	if(V){ [LoadLoad + LoadStore] //获取屏障 sum = A + B; }

如上表，写线程、读线程交替执行。其中A、B为普通变量，V为volatile修饰的变量。

写线程的释放屏障（LoadStore与StoreStore）确保了A、B变量的更新先于V的更新被提交，这样便确保了读线程在读到V的更新值时，也能读到A、B的更新值。

读线程的获取屏障（LoadLoad与LoadStore）确保了读线程一定是先读取V，再读取A、B变量。这样做的原因在于，为了保障读线程能够感知到写线程的正确写入顺序，读线程读取变量的顺序要与写线程写入变量的顺序相反（即读V——>读B——>读A）

写读线程通过释放屏障和获取屏障的配对使用，保障了volatile变量的有序性。

2.3 volatile的应用场景

最后补充下volatile关键字的应用场景：

使用volatile变量作为状态标志
使用volatile保障变量的可见性
使用volatile变量替代锁。将一组可变状态变量封装成volatile修饰的实体对象，每次更改时，重新给这个实体对象赋值。
使用volatile实现简易版读写锁

3. synchronized原理

synchronized编译成字节码后，是通过monitorenter（入锁）和monitorexit（出锁）两个指令实现的，具体过程如下：

【Java并发学习三】内存屏障与synchronized、volatile的原理_第3张图片

可以发现，与volatile类似，synchronized底层也是通过释放屏障和获取屏障的配对使用保障有序性，加载屏障和存储屏障的配对使用保障可见性。最后又通过锁的排他性保障了原子性。

本文总结自：
黄文海《Java多线程编程实战指南》——第3、12章

【Java并发学习三】内存屏障与synchronized、volatile的原理