并发学习01-Java并发机制的底层原理之volatile

该并发学习系列以阅读《Java并发编程的艺术》一书的笔记为蓝本，汇集一些阅读过程中找到的解惑资料而成。这是一个边看边写的系列，有兴趣的也可以先自行购买此书学习。

本文首发：windCoder

Java中所示的并发机制依赖于JVM的实现和CPU的指令。

concurrence-01-1.png

Volatile

相关术语

Volatile是轻量级的synchronize，在多处理器开发中保证了共享变量的“可见性”。

可见性的意思是当一个线程修改一个共享变量时，另外一个线程能读到这个修改的值。
共享变量是指可以在多线程中共享的变量。所有的实例变量(Instance Fields)、静态变量(Static Fields)、数组元素(Array Elements)都属于共享变量。局部变量(Local Variables)、形式参数(Formal Method Parameneters)和异常处理器参数（Exception Handler Paramenters）永远不会在线程之间共享,并且不受内存模型（Memory Model）的影响。

相关CPU术语

术语	英文单词	术语描述
内存屏障	memory barriers	是一组处理器指令，用于实现对内存操作的顺序限制。
缓存行	cache line	CPU高速缓存（一般分为一级和二级,现在更多的CPU提供了三级缓存）中可以分配的最小存储单位。处理器填写缓存行时会加载整个缓存行，现代CPU需要执行几百的CPU指令。
原子操作	atomic operations	不可中断的一个或一系列操作。
缓存行填充	cache line fill	当处理器识别到内存中读取操作数是可缓存的，处理器读取整个缓存行到适当的缓存（L1，L2，L3或所有）中。
缓存命中	cache hit	如果进行高速缓存行填充操作的内存位置仍然是下次处理器访问的地址时，处理器从缓存中读取操作数，而不是从内存中读取。
写命中	write hit	当处理器将操作数写回到一个内存缓存的区域时，它首先会检测这个缓存的内存地址是否在缓存行中，如果存在一个有效的缓存行，则处理器将这个操作数写回到缓存，而不是写回到内存，这个操作被称为写命中。
写缺失	write misses the cache	一个有效的缓存行被写入到不存在的内存区域。
操作数	operand	它可能指定了参与操作的寄存器、内存地址或者立即数（litera data）。操作数还可能包括寻址方式，寻址方式确定操作数的含义。
操作码	opcode	指定了要进行什么样的操作，例如“将存储器中的内容与寄存器中的内容相加”
指令	Instruction	传统的架构上，指令包含一个操作码和零个或更多的操作数。

官方定义（$8.3.1.4）

Java编程语言允许线程访问共享变量。通常，为了确保共享变量能被一致且准确地更新，线程应通过获取锁来确保自己独占此变量，该锁通常会对这些共享变量实施互斥（即该锁为排它锁）。

Java编程语言提供了第二种机制，即Volatile字段，在某些情况下比锁更方便。

若一个字段被声明为volatile，Java内存模型可确保所有线程看到这个变量的值是一致的。

实现原理

那么 volatile 是如何保证可见性呢？让我们看以下代码：
Java 代码如下：

instance = new Singleton() ; //instance 是 volatile 变量

转变为汇编如下:

0x01a3deld: movb $0x0,0x1104800(%esi);
0x01a3de24: lock addl $0x0,(%esp);

有volatile修饰的共享变量进行写操作时会多出第二行含Lock前缀指令的汇编代码。Lock前缀的指令在多核处理器下会引发两件事：

将当前处理器缓存行的数据写回到系统内存。
这个写回内存的操作会使在其他CPU里缓存了该内存地址的数据无效。

为提高处理速度，处理器不直接和内存进行通信，而是先将系统内存的数据读到内部缓存（L1，L2或其他）后再进行操作，但操作完全不知道何时会写到内存。

若对声明了volatile的变量进行写操作，JVM就会向处理器发送一条Lock前缀的指令，将这个变量所在缓存行的数据协会到系统内存。

在多处理器下，为了保证个处理器的缓存是一致的，就会实现缓存一致性协议，每个处理器通过嗅探在总线上传播的数据来检验自己缓存的值是不是过期了，当处理器发现自己缓存行对应的内存地址被修改，就会将当前处理器的缓存行设置成无效状态，当处理器对这个数据进行修改操作的时候，会重新从系统内存中把数据读到处理器缓存里。

以下为详解volatile的两条实现原则：

Lock前缀指令引起处理器写回到内存

Lock前缀指令导致在执行指令期间，声言处理器的LOCK#信号。

在多处理器环境中，LOCK#信号确保在声言该信号期间，处理器可以独占任何共享内存。因为它会锁住总线，导致其他CPU无法访问总线，无法访问总线即意味着不能访问系统内存。

在最近的处理器里，LOCK#信号一般不所总线，而是所缓存，毕竟锁总线开销比较大。

对于Intel486和Pentium处理器，在锁操作时，总是在总线上声言LOCK#信号。但在P6和目前的处理器中，如果访问的内存区域已经缓存在处理器内部，则不会声言LOCK#信号。相反，它会锁定这块内存区域的缓存并回写到内存，并使用缓存一致性机制来确保修改的原子性，此操作被称为“缓存锁定”，缓存一致性机制会阻止同时修改由两个以上处理器缓存的内存区域数据。

一个处理器的缓存会写到内存会导致其他处理器的缓存无效

IA-32处理器和Intel64处理器使用MESI(修改、独占、共享、无效)控制协议去维护内部缓存和其他处理器缓存的一致性。

在多核处理器系统中进行操作时，IA-32和Intel64处理器能嗅探其他处理器访问系统内存和它们的内部缓存。处理器使用嗅探技术保证它的内部缓存、系统内存和其他处理器的换错的数据在总线上保持一致。

参考资料

《Java并发编程的艺术》勘误和支持
指令-wiki
CPU体系架构-寻址方式