volatile是轻量级的synchronized,它在多处理器开发中保证了共享变量的“可见性”,它比synchronized的使用开销低因为,他不会引起线程上下文的切换。
1.volatile的定义与实现原理
Java语言提供了volatile,在某些情况下比锁要更方便。如果一个字段被声明成volatile,Java线程内存模型确保所有线程看到这个变量的值是一致的。
CPU指令:
在X86处理器下通过工具获取JIT编译器生成的汇编指令来查看对volatile进行写操作时,CPU会做什么事情。
代码:instance = new Singleton(); //instance是volatile变量。
汇编代码: 0x01a3deld:movb $0X0,0X1104800(%esi);0x01a3de24:lock $0X0,(%esp);
有lock前缀在多核处理器下会引发两件事。
1)将该处理器的该缓存行写回到系统内存中。
2)这个写会内存的操作会使其他处理器存储了该地址数据的数据无效。
为了提高处理速度,处理器不直接和内存进行通信,而是先将系统内存的数据读到内部缓存(L1,L2或其他)后再进行操作,JVM就会向处理器发送一条Lock前缀的指令,将这个变量所在缓存行的数据写回到系统内存。但是,就算写会到内存,如果其他处理器缓存的值还是旧的,再执行计算操作就会有问题。所以,在多处理器下,为了保证各个处理器的缓存是一致的,就会实现缓存一致性协议,每个处理器通过嗅探在总线上传播的数据来检查自己的缓存的值是不是过期了,当处理器发现自己缓存行对应的内存地址被修改,就会将当前处理器的缓存行设置成无效状态,当处理器对这个数据进行修改操作的时候,会重新从系统内存中把数据读到处理器缓存里。
2.具体实现原则:
1)Lock前缀指令会引起处理器缓存回写到内存。Lock前缀指令导致在执行指令期间,声言处理器的LOCK#信号。在多处理器环境中,LOCK#信号确保在声言该信号期间,处理器可以独占任何共享内存。但是在最近的处理器里,LOCK#信号一般不锁总线,而是锁缓存,毕竟锁总线开销的比较大。锁缓存的原理是,当访问的内存区域已经缓存在处理器内部,处理器会锁定这块内存区域的缓存行并回写到内存,并使用缓存一致性机制来确保修改的原子性,缓存一致性机制会阻止同时修改由两个以上处理器缓存的内存区域数据。
2)一个处理器的缓存回写到内存会导致其他处理器的缓存无效。处理器使用嗅探技术保证它的内部缓存、系统内存和其他处理器的缓存的数据在总线上保持一致。例如P6 family处理器中,如果通过嗅探一个处理器来检测其他处理器打算写内存地址,而这个地址当前处于共享状态,那么正在嗅探的处理器将使它的缓存行无效,在下次访问相同内存地址时,强制执行缓存行填充。
3.volatile的使用优化
1)追加字节优化性能:在JDK1.7的并发包里新增一个队列集合类Linked-TransferQueue,它使用volatile变量时,用一种追加字节的方式来优化队列出队和入队的性能。
/**队列中的头部节点*/
private transient final PaddedAtomicReference
/**队列中的尾部节点*/
private transient final PaddedAtomicReference tail;
static final class PaddedAtomicReference
//使用很多4个字节的引用追加到64个字节
Object p0,p1,p2,p4,p5,p6,p7,p8,p9,pa,pb,pc,pd,pe;
PaddedAtomicReference(T r){
super(r);
}
}
public class AtomicReference
private volatile V value;
//省略其他代码。
}
上述类,他使用一个内部类类型来定义队列的头节点和尾节点,而这个内部类相对于父类AtomicReference只做了一件事情,就是将共享变量追加到64字节。因为对于很多的处理器来说,他们的高速缓存行L1、L2和L3是64字节宽,不支持部分填充缓存行。这意味着队列的头节点和尾节点都不足64字节的话,处理器会将它们都读到同一个高速缓存行中,再多处理器下每个处理器都会缓存同样的头节点和尾节点,当一个处理器试图修改头节点时,会将整个缓存行锁定,那么在缓存一致性机制的影响下,其他的处理器将不能访问它们的尾节点,而队列的入队列和出队列操作则需要不停的修改头节点和尾节点,所以在多处理的情况下将会严重影响到队列的入队和出队效率。追加到64字节的方式来填满告诉缓冲区的缓存行,避免头节点和尾节点加载到同一个缓存行,使头、尾节点在修改时不会互相锁定。
如果共享变量不被频繁写的话,锁的几率也非常小,就没必要通过追加字节的方式来避免相互锁定。
但是这种追加字节的方式在Java7下可能不生效,因为Java7变得更加智慧,他会淘汰或重新排列无用字段,需要使用其他追加字节的方式。