一个或多个操作,要么全部执行且在执行过程中不被任何因素打断,要么全部不执行。在Java中,对基本数据类型的读取和赋值操作是原子性操作(64位处理器)。不采取任何的原子性保障措施的自增操作并不是原子性的,比如i++操作
public class AtomicTest {
private static int count = 0;
public static void main(String[] args) throws InterruptedException {
for (int i = 0; i < 10; i++) {
new Thread(()->{
for (int j = 0; j < 10000; j++) {
count++;
}
}).start();
}
Thread.sleep(3000);
System.out.println(count);
}
}
加不加volatile,执行结果都不会是十万,都是因为线程执行过程中自增操作不是原子性的,发生结果的覆盖
可见性是指当多个线程访问同一个变量时,一个线程修改了这个变量的值,其它线程能够立即看得到修改的值
public class VisibilityTest {
private static int flag = 1;
// private static volatile int flag = 1;
public static void main(String[] args) throws InterruptedException {
// 两个线程对一个变量同时做累加操作
Thread runningThread = new Thread(new RunningThread(), "runningThread");
Thread changeThread = new Thread(new ChangeThread(), "changeThread");
Thread changeThread1= new Thread(new ChangeThread1(), "changeThread1");
runningThread.start();
Thread.sleep(20);
// 先让runningThread运行一会
changeThread.start();
Thread.sleep(20);
changeThread1.start();
}
static class RunningThread implements Runnable {
@Override
public void run() {
while (flag == 1) {
}
System.out.println("不满足条件flag="+flag+",线程运行结束");
}
}
static class ChangeThread implements Runnable {
@Override
public void run() {
flag++;
System.out.println(Thread.currentThread().getName()+"把flag修改成"+flag);
}
}
static class ChangeThread1 implements Runnable {
@Override
public void run() {
flag++;
System.out.println(Thread.currentThread().getName()+"把flag修改成"+flag);
}
}
}
打印结果:
changeThread把flag修改成2
changeThread1把flag修改成3
程序会一直卡在RunningThread线程的run()方法的while循环中,也就说明了changeThread和changeThread1对变量flag的操作,RunningThread线程不可见
即程序执行顺序按照代码的先后顺序执行。为了提升性能,编译器和处理器常常对指令做重排序,所以存在有序性问题
public class ReOrderTest {
private static int x = 0, y = 0;
private static int a = 0, b = 0;
public static void main(String[] args) throws InterruptedException {
int i = 0;
while (true) {
i++;
x = 0;
y = 0;
a = 0;
b = 0;
Thread thread1 = new Thread(() -> {
shortWait(20000);
a = 1;
x = b;
});
Thread thread2 = new Thread(() -> {
b = 1;
y = a;
});
thread1.start();
thread2.start();
thread1.join();
thread2.join();
System.out.println("第"+i+"次("+x+","+y+")");
if (x==0&&y==0) {
break;
}
}
}
public static void shortWait(long interval) {
long start = System.nanoTime();
long end;
do {
end = System.nanoTime();
} while (start + interval >= end);
}
}
执行结果:x,y出现了0,0的结果,程序终止。出现这种结果有可能是重排序导致的
在并发编程中,需要处理的两个关键问题:
线程之间常用的通信机制有两种:共享内存和消息传递,Java采用的是共享内存模型
Java线程之间的通信由Java内存模型(Java Memory Model,简称JMM)控制,JMM决定一个线程对共享变量的写入何时对另一个线程可见。
从抽象的角度来看,JMM定义了线程和主内存之间的抽象关系:线程之间的共享变量存储在主内存中,每个线程都有一个私有的本地内存,本地内存中存储了共享变量的副本。本地内存是JMM的一个抽象概念,并不真实存在,它涵盖了缓存,写缓冲区,寄存器以及其他的硬件和编译器优化。
根据JMM的规定,线程对共享变量的所有操作都必须在自己的本地内存中进行,不能直接从主内存中读取。
从上图看,线程A和线程B之间要通信的话,必须经历以下两个步骤:
1)线程A把本地内存A中更新过的共享变量刷新到主内存中
2)线程B到主内存中去读取线程A之前已更新过的共享变量
所以,线程A无法直接访问线程B的工作内存,线程间通信必须经过主内存。JMM通过控制主内存与每个线程的本地内存之间的交互,来为Java程序提供内存可见性的保证。
关于主内存与工作内存之间的具体交互协议,即一个变量如何从主内存拷贝到工作内存、如何从工作内存同步到主内存之间的实现细节,Java内存模型定义了以下八种原子操作来完成:
Java内存模型还规定了在执行上述八种基本操作时,必须满足如下规则:
Java中可见性底层有两种实现:
lock addl $0x0,(%rsp)
锁获取和释放的内存语义:
synchronized关键字的作用是确保多个线程访问共享资源时的互斥性和可见性。在获取锁之前,线程会将共享变量的最新值从主内存中读取到线程本地的缓存中,释放锁时会将修改后的共享变量的值刷新到主内存中,以保证可见性
volatile写的内存语义:
当写一个volatile变量时,JMM会把该线程对应的本地内存中的共享变量值刷新到主内存
volatile读的内存语义:
当读一个volatile变量时,JMM会把该线程对应本地内存变量置为无效,线程接下来将从主内存中读取共享变量
JMM属于语言级的内存模型,它确保在不同的编译器和不同的处理器平台之上,通过禁止特定类型的编译器重排序和处理器重排序,为程序员提供一致的内存可见性保证
为了实现volatile的内存语义,JMM会限制编译器重排序,JMM针对编译器指定了volatile重排序规则
由表中可以看出,volatile禁止重排序场景:
public class SingletonTest {
private SingletonTest() {}
private static volatile SingletonTest singletonTest = null;
public static SingletonTest get() {
if (singletonTest == null) {
synchronized (SingletonTest.class) {
// 这里为什么还要判断(DCL双重检查 为了防止等待锁的线程进来没有判断又创建一个对象)
if (singletonTest == null) {
// java创建对象不是原子的
// 1、分配内存空间
// 2、对象初始化
// 3、指向内存空间的地址
// 要加上volatile关键字防止指令重排序返回没有初始化完的对象
singletonTest = new SingletonTest();
}
}
}
return singletonTest;
}
}
为了实现volatile的内存语义,编译器在生成字节码时,会在指令序列中插入内存屏障来禁止特定类型的处理器重排序。JMM内存屏障插入策略:
上述内存屏障的插入策略非常保守,但它可以保证在任意处理器平台,任意程序中都能得到正确的volatile内存语义
由于不同的处理器有不同的松紧度的处理器内存模型,内存屏障的插入还可以根据具体的处理器内存模型继续优化。以x86处理器为例,x86不会对读-读、读-写、写-写操作做重排序,因此在x86处理器中会省略这3类操作对应的内存屏障,仅会对写-读操作做重排序。
不同硬件实现内存屏障的方式不同,Java内存模型屏蔽了这种底层硬件平台的差异,由JVM来为不同的平台生成相应的机器码
拿x86处理器来说,有几种主要的内存屏障:
内存屏障有两个能力:
orderAccess_linux_x86.inline.hpp
inline void OrderAccess::storeload() { fence(); }
inline void OrderAccess::fence() {
if (os::is_MP()) {
// always use locked addl since mfence is sometimes expensive
#ifdef AMD64
__asm__ volatile ("lock; addl $0,0(%%rsp)" : : : "cc", "memory");
#else
__asm__ volatile ("lock; addl $0,0(%%esp)" : : : "cc", "memory");
#endif
}
}
x86处理器中利用lock前缀指令实现类似内存屏障的效果
lock前缀指令的作用
- 确保后续指令执行的原子性。在Pentium及之前的处理器中,带有lock前缀指令在执行期间会锁住总线,使得其它处理器暂时无法通过总线访问内存,很显然,这个开销很大。在新的处理器中,Intel使用缓存锁定来保证指令执行的原子性,缓存锁定将大大降低lock前缀指令的执行开销
- lock前缀指令具有类似于内存屏障的功能,禁止该指令与前面和后面的读写指令重排序
- lock前缀指令会等待它之前所有的指令完成,并且所有缓冲的写操作写回内存(也就是将store buffer中的内容写入内存)之后才开始执行,并且根据缓存一致性协议,刷新store buffer的操作会导致其它cache中的副本失效
JSR-133使用happens-before的概念来指定两个操作之间的执行顺序。由于这两个操作可以在一个线程之内,也可以在不同的线程之内。因此,JMM可以通过happens-before关系向程序员提供跨线程的内存可见性保证。
JSR-133规范对happens-before关系的定义如下:
1)如果一个操作happens-before 另一个操作,那么第一个操作的执行结果将对第二个操作可见,而且第一个操作的执行顺序排在第二个操作之前。 这是JMM对程序员的承诺, 注意,这只是JMM向程序员做出的保证。
2)两个操作之间存在happens-before关系,并不意味着Java平台的具体实现必须要按照happens-before关系指定的顺序来执行。如果重排序之后的执行结果,与按happens-before关系来执行的结果一致,那么这种排序并不非法,也就是说,JMM允许这种排序。这是JMM对编译器和处理器重排序的约束原则
JMM遵循一个基本原则:只要不改变程序的执行结果,编译器和处理器怎么优化都行。
这么做的目的是为了在不改变程序执行结果的前提下,尽可能地提高程序执行的并行度。
JSR-133规范定义了如下happens-before规则:
Java中的volatile关键字可以保证多线程操作共享变量的可见性以及禁止指令重排序,synchronized关键字不仅保证可见性,同时也保证了原子性(互斥性)。在更底层,JMM通过内存屏障来实现内存的可见性以及禁止重排序。为了程序员的方便理解,提出了happens-before,它更加的简单易懂,从而避免了程序员为了理解内存可见性而去学习复杂的重排序规则以及这些规则的具体实现方法。