深入理解Java内存模型的语义

[img]https://www.logicbig.com/tutorials/core-java-tutorial/java-multi-threading/java-memory-model/images/jmm.png[/img]
### 前言
Java内存模型(JMM)给我们介绍了在当代不同的硬件架构情况下,多线程程序需要关注什么问题以及如何利用JMM来正确的处理这些问题。

### 多线程带来的问题

多线程程序主要关注两个问题:

(1)共享变量可见性问题

(2)代码重排序一致性问题


### Java内存模型的关键点
JMM已经保证了as-if-serial原则,也就是Java的程序在单线程情况下,不管JIT做不做重排序,也不管代码指令在几个CPU上执行,看到的最终结果必须和代码顺序执行的结果保持一致。

但是在多线程的情况下,如何才能正确的处理的变量可见性问题和重排序的一致性问题?

关键在于理解和运用下面的两块内容:

(1)happens-before相关

(2)data race相关

### 关于Memory Consistency Errors
Memory Consistency Errors中文含义是:**内存一致性错误**,指的的是多线程环境下,对于同一个共享变量的值在不同的线程看到的视图不一致。

伪代码如下:

```
int counter = 0;
```

此时A线程正在执行:

```
counter++;
```

然后过了几秒后,B线程打印这个值:

```
System.out.println(counter);
```


此时B线程的打印结果很大可能是0,但A线程里面其实这个值已经是1了,这就是典型的内存一致性错误。这情况种只能通过happens-before规则来避免。


### 关于happens-before
happens-before是JMM里面保证在一个线程里面执行的action(读或者写)的结果,可以在随后的其他线程里面立马可见的一系列规则。比如 x happens-before y ,那么不管x和y是不是在同一个线程里面,JMM都会保证对于x的update都会立马里面对y线程可见,也就是x总会先于y执行,前提是两者必须有happens-before关系,否则就会出现上面的内存一致性错误的问题。

如何建立happens-before关系? 这里面有几条规则:

(1) 单线程中的程序执行结果与代码的顺序执行结果保持一致。

你能会好奇,难道单线程不是顺序执行的吗? 答案是的确不一定按照顺序执行,这个跟硬件的指令重排序有关,目的是为了优化性能让cpu更快的执行指令,但有happens-before保证,所以结果跟代码顺序执行的结果保持一致,这是最基础的保证,也是最重要的保证。

(2)同一个锁的unlock操作,在其他线程lock后,变量是可见的。

```
class LockRule {
private int value = 0;

public synchronized void setValue(int value) {
this.value = value;
}

public synchronized int getValue() {
return value;
}
}
```

也就是在A线程中执行setValue操作,在B线程中执行getValue方法是可以看到变化的,注意这里一定是同一个监视器才可以,比如上面这段代码就是用对象做为监视器。此外ReentrantLock锁也具有相同的语义。

(3)volatile修饰的变量,在一个线程update后,立刻对其他的线程可见。这个不多说,前面的文章介绍过。

(4)关于Thread的start方法,是指在一个线程A中启动另外另外一个线程B时,A里面所有的变量对B是可见的,最常见的就是我们在java的main线程中启动的线程是可以看到启动之前所有的main线程的变量的。底层是启动前把所有内容都同步到主内存里面了,然后新的线程会从主内存里面拷贝一份数据到自己的cache,所以是可见的。

(5)关于Thread的join方法,同样道理,比如我在java的main线程里面声明了一个线程B,然后调用
B.start() //启动B线程
B.join() //main线程等待B线程结束
此时在B线程里面修改了成员变量,在B线程结束的时候,main线程是可以直接看到最终变化的。这是一个线程结束的时候会把自己缓存的值给刷新到主内存,所以感知了B线程结束的主线程是可以看到所有变化的。

(6)关于Thread的interrupt方法,同样道理,在java的main线程中,比如我在java的main线程里面声明了一个线程B,然后调用
B.start() //启动B线程
B.interrupt() //打断B线程,此时B线程的是可以看到主线程的修改的状态

(7)对于实例的finalize()方法,当实例的构造方法执行完毕之后,如果再执行finalize()方法,此时实例里面的所有变量不管有多少线程修改过对finalize()方法都是可见的。

(8)传递性规则: 如果 A happens-before B 并且 B happens-before C, 那么 A happens-before C


### 关于data race

data race又叫数据竞争,在这里指的多个线程之间没有符合的happens-before规则,但是它们又需要修改同一个共享变量,比如上面的counter的例子,最终会造成内存一致性的问题,这种情况下可以通过Java自带的一些锁机制来避免。

### 关于上篇文章遗留问题

在上篇文章中,我遗留了一个问题,那就在下面的代码中:

```
private static boolean keepRunning=true;

public static void main(String[] args) throws Exception {

new Thread(
()->{

while (keepRunning){
//System.out.println();
}
}

).start();

Thread.sleep(1000);
keepRunning=false;

}
```

如果我把while循环里面的打印语句去掉,那么即使没有volatile关键字,程序也可以结束循环,为什么? 其实答案就在今天的知识里面,因为打印语句会锁住当前的实例,源码如下:

```
public void println(boolean x) {
synchronized (this) {
print(x);
newLine();
}
}
```

对应到上面的happens-before的第二条规则就很容易的解释通了。


### 总结

本篇文章主要介绍了Java内存模型主要描述的问题以及解决多线程环境下的问题思路,我们了解和学习了什么是内存一致性错误,happens-before的规则,数据竞争的内容,掌握了这些知识将非常有助于我们深入到Java并发编程的世界,希望大家可以有所收获。

你可能感兴趣的:(Java)