Java并发编程实战(2)- Java内存模型

本文主要描述了在Java并发编程中非常重要的Java内存模型以及Happens-Before规则。

概述

对于Java并发程序问题存在的各种问题,主要有3个根源:

  • 由缓存引发的可见性问题
  • 由线程切换引发的原子性问题
  • 由编译优化引发的有序性问题

为了解决可见性和有序性的问题,Java引入了Java内存模型,我们这篇文章来介绍一下它。

可见性问题和有序性问题由缓存和编译优化造成的, 那么最直接的方法就是禁用缓存和编译优化,这样做是可以解决问题的,但是程序的性能会下降到不能接受的程度。

合理的方案是按需禁用缓存和编译优化, 所谓“按需禁用”,就是指按照程序员的要求来禁用,来为程序员开放相应的方法。

什么是Java内存模型

Java内存模型是一个很复杂的规范,可以从不同的角度进行解读,站在程序员的角度,可以将其解决为它规范了JVM如何提供按需禁用缓存和编译优化的方法。

Java内存模型对应的规范是JSR-133,链接:http://www.cs.umd.edu/~pugh/java/memoryModel/jsr133.pdf.

Java内存模型和JVM的区别

  • Java内存模型定义了一套规范,它能让JVM按需禁用CPU缓存和编译优化,这套规范包括volatile、synchronized、final三个关键字和7个Happen-Before规则。
  • JVM内存模型是指程序计数器、JVM方法栈、本地方法栈、堆、方法区这5部分。

volatile关键字

volatile关键字的用途是禁用CPU缓存。

例如我们定义一个volatile变量volatile int x = 0;,它表达的是:编译器在对这个变量进行读写操作时,不能使用CPU缓存,而是从内存中直接操作。

我们来看下面的代码示例。

public class VolatileDemo {

    int x = 0;
    volatile boolean v = false;
    
    public void write() {
        x = 42;
        v = true;
    }
    
    public void read() {
        if (v == true) {
            System.out.println(String.format("x is %s", x));
        }
    }
}

如果对同一个VolatileDemo对象,有2个线程,一个调用write()方法,一个调用read()方法,那么当read()方法中v等于true时,x的值是多少?

在Java 1.5版本之前,x的值可能是0或者42, 在Java 1.5版本之后,x的值只能是42。

这是由于Happens-Before规则导致的。

Happens-Before规则

什么是Happens-Before规则?

Happens-Before规则表达的是前面一个操作的结果对后续操作是可见的。它约束了编译器的优化行为,保证其一定要遵守Happens-Before规则。

Happens-Before的语义本质是一种可见性,A Happens-Before B意味着A事件对B事件来说是可见的,无论A事件和B事件是否发生在同一个线程中。

Happens-Before规则有很多条,其中和程序员相关的有6条,我们来一一描述。

顺序性规则

在一个线程中,按照程序顺序,前面的操作Happens-Before后续的任意操作。

这条规则比较直观,符合单线程里面的思维:程序前面对某个变量的修改一定是对后续操作可见的。

volatile变量规则

对一个volatile变量的写操作,Happens-Before于后续对这个volatile变量的读操作。

传递性

如果A Happens-Before B,且B Happens-Before C,那么A Happens-Before C。

我们再看上面的示例代码:

  • x=42 Happens-Before 写变量 v=true,这是规则1。
  • 写变量 v=true Happens-Before 读变量 v=true,这是规则2。

然后根据传递性规则,我们可以得出x=42 Happens-Before 读变量 v=true。所以在示例代码中,在判断v==true时,x的值等于42。

synchronized规则

对一个锁的解锁要Happens-Before于后续对这个锁的加锁。

我们要首先了解什么是“管程”,管程是操作系统中的一个重要概念,一个管程是一个由过程、变量及数据结构等组成的一个集合,它由四个部分组成:1)管程名称,2)共享数据的说明,3)对数据进行操作的一组过程,4)对共享数据赋初值的语句。

在Java中,管程是通过synchronized关键字实现的。

我们对这个规则可以理解为:假设x的初始值是10,线程A获取锁,执行完代码,x的值会变为12,之后释放锁,接下来线程B获取锁,这时线程B看到的x,一定是12,不应该是10。

线程start()规则

主线程A启动子线程B,子线程B能够看到主线程在启动子线程B之前的操作。

我们来看下面的示例。

public class HappensBeforeDemo {

    private int x = 10;
    
    public void threadStartTest() {
        Thread t = new Thread(() -> {
            System.out.println(String.format("x is %s.",x));
        }
        );
        
        x = 20;
        
        t.start();
    }
    
    
    public static void main(String[] args) {
        HappensBeforeDemo demoObj = new HappensBeforeDemo();
        demoObj.threadStartTest();
        
    }
}

程序的输出结果如下。

x is 20.

线程join()规则

主线程A通过调用子线程的join()方法等待子线程结束,当子线程结束后,主线程能够看到子线程对共享变量的操作。

这个规则和线程start()规则类似,我们来看下面的示例代码。

public class HappensBeforeDemo {

    private int x = 10;
    
    
    public void threadJoinTest() throws InterruptedException {
        Thread t = new Thread(() -> {
            try {
                java.lang.Thread.sleep(3000);
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
            x = 30;
        }) ;
        
        t.start();
        t.join();
        System.out.println(String.format("x is %s.",x));
        
    }
    
    public static void main(String[] args) throws InterruptedException {
        HappensBeforeDemo demoObj = new HappensBeforeDemo();
        demoObj.threadJoinTest();
        
    }
}

程序的输出结果如下。

x is 30.

final规则

我们用final修饰变量时,就是告诉编译器,这个变量生而不变,可以尽情优化。

但是如果我们将变量设置成final,它的构造函数由于编译优化后的错误重排,还是可能会导致错误,例如我们之前谈到的单例模式的代码。

在Java 1.5之后,Java内存模型对final类型变量的重排进行了约束,只要我们提供的构造函数没有“逸出”,那么就不会有问题。

所谓“逸出”,就是指构造函数中使用了生命周期超过了该对象生命周期的变量。

参考资料

  • https://time.geekbang.org/column/article/84017
  • http://www.cs.umd.edu/~pugh/java/memoryModel/
  • http://www.cs.umd.edu/~pugh/java/memoryModel/jsr133.pdf
  • https://docs.oracle.com/javase/specs/jls/se15/html/jls-17.html
  • https://blog.csdn.net/javazejian/article/details/72772461

你可能感兴趣的:(Java并发编程实战(2)- Java内存模型)