Java并发编程:JMM (Java内存模型) 以及与volatile关键字详解

计算机系统的一致性

在现代计算机操作系统中,多任务处理几乎是一项必备的功能,因为嵌入了多核处理器,计算机系统真正做到了同一时间执行若干个任务,是名副其实的多核系统。在多核系统中,为了提升CPU与内存的交互效率,一般都设置了一层 “高速缓存区” 作为内存与处理器之间的缓冲,使得CPU在运算的过程中直接从高速缓存区读取数据,一定程度上解决了性能的问题。但是,这样也带来了一个新问题,就是“缓存一致性”的问题。比如,多核的情况下,每个处理器都有自己的缓存区,数据如何保持一致性。针对这个问题,现代的计算机系统引入多处理器的数据一致性的协议,包括MOSI、Synapse、Firely、DragonProtocol等。

当处理器通过高速缓存区与主内存发生交互时,对数据的读写必须遵循协议规定的标准,用一张关系图表示的话大概如下:


Java并发编程:JMM (Java内存模型) 以及与volatile关键字详解_第1张图片
缓存一致性.png

而Java的内存模型 (JMM) 可以说与硬件的一致性模型很相似,采用的是共享内存的线程通信机制。

Java内存模型

Java内存模型规定了所有的变量都存储在主内存中,每个线程拥有自己的工作内存,工作内存中保存了被该线程使用的变量的主内存副本拷贝,线程只能操作自己工作内存的变量副本,操作完变量后会更新到主内存,通过主内存来完成与其他线程间变量值的传递。此模型的交互关系如下图所示:


Java并发编程:JMM (Java内存模型) 以及与volatile关键字详解_第2张图片
Java内存模型.png

然而,Java的内存模型只是反映了虚拟机内部的线程处理机制,并不保证程序本身的并发安全性。

举一个例子,在程序中对一个共享变量做自增操作:

i++;

假设初始化的时候i=0,当跑到此程序时,线程首先从主内存读取i的值,然后复制到自己的工作内存,进行i++操作,最后将操作后的结果从工作内存复制到主内存中。如果是两个线程执行i++的程序,预期的结果是2。但真的是这样吗?答案是否定的。

假设线程1读取主内存的i=0,复制到自己的工作内存,在进行i++的操作后还没来得及更新到主内存,这时线程2也读取i=0,做了同样的操作,那么最终得到的结果为1,而不是2。

这是典型的关于多线程并发安全例子,也是Java并发编程中最值得探讨的话题之一,一般来说,处理这种问题有两种手段:

  • 加锁,比如同步代码块的方式。保证同一时间只能有一个线程能执行i++这条程序。
  • 利用线程间的通信,比如使用对象的wait和notify方法来。

因为本文主要是探究 JMM 和 volatile 关键字的知识,具体怎么实现并发处理就不做深入探讨了,改天看看抽个时间再写篇博文专门讲解好了。

内存模型的3个重要特征

初步了解完什么是JMM后,我们来进一步了解它的重要特征。值得说明的是,在Java多线程开发中,遵循着三个基本特性,分别是原子性、可见性和有序性,而Java的内存模型正是围绕着在并发过程中如何处理这三个特征建立的。

原子性

原子性是指操作是原子性的,不可中断的。举个例子:

String s="abc";

这个操作是直接赋值,是原子性操作。而类似下面这段代码就不是原子性了:

i++;

当执行i++时,需要先获取i的值,然后再执行i+1,相当于包含了两个操作,所以不是原子性。

可见性

可见性是指共享数据的时候,一个线程修改了数据,其他线程知道数据被修改,会重新读取最新的主存的数据。就像前面说的两个线程处理i++的问题,线程1改完后没有更新到主内存,所以线程2是不知道的。

有序性

是指代码执行的有序性,对于一个线程执行的代码,我们可以认为代码是依次执行的,但并发中可能就会出现乱序,因为代码有可能发生指令重排序(Instruction Reorder),重排后的指令与原指令的顺序未必一致。

指令重排序

编译器能够自由的以优化的名义去改变指令顺序。在特定的环境下,处理器可能会次序颠倒的执行指令。是为指令的重排序,尤其是并发的情况下。

java提供了volatile和synchronized来保证线程之间操作的有序性。volatile含有禁止指令重排序的语义(即它的第二个语义),synchronized规定一个变量在同一时刻只允许一条线程对其lock操作,也就是说同一个锁的两个同步块只能串行进入。禁止了指令的重排序。

volatile关键字

说到了volatile,我们就有必要了解一下这个关键字是做什么的。

准确来说,volatile是java提供的轻量的同步机制。它有两个特性:

  1. 保证修饰的变量对所有线程的可见性。
  2. 禁止指令的重排序优化。

保证可见性和防止指令重排

简单写段代码说明一下:

public class VolatileDemo {
    
    private static boolean isReady;
    private static int number;
    
    private static class ReaderThread extends Thread{
        @Override
        public void run() {
            while (!isReady);
            System.out.println("number = "+number);
        }
    }

    public static void main(String[] args) {
        new ReaderThread().start();
        try {
            Thread.sleep(1000);
            number = 42;
            isReady = true;
            Thread.sleep(1000);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
    }
}

在上面的代码中,ReaderThread只有在isReady 为 true 时才会打印出 number 的值,然而,真实的情况有可能是打印不出来(可能性比较小,但还是有),因为线程ReaderThread线程无法看到主线程中对isReady的修改,导致while循环永远无法退出,同时,因为有可能发生指令重排,导致下面的代码不能按顺序执行:

number = 42;
isReady = true;

也就是能打印的话,number值可能是0,不是42。如果在变量加上volatile关键字,告诉Java虚拟机这两个变量可能会被不同的线程修改,那么就可以防止上述两种不正常的情况的发生。

不能保证原子性

volatile能保证可见性和有序性,但无法保证原子性,比如下面的例子:

public class VolatileDemo {

    public static volatile int i = 0;

    public static void increase() {
        i++;
    }

    public static void main(String[] args) throws InterruptedException {
        VolatileDemo test = new VolatileDemo();
        for (int i = 0; i < 10; i++) {
            new Thread(() -> {
                for (int j = 0; j < 1000; j++)
                    test.increase();
            }).start();
        }      
        Thread.sleep(1000);
        System.out.println(test.i);
    }
}

正常情况下,我们期望上面的main函数执行完后输出的结果是10000,但你会发现,结果总是会小于10000,因为increase()方法中的i++操作不是原子性的,分成了读和写两个操作。假设当线程1读取了 i 的值,还没有修改,线程2这时也进行了读取。然后,线程1修改完了,通知线程2重新读取 i 的值,可这时它不需要读取 i,它仍执行写操作,然后赋值给主线程,这时数据就会出现问题。

所以,一般针对共享变量的读写操作,还是需要用锁来保证结果,例如加上 synchronized关键字。

参考:

《Java高并发程序设计》

《深入理解Java虚拟机》

你可能感兴趣的:(Java并发编程:JMM (Java内存模型) 以及与volatile关键字详解)