初识 JAVA 内存模型:结合硬件内存架构理解 JAVA 内存模型

写在前面

JAVA 内存模型是我看过很多遍,也忘了很多遍,每隔一段时间就会感到模糊的一部分内容。直到我阅读了 Jakob Jenkov 大神这篇对初学者非常友好的 Java Memory Model。我对其做了翻译,一方面加深理解,便于日后复习,也希望能够帮到更多需要的伙伴。【非逐字翻译,英文不错的同学建议阅读原文】
相比之前读过的大部分书籍和博客,这篇文章没有在一开始就引入过多的细节。而是先以一个宏观的视角切入,让读者先对 JAVA 内存模型有一个清晰的上层认识。再结合硬件内存架构模型,讲述了 JAVA 内存模型与硬件内存架构模型的关系与区别(初学者非常容易混淆 JAVA 内存模型和硬件内存模型)。这两点恰恰是我在学习 JAVA 内存模型的过程中,最大的痛点。

为什么学习 JAVA 内存模型

宽泛的说学习 JAVA 内存模型能让我们对 JAVA 程序的运行有一个更清晰的认识。更具体的,通过 JAVA 内存模型,我们可以了解到不同线程对于共享的变量,是如何读写的。以及如何在必要的时候,以同步的方式(syncronize)访问共享变量。这对我们理解 JAVA 多线程编程,以及写出正确的多线程并行程序十分重要。

JAVA 内存模型

JAVA 内存模型是 JVM 内部的一种内存模型,逻辑上可以主要分为线程栈(Thread Stack)和堆(Heap)两部分,如下图所示:


Java Memory Model

线程栈(Thread Stack)

每个线程都拥有自己的线程栈,线程栈里面存放着相应线程执行方法(Method)时涉及的所有本地变量(local variables)。每个线程只能访问自己的线程栈,线程栈之间是互相不可见的。
所有基本类型(boolean, byte, short, char, int, long, float, double)的本地变量是直接存储于线程栈内的,线程间均不可见。一个线程可能会通过拷贝的方式,把自己线程栈内的基础类型变量提供给另一个线程。但一定无法直接提供该变量本身。
所有对象类型的变量,栈中存储的都只是一个引用,对象本身存储于堆中。

堆(heap)

JAVA 应用中,所有的对象都是存储在堆中的——包括对象版本的基础类型(Byte, Integer, Long 等等)。可以总结为下图:


Java Memory Model 2
  1. 基础类型的本地变量是直接存储在线程栈中的。
  2. 非基础类型的本地变量(即对象引用变量),线程栈中存储的只是一个引用,实际的对象是存储在堆中的。
  3. 堆中对象可能会包含成员变量,这些成员变量无论是基础类型变量,还是对象引用类型的变量,都会随对象存储在堆中。
  4. 静态变量,随其所属类一并存储于堆中。

举个例子

为了展示变量在线程栈和堆中的存储情况,我们参照图片 Java Memory Model 2,写了如下代码:

public class Main{
  public static void main(String[] args){
    Thread thread1 = new Thread(new MyRunnable());
    Thread thread2 = new Thread(new MyRunnable());
    thread1.start();
    thread2.start();
  }
}
public class MyRunnable implements Runnable {

    public void run() {
        methodOne();
    }

    public void methodOne() {
        int localVariable1 = 45;

        MySharedObject localVariable2 =
            MySharedObject.sharedInstance;

        //... do more with local variables.

        methodTwo();
    }

    public void methodTwo() {
        Integer localVariable1 = new Integer(99);

        //... do more with local variable.
    }
}
public class MySharedObject {

    //static variable pointing to instance of MySharedObject

    public static final MySharedObject sharedInstance =
        new MySharedObject();


    //member variables pointing to two objects on the heap

    public Integer object2 = new Integer(22);
    public Integer object4 = new Integer(44);

    public long member1 = 12345;
    public long member2 = 67890;
}

代码中,两个线程都会执行 MyRunnable 类的 run 方法,run 方法调用 methodOne,methodOne 调用 methodTwo。最终各变量的存储和关系可以描述为下图:


Java Memory Model 3

结合代码和这张图,我们应该能清晰了解到 JAVA 代码中各变量,实际运行时 JAVA 内存模型中的存储位置了。

硬件内存架构

开头我们说过,JAVA 内存模型只是 JVM 内部的一种内存模型。它和我们熟悉的硬件内存架构模型有什么关系?又是如何一起工作的呢?
我们先了解一下硬件内存架构,如下图所示:


Hardware Memory Architecture 1

现在常见的电脑都是多 CPU 或者多核的,这也是为什么我们的电脑可以实际支撑真实的多线程并行工作。在这样的电脑上执行多线程并行的 JAVA 程序时,不同的线程是有可能运行在不同的 CPU 上的。
每个 CPU 都有一组寄存器(CPU Registers)—— CPU 内部的内存。由于寄存器比主存(Main Memory)更快,CPU在操作存储于寄存器的数据时,会比操作主存数据快的多。
现在的 CPU 都还通常会有一个 CPU 缓存层(CPU Cache Memory Layer)。操作缓存层的速度介于寄存器和主存之间。(注:有的 CPU 也会设计多级缓存,比如 Cache Memory Layer1,Cache Memory Layer2 等,了解即可,不影响我们此处对 CPU 缓存的理解)
计算机都会有一个主存(Main Memory)。所有 CPU 都可以访问它。
通常来说,CPU 把需要的部分数据从主存拷贝到缓存,缓存中的部分数据会被拷贝到寄存器,然后基于寄存器内的数据完成计算,最终将结果逐级会写到主存中。(在某个恰当的时机将寄存器的数据写回缓存,然后再在某个恰当的时机把缓存的数据写回主存,比如我们需要释放一部分缓存在存储我们此时需要用到的其他数据)。

JAVA 内存模型和硬件内存架构的关系

硬件内存架构并不按照堆,栈区分。实际上,JAVA 内存模型中堆和栈存储的数据,都会存储到硬件内存的主存上。而在某些时间点,部分的堆/栈数据也会出现在 CPU 缓存,或者寄存器上。如下图所示:


Java Memory Model & Hardware Memory Architecture

一台电脑有多个CPU,多个寄存器,多个缓存。而我们的 JAVA 对象/变量可能存储在这么多不同的位置,这就直接带来了两个问题:

  1. 共享变量(shared variables)在线程间的可见性问题
  2. 共享变量在多线程读写时的竞争条件(race condition)问题

共享变量的可见性问题

写 JAVA 代码时我们知道,在没有正确使用 volatile 关键字或者 synchronization 时,一个共享变量被线程A的修改,对线程B而言可能是不可见的。
这个比较好理解,两个运行于不同CPU的线程,分别从主存拷贝同一个变量到各自CPU的缓存甚至是寄存器中,由于他们后续一段时间对该变量的读写都仅仅发生在各自的缓存或寄存器内的拷贝上,这些修改对不同线程间是不可见的。如下图所示:

Visibility of Shared Objects 1

通过使用 volatile 关键字可以解决该问题。经过 volatile 修饰的变量,每次都会直接从主存读取,并且保证每一次的修改都会回写到主存上。

竞争条件(race condition)

当多个线程想要同时修改同一个共享变量的时候,就会产生竞争条件问题。
假设我们有两个执行在不同CPU的线程:线程A和线程B。他们都读取了主存中的一个共享变量 count = 1。然后分别在各自 CPU 缓存内对其做了 +1 操作。原本我们期望的计算结果是 count + 1 + 1 = 3。但由于这两次 +1 操作在不同的 CPU 缓存内同时进行,最终线程A和B将自己计算的结果回写到主存时,结果为:count + 1 = 2。如下图所示:


Race Condition.png

该问题可以通过同步化来处理——保证一段代码,同一时间,只能有一个线程执行。JAVA 中同步化操作通过 synchronized 关键字实现。

你可能感兴趣的:(初识 JAVA 内存模型:结合硬件内存架构理解 JAVA 内存模型)