(四) Java多线程内存模型

Java多线程目录

一 背景介绍

1 并发编程有两个关键问题需要处理

1.1 通信

通信是指线程之间的信息交换,在命令式编程中有两种方式。

  • 共享内存
    线程之间共享程序的公共状态,通过读/写内存中的公共状态进行隐式同信。
  • 消息传递
    线程之间没有公共状态,必须通过消息来进行通信

1.2 同步

同步是指用于控制不同的线程并发执行的顺序的一种方式。共享内存并发同步是显示指定的例如synchronized,程序员必须指定某个方法或者代码线程之间互斥执行。消息传递由于消息接受必定发生在消息发送之后,所以消息传递的同步是隐式的不需要程序员指定。

1.3 总结

Java的并发编程采用的是内存共享模型,通信方式都是隐式的(不是真正的相互通信),但通信过程是透明的,可由程序员自己控制,也就是控制同步的方式。

2 Java线程内存模型的抽象结构

Java线程内存模型

了解JVM内存结构的可以知道,主内存也就是共享内存,JVM中线程间共享的数据内存一般都存放在堆中,这里包含类的对象,静态域,数组等。
从上图中可以看出Java内存模型底层由JVM控制,JVM决定了共享的变量何时对另一个线程可见。每个线程都有一个主内存的副本,我们在线程A中修改的数据就是修改这个本地内存数据,JVM会在一个合适的时机将这个改变写入到主内存,再读入到另一个线程B的线程本地内存中,这样就达到了线程见通信的目的。
注意:线程的本地内存是个抽象的概念 ,它包含了很多东西, 你可以理解为一个多线程读写主内存的一个过程。
举例

public class ThreadUser {
    private int id;
}


public class ThreadOne extends Thread {
    private ThreadUser user;

    public ThreadOne(ThreadUser user) {
        this.user = user;
    }

    @Override
    public void run() {
        super.run();
        user.setId(user.getId()+1);
    }

    public static void main(String[] args) {
        ThreadUser user = new ThreadUser();  //user共享的数据
        user.setId(1);
        ThreadOne one = new ThreadOne(user); //新的线程
        one.start();

        try {
            Thread.sleep(1000);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
        System.out.println(user.getId()); //取出user的新值
    }
}

从上面例子中我们可以分析,里面有两个线程,主线程main, 子线程ThreadOne,主要步骤:

  1. main线程创建ThreadUser类对象,这个类对象是在堆内存中的,是线程共享的。
  2. main线程设置ThreadUser对象ID为1, 设置之后jvm会在一个合适的时机将这个改变输入到主内存中去。
  3. 创建ThreadOne对象,进行多线程操作,start函数执行,ThreadUser类的共享对象就会复制一份进入ThreadOne线程,ThreadOne线程对复制的ThreadUser对象ID进行了改变为2,后JVM回将这个改变刷入到主内存中。
  4. main线程读取,就是从主线程读取到本地内存,再取出ThreadUser对象的ID,这时main线程就可以得到ThreadOne线程中设置的2.

3 线程安全问题

从上文中可以看到Java命令操作数据都是在内存上操作,上面的例子比较简单所以不会出现线程安全问题,当多个线程同时操作一个ThreadUser对象的时候,就会发生线程安全问题。

3.1 线程安全问题的产生

线程安全问题就是在多个线程同时操作一个变量的时候,线程对主内存的读写并没有按照我们的预期执行。例如两个线程同时操作ThreadUser的ID,如果两个线程同时读取的ThreadUser对象中的ID的值为1,
但在两个线程中同时执行user.setId(user.getId()+1) 操作时user的id 最后都会为2,这时连个两个线程都会将改变的本地内存变量刷入到主内存,则主内存user对象的id则为2,但是我们进行了两次相加,本该为3的,这就是线程的安全。


多线程数据安全

如图:多线程的执行顺序一般我们无法控制,我们想的是连个线程一个加1一个加2这样我们就能得到4,但结果却得到了3或者2还有4。这里线程A和线程B执行的顺序有三种可能

  1. 正常执行,线程A执行完刷入内存后线程B执行没有错误。
  2. 结果为3,线程A和线程B同时读取了a=1,都进行了相加操作后,线程B结果刷入主内存,后线程A结果又刷入主内存,线程A对线程B结果进行了覆盖。
  3. 同结果3,是线程B对线程A的结果进行了覆盖。

4 顺序一致性

如上文所示,数据为正确同步,就会存在数据竞争,执行的顺序与我们构想的顺序不一致,这就会造成各种各样的问题。我们需要的多线程执行是应该具有顺序一致性的,这样我们的程序才会正确执行。Java使用了各种各样的同步方式来实现这个顺序一致性,如volatile synchronized final关键字等。

4.1 顺序一致性的理解

顺序一致性内存模型

如图顺序一致性内存模型中有一个全局内存,Java中就是我们的共享变量,内存通过每次选择一个线程来进行读写顺序操作,来保证共享变量的正确性。
Java代码例子,使用synchronized来实现。

public class ThreadOne implements Runnable{

    private Object lock = new Object();
    
    public void run() {
        synchronized (lock) {
            //TODO
        }
    }
}

如上述例子,我们对lock对象实例加了锁,当多线程同时访问一个ThreadOne对象的时候,每次只能有一个线程获得这个锁进行执行,后续synchronized关键字会详细介绍。

你可能感兴趣的:((四) Java多线程内存模型)