聊聊并发:(六)指令重排序与happens-before原则分析

前言

在前几章中,我们介绍了线程安全相关的关键字synchronized与volatile的使用,在介绍其原理的过程中,我们提及到了Java中的“happen-before”规则,这个规则对于我们理解Java多线程开发非常的有用,本文我们就来了解一下什么是happen-before规则。

什么是happen-before?

在上一篇我们介绍volatile实现机制的时候,在指令重排序的部分,我们提及到了happen-before原则,happen-before即先行发生,是Java内存模型中定义的两项操作之间的偏序关系,如果说操作A先行发生于操作B,其实就是说发生操作B之前,操作A产生的影响能被操作B观察到,“影响”包括修改了内存中的共享变量的值、发送了消息、调用了方法等。

这个原则非常的重要,它是判断数据是否存在竞争、线程是否安全的主要依据,依靠这个原则,我们可以通过几条规则解决并发环境下两个操作之间是否可能存在冲突的所有问题。

我们举一个小例子来看一下:

/**
 * Created by xuanguangyao on 2018/8/20.
 */
public class HappenBeforeDemo {

    //该操作在线程1执行
    public static int i = 1;

    //该操作在线程2执行
    public static int j = i;

    //该操作在线程3执行
    public static int i = 2;

}

上面的例子中,我们声明了两个静态类变量,i与j,然后在三条线程中操作这两个变量,假设线程1中操作“i=1”先行发生于线程2的操作“j=i”,那么可以确定在线程2的操作执行后,变量j的值一定等于1,得出这个结论的依据有两个:

一是根据先行发生原则,“i=1”的结果可以被观察到;

二是线程3还没启动,线程1操作结束之后没有线程会修改变量i的值。

现在再来考虑线程3,我们依然保持线程1与线程2之间的先行发生关系,而线程3出现在线程1与线程2的操作之间,但是线程3与线程2没有先行发生关系,那么j的值是多少呢?

其实是不确定的,1和2都有可能,因为线程3对变量i的影响可能会被线程2观察到,也可能不会,这时候线程2就存在读取到过期数据的风险,不具备多线程安全性。

那什么情况下是多线程安全的呢?

当多个线程访问同一个对象时,如果不用考虑这些线程在运行时环境下的调度和交替运行,也不需要进行额外的同步,或者在调用方进行任何其他的协调操作,调用这个对象的行为都可以获取正确的结果,那这个对象是线程安全的。

happen-before规则

下面是Java内存模型中的八条可保证happen-before的规则,它们无需任何同步器协助就已经存在,可以在编码中直接使用。如果两个操作之间的关系不在此列,并且无法从下列规则推导出来的话,它们就没有顺序性保障,虚拟机可以对它们进行随机地重排序。

  • 程序次序规则:在一个线程内,按照程序代码顺序,书写在前面的操作先行发生于书写在后面的操作。准确地说,应该是控制流顺序而不是程序代码顺序,因为要考虑分支、循环等结构。
  • 管程锁定:一个unlock操作先行发生于后面对同一个锁的lock操作。这里必须强调的是同一个锁,而“后面”是指时间上的先后顺序。
  • volatile变量规则:对一个volatile变量的写操作先行发生于后面对这个变量的读操作,这里的“后面”同样是指时间上的先后顺序。
  • 线程启动规则:线程中的所有操作都先行发生于对此线程的终止检测,我们可以通过Thread.join()方法结束、Thread.isAlive()的返回值等手段检测到线程已经终止执行。
  • 线程中断规则:对线程interrupt()方法的调用先行发生于被中断线程的代码检测到中断事件的发生,可以通过Thread.interrupt()方法检测到是否有中断发生。
  • 对象终结原则:一个对象的初始化完成(构造函数执行结束)先行发生于它的finalize()方法的开始。
  • 传递性:如果操作A先行发生于操作B,操作B先行发生于操作C,那就可以得出操作A先行发生于操作C的结论。

Java中不需要任何同步手段保障就能成立的先行发生规则就是上面这些了,下面我们来看一个例子,如果使用这些规则去判定操作间是否具备顺序性,对于读写共享变量的操作来说,就是线程是否安全。

public class HappenBeforeDemo {

    private int value = 0;

    public void setValue(int value) {
        this.value = value;
    }

    public int getValue() {
        return value;
    }
}    

在上面的例子中,假设存在线程A和B,线程A先(是指时间上)调用了setValue(1),然后线程B调用了同一个对象的getValue(),那么线程B收到的返回值是什么呢?

我们依次分析一下先行发生原则的各项规则,由于两个方法分别由线程A和线程B调用,不在一个线程中,所以第一条程序次序规则不适用;

由于没有同步块,自然就不会发生lock和unlock操作,所以管程锁定规则不适用;

由于value变量没有被volatile关键字修饰,所以volatile变量规则不适用;

后面的线程启动、终止、中断规则和对象终结规则也和这里完全没有关系。

因为没有一个适用的先行发生规则,所以最后一条传递性也无从谈起,因此我们可以判定尽管线程A在操作时间上先于线程B,但是无法确定线程B中getValue()方法的返回结果,换句话说,这里面的操作不是线程安全的。

那么如何解决这个问题呢?我们可以在get/set方法前面加入synchronized关键字,这样可以应用管程锁定规则;或者把value定义为volatile变量,这样可以应用volatile变量规则来实现先行发生原则。

通过上面的例子,我们可以得到结论:一个操作“时间上的先发生”不代表这个操作会是“先行发生”,那如果一个操作“先行发生”是否就能推导出这个操作必定是“时间上的先发生”呢?事实上,也是不可以的,因为CPU指令重排序的存在,我们来看一个小例子:

int i = 1;

int j = 2;

上面的例子中,两行代码在同一个线程中执行,根据程序次序规则,第一行代码应该先于第二行执行,但是由于两行代码的执行结果没有前后依赖关系,因此处理器可以对其进行重排序。

结语

我们总结一下,时间先后顺序与先行发生原则之间基本没有太大的关系,所以我们衡量并发安全问题的时候不要受到时间顺序的干扰,一切以先行发生原则为准。

本文参考:《深入理解Java虚拟机》

更多Java干货文章请关注我的个人微信公众号:老宣与你聊Java
这里写图片描述

你可能感兴趣的:(Java多线程开发,聊聊Java并发)