并发——在操作系统中,是指一个时间段中有几个程序都处于已启动运行到运行完毕之间,且这几个程序都是在同一个处理机上运行,但任一个时刻点上只有一个程序在处理机上运行——源自百度百科
在并发编程中,我们需要处理两个关键问题:线程之间如何通信和线程之间如何同步,后续篇章将围绕这两个问题进行介绍。
本文主要介绍java的通信机制,刚介绍常见通信机制主要包括以下两种方式:
Java线程之间的通信由Java内存模型(本文简称为JMM)控制,JMM决定一个线程对共享变量的写入何时对另一个线程可见。
JMM(Java Memory Model)是JVM规范中定义的一种Java内存模型,它的目的是屏蔽掉各种硬件和操作系统的内存访问差异,以实现让Java程序在各种平台上到能达到一致的内存访问效果。
Java内存模型的主要定义程序中各个变量的访问规则,即在虚拟机中将变量存储到内存和从内存中取出变量这样底层细节。首先简单说明几个常用名称定义:变量:这里指包括了实例字段、静态字段和构成数组对象的元素,但是不包括局部变量与方法参数,后者是线程私有的,不会被共享。
线程、主内存和工作内存之间交互关系
线程、主内存和工作内存的交互关系如上图所示,和CPU-缓存-内存很类似。
不同线程之间无法直接访问对方工作内存中的变量,线程间变量值的传递均需要在主内存来完成。
最后注意,为了获得较好的执行性能,Java内存模型并没有限制执行引擎使用处理器的寄存器或者高速缓存来提升指令执行速度,也没有限制编译器对指令进行重排序。也就是说,在java内存模型中,也会存在缓存一致性问题和指令重排序的问题。
关于主内存与工作内存之间的具体交互协议,即一个变量如何从主内存拷贝到工作内存、如何从工作内存同步到主内存之间的实现细节,Java内存模型定义了以下八种操作来完成:
所以变量读写包含以下几个步骤:
注意,Java内存模型只要求上述操作必须按顺序执行,而没有保证必须是连续执行。也就是read和load之间,store和write之间是可以插入其他指令的。
除了定义以上8中原子操作,Java内存模型还规定了上述8种基本操作在执行时必须满足一定的操作规则,例如如不允许read和load单独出现(即不允许一个变量从主内存中读取但工作内存不接受),不允许store和write单独出现(即不允许从工作内存中发起了回写单主内存不接受),这里不一一列举,详细网上搜索即可。
Java内存模型还定义了volatile型变量的特殊规则(下一节介绍),以上三种规定共同确定了Java中哪些内存访问操作是安全的即:
8种原子操作+操作规则+volatile规定=Java中哪些内存访问操作是安全的
当一个变量被定义为volatile后,将具备两种特性:
4.1 volatile可见性
可见性是指当多个线程访问同一个变量时,一个线程修改了这个变量的值,其他线程能够立即看得到修改的值。
普通的共享变量不能保证可见性,因为普通共享变量被修改之后,什么时候被写入主存是不确定的,当其他线程去读取时,此时内存中可能还是原来的旧值,因此无法保证可见性。
但是,需要注意的是volatile变量只保证可见性,但是java里面的运算并非全部都是原子操作例如++操作,这样同样导致volatile修饰变量java运算不安全。
一般不符合以下两条规则的运算场景中,我们需要通过加锁(synchronized或并发包中的锁)保证变量原子性:
运算结果并不依赖变量的当前值,或者能够确保只有单一的线程修改变量的值(比如++操作不符合依赖当前值)
变量不需要与其他状态变量共同参与不变约束
常见的volatile修饰变量的场景是用来作为开关控制并发:
4.2 禁止指令重排序
重排序:是指“编译器和处理器”为了提高性能,而在程序执行时会对程序进行的重排序。大致可以分为以下三类:
指令级并行重排序,该优化主要是为了让程序发挥现代处理器的指令级并行执行能力,前提是这些语句不存在数据依赖。
内存系统重排序,主要发生在处理器读写缓冲区,读写过程看起来是无序的,但最终结果是有序的
从Java源代码到最终实际执行的指令序列,会经过下面三种重排序:
以上重排序可能会导致多线程中出现内存可见性问题,针对编译器重排序JMM的编译器重排序规则会禁止特定类型的编译器重排序。
而对于后两种重排序,JMM的处理器重排序规则会要求java编译器在生成指令序列时,插入特定类型的内存屏障(memory barriers,intel称之为memory fence)指令,通过内存屏障指令来禁止特定类型的处理器重排序(不是所有的处理器重排序都要禁止)。
下面我们看下jvm如何实现volatile禁止指令重排序的:
volatile变量写操作,jvm会向处理器发送一条Lock前缀命令,将变量所在的缓存行系会到系统内存。其他处理器通过嗅探总线上传播的数据检测自己的数据是否过期,如果发现过期会置为无效,再次使用时会从系统内存获取
Lock前缀命令禁止该指令与之前和之后的读和写指令重排序。
最后,关于volatile禁止重排序几点使用说明:
CAS同时具有volatile读和写内存的语义,java的CAS使用现代处理器提供的高效级别的原子指令,这些原子指令以原子方式对内存执行读-改-写操作,这是多处理器中实现同步的关键。
总的来说JMM内存模型是围绕着在并发过程中如何处理原子性、可见性和有序性三个特征来建立的。下面就三个特征分别说明:
5.1 原子性
原子性:即一个操作或者多个操作 要么全部执行并且执行的过程不会被任何因素打断,要么就都不执行。
java内存模型的read、load、assign、use、store和write六个操作直接保证原子性,我们可以任务基本数据类型访问读写是具有原子性(特殊说明long double64位操作根据jvm实现有关)。
如果场景中需要大范围的原子性保证,java内存模型提供了lock和unlock操作来满足,对应到java代码关键字即是——synchronized。
5.2 可见性
可见性是指当多个线程访问同一个变量时,一个线程修改了这个变量的值,其他线程能够立即看得到修改的值。
除了上面介绍的volatile外,java还提供了两个关键字实现可见性,synchronized和final。final的可见性:是指被final修饰的字段在构造器中一旦完成,那么在其他线程就可以看见final字段值synchronized可见性:是指对一个变量执行unlock操作之前,必须先把次变量同步会主内存这条操作规则限制
5.3 有序性
有序性:即程序执行的顺序按照代码的先后顺序执行。
java中天然有序性可以总结为一句话:如果在本线程内观察,所有的操作都是有序的;如果在一个线程中观察另外一个线程,所有操作都是无序的。前半句是指“线程内表现为串行语义”,后半句表示“指令重排”和“工作内存与主内存同步延迟”现象。
java提供了volatile和synchronized两个关键字来保证线程之间操作的有序性,这里synchronized则是有“同一时刻只允许一条线程对其进行lock操作”这条操作规定获取的,这个规则决定了同一个锁的两个同步块只能串行进入。
最后,可以发现synchronized关键字可以同时解决上述三个问题,当然这个需要付出代价就是性能问题。
————END————
看到网上疯传的《阿里Java架构师成长之路》,网友瞬间沸腾了
Java程序员备战“金九银十”必备的面试技巧(附阿里Java岗面试题)