计算机系统的一致性
在现代计算机操作系统中,多任务处理几乎是一项必备的功能,因为嵌入了多核处理器,计算机系统真正做到了同一时间执行若干个任务,是名副其实的多核系统。在多核系统中,为了提升CPU与内存的交互效率,一般都设置了一层 “高速缓存区” 作为内存与处理器之间的缓冲,使得CPU在运算的过程中直接从高速缓存区读取数据,一定程度上解决了性能的问题。但是,这样也带来了一个新问题,就是“缓存一致性”的问题。比如,多核的情况下,每个处理器都有自己的缓存区,数据如何保持一致性。针对这个问题,现代的计算机系统引入多处理器的数据一致性的协议,包括MOSI、Synapse、Firely、DragonProtocol等。
当处理器通过高速缓存区与主内存发生交互时,对数据的读写必须遵循协议规定的标准,用一张关系图表示的话大概如下:
而Java的内存模型 (JMM) 可以说与硬件的一致性模型很相似,采用的是共享内存的线程通信机制。Java内存模型
Java内存模型规定了所有的变量都存储在主内存中,每个线程拥有自己的工作内存,工作内存中保存了被该线程使用的变量的主内存副本拷贝,线程只能操作自己工作内存的变量副本,操作完变量后会更新到主内存,通过主内存来完成与其他线程间变量值的传递。此模型的交互关系如下图所示:
然而,Java的内存模型只是反映了虚拟机内部的线程处理机制,并不保证程序本身的并发安全性。举一个例子,在程序中对一个共享变量做自增操作:
i++;
假设初始化的时候i=0,当跑到此程序时,线程首先从主内存读取i的值,然后复制到自己的工作内存,进行i++操作,最后将操作后的结果从工作内存复制到主内存中。如果是两个线程执行i++的程序,预期的结果是2。但真的是这样吗?答案是否定的。
假设线程1读取主内存的i=0,复制到自己的工作内存,在进行i++的操作后还没来得及更新到主内存,这时线程2也读取i=0,做了同样的操作,那么最终得到的结果为1,而不是2。
这是典型的关于多线程并发安全例子,也是Java并发编程中最值得探讨的话题之一,一般来说,处理这种问题有两种手段:
加锁,比如同步代码块的方式。保证同一时间只能有一个线程能执行i++这条程序。
利用线程间的通信,比如使用对象的wait和notify方法来。
因为本文主要是探究 JMM 和 volatile 关键字的知识,具体怎么实现并发处理就不做深入探讨了,改天看看抽个时间再写篇博文专门讲解好了。
内存模型的3个重要特征
初步了解完什么是JMM后,我们来进一步了解它的重要特征。值得说明的是,在Java多线程开发中,遵循着三个基本特性,分别是原子性、可见性和有序性,而Java的内存模型正是围绕着在并发过程中如何处理这三个特征建立的。
原子性
原子性是指操作是原子性的,不可中断的。举个例子:
String s="abc";
这个操作是直接赋值,是原子性操作。而类似下面这段代码就不是原子性了:
i++;当执行i++时,需要先获取i的值,然后再执行i+1,相当于包含了两个操作,所以不是原子性。
可见性
可见性是指共享数据的时候,一个线程修改了数据,其他线程知道数据被修改,会重新读取最新的主存的数据。就像前面说的两个线程处理i++的问题,线程1改完后没有更新到主内存,所以线程2是不知道的。
有序性
是指代码执行的有序性,对于一个线程执行的代码,我们可以认为代码是依次执行的,但并发中可能就会出现乱序,因为代码有可能发生指令重排序(Instruction Reorder),重排后的指令与原指令的顺序未必一致。
指令重排序
编译器能够自由的以优化的名义去改变指令顺序。在特定的环境下,处理器可能会次序颠倒的执行指令。是为指令的重排序,尤其是并发的情况下。
java提供了volatile和synchronized来保证线程之间操作的有序性。volatile含有禁止指令重排序的语义(即它的第二个语义),synchronized规定一个变量在同一时刻只允许一条线程对其lock操作,也就是说同一个锁的两个同步块只能串行进入。禁止了指令的重排序。
volatile关键字
说到了volatile,我们就有必要了解一下这个关键字是做什么的。
准确来说,volatile是java提供的轻量的同步机制。它有两个特性:
保证修饰的变量对所有线程的可见性。
禁止指令的重排序优化。
保证可见性和防止指令重排
简单写段代码说明一下:
publicclassVolatileDemo{privatestaticbooleanisReady;privatestaticintnumber;privatestaticclassReaderThreadextendsThread{@Overridepublicvoidrun(){while(!isReady); System.out.println("number = "+number); } }publicstaticvoidmain(String[] args){newReaderThread().start();try{ Thread.sleep(1000); number =42; isReady =true; Thread.sleep(1000); }catch(InterruptedException e) { e.printStackTrace(); } }}
在上面的代码中,ReaderThread只有在isReady 为 true 时才会打印出 number 的值,然而,真实的情况有可能是打印不出来(可能性比较小,但还是有),因为线程ReaderThread线程无法看到主线程中对isReady的修改,导致while循环永远无法退出,同时,因为有可能发生指令重排,导致下面的代码不能按顺序执行:
number=42;isReady=true;
也就是能打印的话,number值可能是0,不是42。如果在变量加上volatile关键字,告诉Java虚拟机这两个变量可能会被不同的线程修改,那么就可以防止上述两种不正常的情况的发生。
不能保证原子性
volatile能保证可见性和有序性,但无法保证原子性,比如下面的例子:
publicclassVolatileDemo{publicstaticvolatileinti =0;publicstaticvoidincrease(){ i++; }publicstaticvoidmain(String[] args) throws InterruptedException{ VolatileDemo test =newVolatileDemo();for(inti =0; i <10; i++) {newThread(() -> {for(intj =0; j <1000; j++) test.increase(); }).start(); } Thread.sleep(1000); System.out.println(test.i); }}
正常情况下,我们期望上面的main函数执行完后输出的结果是10000,但你会发现,结果总是会小于10000,因为increase()方法中的i++操作不是原子性的,分成了读和写两个操作。假设当线程1读取了 i 的值,还没有修改,线程2这时也进行了读取。然后,线程1修改完了,通知线程2重新读取 i 的值,可这时它不需要读取 i,它仍执行写操作,然后赋值给主线程,这时数据就会出现问题。
所以,一般针对共享变量的读写操作,还是需要用锁来保证结果,例如加上 synchronized关键字。
在这里我为java的同道者准备了以上相关资料,有需要的可以加群:810589193,点击链接加入群聊【Java架构学习交流群】:https://jq.qq.com/?_wv=1027&k=5deQUBl里面有阿里Java高级大牛直播讲解知识点,分享知识,课程内容都是各位老师多年工作经验的梳理和总结,带着大家全面、科学地建立自己的技术体系和技术认知!
开发人员需能够自我激励,主动学习新技术,并在职业生涯中给自己扣上很多帽子。 继而不断挑战自我,然后更好地解决问题,这就是编程的本质。 知识很重要,在某些复杂问题的情况下更是如此。在变化如此之快的IT技术领域中,知识的获取在任何时候比我们已会的技能更为重要。
可以加群:810589193,点击链接加入群聊【Java架构学习交流群】:https://jq.qq.com/?_wv=1027&k=5deQUBl我会分享一些免费的资深架构师录制的视频录像:有Spring,MyBatis,Netty源码分析,高并发、高性能、分布式、微服务架构的原理,JVM性能优化这些成为架构师必备的知识体系。