最近在更java多线程相关的文章,正好有人问我一些java内存模型的问题,因此花了一些时间,好好地了解一下。本篇文章主要是为了解决以下几个问题?
1、java内存模型和java内存结构有什么区别?
2、为什么要有内存模型?
3、java的内存模型是什么样子的?
这篇文章,基本上不会涉及到代码,全是一些概念性的知识,但是也是面试常问和java进阶所需要掌握的必要的基本知识点,所以,希望你耐着性子,慢慢来。
一、java内存模型和java内存结构有什么区别
1、java内存结构
记得是在好几年前研究Android的时候,看的java内存模型,时常和java内存结构分不清,因此,这一小节是针对小白或者是对其概念还不理解的人。
我们都知道,我们的java代码其实是不能直接运行的,他要经过一系列的步骤。看下图:
我们的java文件,首先要经过编程成为class文件,然后通过类装载器加载到jvm中去执行。这个jvm(红色虚线框起来的这部分)就是java运行时数据区,意思就是java代码在运行的时候,这些数据要存放在不同的内存空间里面。jvm就是指代这个的。当然了上面的运行时数据区jvm是jdk1.7版本的。也就是说不同的jdk版本,这个jvm长得是不一样的。我们可以把java7的内存结构拿出来:
我们可以看到一共划分了5个部分,其中java堆区和方法区还是所有线程共享的一片区域。为什么要所有线程共享呢?因为假设一个数据,每个线程都保留一份,那其中有一个线程调皮,把这个数据更改了。其他的线程发现自己的数据没有变,这就出现了问题了。于是设计成了所有线程共享,java内存模型出来了。
2、java内存模型
java内存模型也叫做JMM,但是这个模型可不是像java内存结构一样,是真实存在的。java内存模型是一个抽象出来的概念。意思是把一部分内存区域设计成所有线程共享的,一个线程对数据更改,其他线程就能立刻知道。这种设计的方法叫做内存模型。我们可以提前看一下:java内存模型长什么样。
这就是java内存模型,也就是多个线程共享同一份数据。现在不知道你理解java内存模型和java内存结构的区别了没有,我们可以这样来总结一下:
(1)java内存结构是解决java中的数据如何存放的问题。
(2)java内存模型是解决java中多个线程共享数据的问题。
OK,到了这基本上就算是把两者的区别介绍完了。下面就来看看为什么要有内存模型吧
二、为什么要有内存模型
深入理解java虚拟机是从硬件的发展来分析的。因此,我也将从这个角度来分析。
阶段一
在计算机发展的第一个阶段,程序是在CPU中运行,数据在主存中保存。随着技术的发展,CPU的速度越来越多高,但是主存的速度却没有提高太多。就好比是下面这种情况:
阶段二
为了解决上面的问题,于是乎出现了缓存,里面存放了一些CPU经常使用的主存数据,缓存的速度和CPU差不多,当CPU查找数据的时候,首先从缓存中查找,没有的话再从主存中查找。写数据的时候,先写缓存的数据,然后再更新到主存中。这样一种机制使得速度提高很多。
阶段三
技术继续发展,在上面缓存的基础上出现了一级二级三级缓存,查找也是逐层的,第一级缓存没有就到第二层,就这样以此类推。这时候CPU也得到了快读发展,由之前的一个核变成了多核CPU(一个CPU变成了多部分)。
这时候呢,之前只能同时跑一个线程,现在就能跑很多个线程了。而且从上面我们可以看到,每一个核都有相应的缓存区,但是主内存还是哪一个。既然能同时跑多个线程,那速度肯定杠杠滴就上去了吧,不跑不知道,一跑吓一跳,立马出现了很多个问题。
问题一:缓存一致性问题
也就是说,每一个核都有自己的缓存区,但是这些缓存区保存的数据却不一样。一张图就明白了:
问题二:处理器优化和指令重排
这问题的意思是,既然CPU有这么多内核,肯定是想让资源得到充分利用,于是把我们写的程序拆分,对一些代码进行乱序处理,这就是处理器优化。而且,java虚拟机一看CPU的这个操作真的强,于是就模仿了一下,创建了即时编译器(JIT),这个编译器也会做指令重排的操作。很明显,我们的代码顺序被打乱,指令被重排,就可能不会按照我们的意愿去执行了。
上面出现的这些问题,好像都是从硬件的角度来分析的,《深入理解java虚拟机》一书于是引出了软件的问题,也就是说,上面的这些问题如果转化到软件层次会带来什么问题呢?
问题三:软件问题
(1)原子性问题
首先缓存一致性问题在程序中会带来原子性问题,原子性问题是什么意思呢?你首先就要先理解原子。在生物里面原子叫做不可再分的物质。在软件里面,原子叫做不可再分的程序操作。而原子性问题肯定就是打破了这个规则,也就是说在这个操作中又进行了拆分。
在缓存一致性问题中,两个CPU内核中a的数据不一致,也就是说两个CPU内核读取主存a的值是不一样的。那么对于a的更改这个操作肯定就不是原子性,在A更改的过程中,两个CPU内核同时进行了更改。
(2)可见性问题
上面在介绍原子性问题的时候说了,两个线程(CPU内核)访问同一个变量时,线程2修改了这个变量的值,但是线程1却没有看到其修改,所以读的仍然是旧数据。
(3)有序性
也就是程序没有按照指定的顺序去执行。
可见性问题和有序性问题就是由于处理器优化和执行重排造成的。
阶段四
针对于这么多问题,于是java虚拟机提出了一个java内存模型。有效地解决了上面出现的这三个问题:
三、java内存模型
1、解释
为了和开头进行对照,我们再给出以此他的内存模型图:
从这张图我们分析一下java内存模型是如何解决上面的三个问题的。
规则一:所有的数据都在主内存中。
规则二:每个线程都保留一份共享变量的副本。线程对变量的所有操作都必须在这个副本内存中进行,而不能直接读写主内存。
规则三:不同的线程之间也无法直接访问对方工作内存中的变量,线程间变量的传递均需要自己的工作内存和主存之间进行数据同步进行。
看文字有点乱,我们举个例子,这个例子我觉得不太恰当,但是结合着上面的概念,相信你会明白的。在古代的时候经常发生旱灾,朝廷去赈灾,于是拿了一个大铁锅煮粥,这个大铁锅就是主内存,里面的粥就是数据。而每个难民就代表了不同的线程。
(1)难民都有一个碗,盛放一碗粥。就好比是每个线程都有一个本地内存,有一个主内存的副本。
(2)难民喝粥就只能在自己碗里,不能直接爬到锅中喝粥,就好比线程只能在自己的本地内存中操作数据,不能直接到主内存读写数据。
(3)其中一个难民想要把粥分给伙伴,怎么办呢?这个难民要先把粥倒进锅里,同伴再去锅里盛。就好比线程不能直接访问对方的内存,他们之间的数据传递都是通过主内存。
这个例子希望你能明白。现在这个模型算是出来了,还有一个问题没有解决,那就是java提供了什么东西来实现的这三个规则呢?
由于提供的机制太多,我们可以简单的例举几个,比如说synchronized关键字保证了原子性,volatile关键字保证了可见性。synchronized关键字和volatile关键字保证了有序性。当然还有很多的Lock机制,并发包里面等等都是为了解决这三个问题提出来的。
2、happens-before原则
其中有一条很重要的规则叫做happens-before原则,这条原则是为了解决可见性提出来的。什么意思呢?
如果一个操作的执行结果需要对另一个操作可见,那么这两个操作之间必须要存在happens-before关系。举个例子:
(1)程序顺序规则:一个线程中的每个操作发生在后一个操作之前,这就是happens-before。
(2)锁规则:对于锁机制,一定要先加锁,才能解锁,这也是happens-before。
(3)volatile域规则:对一个volatile域的写操作一定要发生在读操作前面。
上面是在程序角度来看的,举一个最简单不过的例子,你必须要做饭,才能够吃到饭。
。
(2)锁规则:对于锁机制,一定要先加锁,才能解锁,这也是happens-before。
(3)volatile域规则:对一个volatile域的写操作一定要发生在读操作前面。
上面是在程序角度来看的,举一个最简单不过的例子,你必须要做饭,才能够吃到饭。
这篇文章当然不是最详细的最全面的,只是希望大家有所收获,如有问题欢迎批评指正