Java内存区域是真实存在的,是JVM再运行程序期间将自动管理的内存划分为5个不同的区域。Java内存区域划分图如下所示:
线程数据私有区域:随着线程产生和消亡,不需要过多考虑内存回收问题,在编译时确定所需内存大小
方法区:
方法区属于线程共享的数据区域,主要用于存储已被虚拟机加载的类信息:常量、静态变量、即时编译器编译后的代码等数据。当方法区无法满足内存分配需求时,将抛出OutOFMemoryError异常。值得注意的时,再方法区中存在一个叫运行时常量池(Runtime Constant Pool)的区域,它主要用于存放编译器生成各种字面值和符号引用,这些内容再类加载后存放到运行时常量池中,以便后续使用。
【注意】
方法区大小不必是固定的,也不一定是连续的
方法去可以被垃圾收集,当某一个类不被使用时,JVM将进行垃圾收集
方法区存放的内容:
(1)类的全路径名
(2)类的直接超类的全路径名
(3)类的类型(是类还是接口)
(4)类的访问修饰符 :public private等
(5)类的直接接口全限定名的有序列表
(6)常量池(字段、方法信息、静态变量、类型引用class)
类变量:是静态变量,再方法区中有一个静态区,专门用来存储静态变量和静态块
堆
也是属于线程共享的内存去,它在JVM启动时创建,是Java虚拟机所管理的内存去中最大的一块,主要用于存放对象实例。几乎所有的对象实例都在这里分配内存,Java堆是垃圾收集管理的主要区域,因此很多称其为GC堆,若在堆中没有内存完成实例分配,并且堆也无法再扩展时,将抛出OutOfMemoryError异常
栈:在JVM中栈用来存储一些对象的引用,局部变量以及计算过程的中间数据。在方法退出后,这些变量也会被销毁。它的存储比堆快得多,只比CPU里的寄存器慢,在JVM中默认的大小为1M
此区域时唯一一个在JVM规范中没有规定任何OutOfMemoryError情况的区域。
属于线程私有数据区,是一小块内存空间,主要代表当前线程所执行的字节码行号指示器。字节码解释器工作时,通过改变这个计数器的值来选取下一条需要执行的字节码指令,分支、循环、跳转、异常处理、县城回复等基础功能都需要以来这个计数器来完成。
属于线程私有的数据区域,与线程同时创建,总数与线程关联,代表Java方法执行的内存模型。每个方法创建时都会创建一个栈帧来存储方法的变量表,操作数栈、动态链接法、返回值、返回地址等信息。每个方法从调用到结束就对应于一个栈帧在虚拟机栈中的入栈和出栈过程。
由于计算机的存储设备与处理器的运算能力之间有几个数量级的差距,所以现代计算机系统都不得不加入一层读写速度尽可能接近处理器运算速度的高速缓存(cache)来作为内存与处理器之间的缓冲:讲计算需要使用到的数据复制到缓存中,让计算能快速进行,当运算结束后再从缓存同步回内存中,这样处理器就不需要等待缓慢的内存读写了。
基于告诉缓存的存储交互很好地解决了处理器与内存的速度矛盾,但是引入了一个新的问题:缓存一致性(Cache Coherence)。再多处理器系统中,每个处理器都有自己的高速缓存,而他们又共享一个内存,如下图所示:多个处理器都涉及到同一块贮存,需要一种协议可以保障数据的一致性,这类协议又:MESI、MESI、MOSI及Dragon Protocol等
除此之外,为了使处理器内部的运算单元尽可能被充分利用,处理器可能会对输入代码进行乱序执行(Out of Order Execution)优化,处理器会在计算之后将堆乱序执行的代码进行结果重组,保证结果准确性。与处理器的乱序执行优化类似,Java虚拟机的即时编译器也有类似的指令重排序(instruction Recorder)优化。
内存模型可以理解为在特定的操作写一下,对特定的内存或者高速缓存进行读写访问的过程抽象,不同架构下的物理机拥有不一样的内存模型,Java虚拟机也有自己的内存模型,即Java内存模型JJM(Java Memory Mode)。在C/C++语言中直接使用物理硬件和操作系统内存模型,导致不同平台下并发访问错误。而JMM的出现,能够屏蔽掉各种硬件和操作系统的内存访问差异,实现平台一致性,使得Java程序能够“一次编译,到处运行”。
JVM运行程序的实体是线程,而每个线程创建时JVM都会为其创建一个工作内存(又的地方称其为栈空间),用于存储线程私有的数据,而Java内存模型中规定所有变量都存储在主内存中,主内存是共享内存区域,所有线程都可以访问主内存,线程想要对变量进行操作(读取赋值等操作)必须在工作内存中进行。首先将变量从主内存中拷贝到自己的工作内存中,然后在工作内存中对变量进行操作,操作完成后再将变量写回主内存,不可以直接操作主内存中的变量。因为工作内存是每个线程的私有区域,因此不同线程之间无法访问对方线程的工作内存,线程之间的通信需要通过主内存。
在某些地方,主内存被描述为堆内存,工作内存被程唯线程栈
主内存
主要存储的是Java实例对象,所有线程创建的实例对象都存放在主内存在,不管该实例对象是成员变量还是方法中的局部变量,当然也包括了共享的类信息、常量、静态变量。
工作内存
主要存储当前方法的所有本地变量信息(工作内存中存储着主内存中的变量副本拷贝),每个线程只能访问自己的工作内存,即线程中的本地变量对其它线程是不可见的,就算是两个线程执行的是同一段代码,它们也会各自在自己的工作内存中创建属于当前线程的本地变量,当然也包括了字节码行号治时期、相关native方法的信息。注意由于工作内存是每个线程的私有数据,线程间无法相互访问工作内存,所欲存储在工作内存中的数据不存在安全问题。
JMM模型定义了八种操作来完成从主内存到工作内存中数据的传递
JVM中只要求从主内存中复制到工作内存,需要按顺序执行:(read与store);如果从工作内存中同步回主内存,就要按顺序执行:(store与write)。JMM只要求上述两类操作必须按照顺序执行,而没有保证必须是连续执行。即read和store之间,可以插入其他的指令。JMM还规定在执行上述八种基本操作时,必须满足如下规则:
Java中使用一种先行发生(happens before)原则来确定一个内存访问在并发环境下是否安全
使用多线程产生的一个基本的问题就是:线程间变量的共享
Java中的变量共分为3类:
(1)类变量
(2)实例变量
(3)局部变量(方法里声明的变量)
假如:主存变量中存在一个共享变量x=1,现在有A和B两个两个线程分别对该变量x进行加1操作和读取操作,A和B线程各自的工作内存中存在共享变量副本x。假设现在A线程要进行+1操作,B线程想进行读取X操作,那么B线程读取到的值是A线程更新后的x的值呢还是更新之前x的值呢?答案是:不确定;B可能读到的x的值是A更新前的1,也可能是更新后的2。这样就有可能造成主内存与工作内存间数据存在不一致性,这就是所谓的线程安全问题。
为了解决线程安全问题,JVM执行了一组规则,通过这组规则来决定一个线程对共享变量的写入何时对另一个线程可见,这组规则也成为Java内存模型JMM,JMM是围绕着程序执行的原子性、有序性、可见性展开的。
原子性指的是一个操作是不可中断的,即使是在多线程环境下,一个操作一旦开始就不会被其他线程影响。比如对于一个静态变量int x,两条线程同时对他赋值,线程A赋值为1,而线程B赋值为2,不管线程如何运行,最终x的值要么是1,要么是2,线程A和线程B间的操作是没有干扰的,这就是原子性操作,不可被中断的特点。有点要注意的是,对于32位系统的来说,long类型数据和double类型数据(对于基本数据类型,byte,short,int,float,boolean,char读写是原子操作),它们的读写并非原子性的,也就是说如果存在两条线程同时对long类型或者double类型的数据进行读写是存在相互干扰的,因为对于32位虚拟机来说,每次原子读写是32位的,而long和double则是64位的存储单元,这样会导致一个线程在写时,操作完前32位的原子操作后,轮到B线程读取时,恰好只读取到了后32位的数据,这样可能会读取到一个既非原值又不是线程修改值的变量,它可能是“半个变量”的数值,即64位数据被两个线程分成了两次读取。但也不必太担心,因为读取到“半个变量”的情况比较少见,至少在目前的商用的虚拟机中,几乎都把64位的数据的读写操作作为原子操作来执行,因此对于这个问题不必太在意,知道这么回事即可。
计算机在执行程序时,为了提高性能,编译器和处理器的常常会对指令做重排,一般分以下3种
编译器重排
程序的执行结果可能会出现x1= 1, x2 = 2的情况,如果编译器对这段程序代码执行重排后,可能出现以下情况
重排后可能出现x1 =1, x2 = 2,这说明在多线程环境下,由于编译器优化重排的存在,两个线程中使用的变量能否保证一致性是无法确定的。
可见性指的是当一个线程修改了某个共享变量的值,其他线程是否能够马上得知这个修改的值。对于串行程序来说,可见性是不存在的,因为我们在任何一个操作中修改了某个变量的值,后续的操作中都能读取这个变量值,并且是修改过的新值。但在多线程环境中就不一定了,由于线程对共享变量的操所都是线程从共享区拷贝数据到各自工作内存,然后操作数据后再写回主内存中,这就可能存在一个线程A修改了共享变量x的值,还未写回主内存时,另外一个线程B又对主内存中同一个共享变量x进行操作,但此时A线程工作内存中共享变量x对线程B来说不可见,这种工作内存与主内存同步延迟的现象就造成了可见性的问题,另外指令重排和编译器优化也会导致可见性的问题。
有序性是指对于单线程的执行代码,我们总是认为代码的执行是按顺序依次执行的。但是对于多线程而言,因为程序编译成机器码指令后可能会出现指令重排现象,重排后的指令与原指令的顺序未必一致。
原子性问题的解决方法:
工作内存和主内存的同步延迟问题的解决方法
除了以上的解决方法外,JMM内部还定义了一套hapens-before原则来保证多环境下两个操作间的原子性、可见性和有序性。
该原则用来判断数据是否存在竞争、线程是否安全,原则如下:【】中的内容为《深入理解Java虚拟机第十二章》
https://blog.csdn.net/u011080472/article/details/51337422
https://blog.csdn.net/javazejian/article/details/72772461
https://www.cnblogs.com/chenssy/p/6393321.html