一直对JVM的基本结构很困惑,今天抽空整理下。
Java Virtual Machine的简称即Java虚拟机
虚拟机,是指通过软件模拟具有完整硬件功能的完整计算机系统.比如VMWare/Visual Box/JVM.VMWare和Visual Box模拟的是物理CPU的指令集,我们看的见摸的着,而JVM所模拟的是JAVA字节码的指令集.
JVM定义了JVM规范,如Class文件格式,运行时的数据的存储、帧栈、虚拟机的指令集等。比如Scala可以在JVM上运行,很显然Scala不符合Java语言规范,但是却是符合JVM规范的。
JVM基本结构
有一个经典的图,画了JVM的内部结构(话说,已经在好多地方看到这个图了,但是完全不知道这个图的出处)
类加载器负责把class文件加载到jvm的内存空间里去,JVM的内存空间是分区域的,分为方法区,java堆,Java栈,本地方法区.然后执行引擎负责执行方法区里的内容,还有一个pc寄存器指向下一条需要运行的指令的地址,同时还有GC,来负责内存空间的垃圾回收.
类加载器
使用java编译器可以把java代码编译为存储字节码的Class文件,使用其他语言的编译器一样可以把程序代码翻译成Class文件,java虚拟机不关心Class的来源是何种语言。
类从被加载到虚拟机内存中开始,到卸载出内存为止,它的生命周期包括了:加载(Loading)、验证(Verification)、准备(Preparation)、解析(Resolution)、初始化(Initialization)、使用(Using)、卸载(Unloading)七个阶段,其中验证、准备、解析三个部分统称链接。具体每一步做了什么,见类的加载和初始化过程.
PC寄存器
每一个线程都会分配一个PC寄存器,PC寄存器总是会指向下一条指令的地址
方法区
用来保存类的元信息,如常量池,方法的信息,方法的字节码,方法区通常我们叫永久区.
Java堆
New出来的对象都在Java堆里,且堆是全局共享的,所有的线程都可以访问到。
从GC的角度来看,堆是分代的,一般可以分为Eden、s0、s1、tenured。
Java栈
栈跟堆不同,栈是线程私有的。
栈是由帧组成,所以java的栈也叫帧栈。
帧里主要包含以下几部分内容:局部变量表、操作栈、动态链接、返回地址。
局部变量表
局部变量表分为两种,一种是静态方法,还有一种是实例方法.实例方法的分配基本和静态方法一致,区别是,第一个槽位,实例方法传的是当前对象的引用(this).
局部变量表的槽位长度是32位.
//todo分析局部变量表
//todo分析操作栈
栈上分配
Java栈还有一个比较重要的概念:栈上分配。栈上分配顾名思义,也就是变量和对象在栈上分配,不在堆里分配空间。
我们来看一段代码。
首先我们通过参数
-server -Xmx10m-Xms10m -XX:-DoEscapeAnalysis -XX:+PrintGC
来运行代码
得到的结果如下:
然后,我们通过下面的参数再运行一次:
-server -Xmx10m-Xms10m -XX:+DoEscapeAnalysis-XX:+PrintGC
得到的结果如下:
对比之下,我们可以看到我们加上了+DoEscapeAnalysis之后,GC也没有了,运行时间也少了几百倍,由此可见栈上分配优化的好处。栈上分配一般都是分配的小对象,因为每个线程都有一个栈,栈本来就很小,基本上是几百K到1M。