1.java运行数据区域结构
java运行时数据区域主要分为:程序计数器,虚拟机栈,native方法栈,方法区和堆空间。
其中,程序计数器,虚拟机栈和本地方法栈,作为线程的私有内存存在;方法区和堆空间则为虚拟机中所有线程所共享。主要结构图如下:
1.1 程序计数器
线程所执行代码的行号指示器,线程私有,如果这个计数器正在执行的是java方法,则计数器保存的是正在执行的虚拟字节码指令地址;如果正在执行的是本地方法,计数器值为undifined。程序计数器不存在OOM的情况。
1.2 java虚拟机栈
描述了java方法执行的内存模型:每个方法在执行的同时都会创建一个栈帧,存储局部变量,操作数栈,动态链接,方法出口等。每个方法从调用到结束,对应一个栈帧在虚拟机中的入栈和出栈。
两种异常:OOM和StackOverFlowError,分别对应无法申请到足够内存时,和线程请求的栈深度超过虚拟机所允许的栈深度。
1.3 java堆空间
几乎所有对象和数组的分配都发生在堆上(是几乎,由于JIT即时编译和逃逸分析技术的成熟,会有一些栈上分配和标量替换的优化技术来代替)。
堆空间分代,新生代和老年代。新生代目前常见的一般会细分成一个Eden空间和两个Survivor空间,两个survivor空间同一时刻只能有一个有数据,比例一般是Eden:Survivor1:Survivor2=8:1:1。老年代和新生代由于分配和回收的频繁程度不同,从而会采用不同的gc垃圾回收算法。
1.4 方法区
用于存储被虚拟机加载的类信息,常量,静态变量,即时编译器编译后的代码等数据。Hotspot虚拟机使用永久代来实现方法区,1.7+的JDK版本,在hotspot虚拟机的实现中,已将付出常量池移出了方法区。
1.5 运行时常量池
方法区的一部分,具备动态性,java支持运行时常量,运行期间可以将新的常量放入池中。
1.6 直接内存
堆外内存,分配不会受到java堆大小的限制,只会受到本地总内存大小以及处理器寻址空间的限制。JDK1.4 之后的NIO(非阻塞IO模型),可以使用native函数库直接分配堆外内存,通过java中的DirectByteBuffer对象作为这块内存的引用进行操作(个人理解就是MMP内存映射技术),某些场景中(比如一些大文件的读取)能显著提高性能。
2.Hotspot虚拟机对象
2.1 对象的创建
new一个对象的时候,需要检查new指令参数是否在常量池中,定位到该类的符号引用,并检查该符号引用代表的类是否已被加载,解析和初始化过。如果没有,则需要先进行类加载。
新生对象的分配分两种情况:如果java堆内存时规整的(空闲内存经过压缩),则只需要移动空闲指针位置就可以实现分配(指针碰撞);否则,需要维护空闲区块链表,从中找到一块足够大的空间进行分配。
考虑到并发分配内存导致不一致的情况,java虚拟机一般采用两种方式解决,一是通过CAS原子操作+重试机制保证分配内存更新的原子性;二是通过所谓的线程封闭的方式,每个线程维护一个本地缓冲区(TLAB),哪个现成需要分配就在哪个线程的TLAB上分配,只有用完才需要同步锁定。可通过-XX:+useTLAB打开。
2.2 对象的布局
对象的内存布局主要分成:对象头,实例数据和对齐填充。
一般会用4个或者8个字节(Mark word)来记录一些信息,本身对象头的信息在不同的状态下可复用。例如,在32位的Hotspot虚拟机中,如果对象处于未被锁定的状态下,Mark Word的32bit 空间中,25bit用来存储对象的hashCode,4bit用来存储对象的分代年龄,2bit用来存储锁标志位,1bit固定为0。具体说明如图2所示:
对象补齐是指对象的实例部分没有对齐的时候,由于虚拟机的内存管理系统的对齐要求(hotspot虚拟机要求对象起始地址必须是8字节的整数倍),需要通过对齐填充来补全。
2.3 对象的访问
对象的访问通过两种方式:(1)使用句柄访问;(2)使用直接指针访问。
使用句柄访问的优点是,句柄地址稳定,对象移动针对reference引用是透明的,reference本身不需要修改;缺点是多了一次寻址的性能消耗;使用直接地址访问的优点是速度快,少了一次指针定位的开销;缺点是reference随时需要根据指针改变而修改。hotspot采用第二种方式。
3 常见异常示例
3.1 java堆溢出
示例中限制-Xms20m -Xmx20m,并通过-XX:+HeapDumpOnOutOfMemoryError在内存打爆之后会自动抓dump:
/**
*VM Args: -Xms20m -Xmx20m -XX:+HeapDumpOnOutOfMemoryError
*/
public class HeapOOM{
static class OOMObject{
List list = new ArrayList();
while(true){
list.add(new OOMObject());
}
}
}
最后会显示java.lang.OutOfMemoryError错误。
3.2 虚拟机栈和本地方法栈溢出
通过设定-Xss调整栈内存容量,可通过如下的无限递归程序触发StackOverFlowError异常:
/**
* VM Args:
* -Xss128k
*/
public class JavaVMStackSOF {
private int stackLength = 1;
public void stackLeak(){
stackLength++;
stackLeak();
}
public static void main(String[] args) throws Throwable{
JavaVMStackSOF oom = new JavaVMStackSOF();
try{
oom.stackLeak();
}catch (Throwable e){
System.out.println("stack length:" + oom.stackLength);
throw e;
}
}
}
3.3 方法区和运行常量池溢出
在JDK 1.7+版本中,开始逐步去永久代。以String.intern()这个native方法为例,可看出前后两个jdk版本处理方式的差别。
public class RumtimeConstantPoolOOM{
public static void main(String[] args){
List list = new ArrayList();
int i = 0;
while(true){
list.add(String.valueOf(i++).intern());
}
}
}
在1.6之前的版本,intern函数会在字符串常量池中查找是否包含该String对象,如果有则返回;否则将此对象复制到常量池中,并返回其引用。所以1.6及以前的版本,上面的程序很快就会将Perm永久代打爆;1.7版本该函数不会再复制实例,上面的程序除非超过设定的堆内存限制,否则会一直跑下去。所以在1.7版本中,下面的程序会返回一个true和一个false(1.6版本由于intern在不存在于常量池时存在复制行为,所以输出两个结果都是false):
public class RuntimeConstantPoolOOM {
public static void main(String[] args){
String str1 = new StringBuilder("computer").append("software").toString();
System.out.println(str1.intern() == str1);
String str2 = new StringBuilder("ja").append("va").toString();
System.out.println(str2.intern() == str2);
}
}