jvm笔记1--Java内存区域与内存溢出

                                                                          --个人博客地址 --

Java技术体系

Java EE (Enterprise Edition):支持使用多层架构的企业应用(如:ERP,CRM应用)的Java平台,除了提供Java SE API 外,还对其做了大量扩充并提供了相关部署支持。

这些扩展一般以javax.*作为包名,而以java.*为包名的包都是Java SE API的核心包。历史原因,部分扩展包API进入了核心包,所以核心包也包含了不少javax.*的包名。

 

Java自动内存管理机制

1.内存区域与内存溢出异常

1.运行时数据区域

Java虚拟机在执行Java程序的过程中会把它所管理的内存划分为若干个不同的数据区域。这些区域都有各自的用途,以及创建和销毁的时间,有的区域随着虚拟机进程的启动而存在,有些区域则依赖用户线程的启动和结束而建立和销毁。

jvm笔记1--Java内存区域与内存溢出_第1张图片

  • 程序计数器(Program  Counter  Register)

是一块较小的内存空间,它可以看作是当前线程所执行的字节码的行号指示器。在虚拟机的概念模型里,字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令,分支,循环,跳转,异常处理,线程恢复等基础功能都需要依赖这个计数器。

 

Java虚拟机多线程是通过线程轮流切换并分配处理器执行时间的方式来实现的,在任何一个确定的时刻,一个处理器(对多核处理器来说是一个内核)都只会执行一条线程中的指令。为了线程切换后能恢复到正确的执行位置,每条线程都需要有一个独立的程序计数器,各条线程之间计数器互不影响,独立存储,称为"线程私有"的内存。

 

如果线程正在执行的是一个Java方法,这个计数器记录的是正在执行的虚拟机字节码指令的地址;如果正在执行的是Native方法,这个计数器值则为空(Undefined)。此内存区域是唯一一个在Java虚拟机规范没有规定任何OutOfMemoryError情况的区域

  • java虚拟机栈(Java  Virtual  Machine  Stacks)(线程私有)

线程私有,生命周期与线程相同。描述的是Java方法执行的内存模型:每个方法执行时会创建一个栈帧(Stack  Frame)用来存储局部变量表,操作数栈,动态链接,方法出口等信息。每个方法从调用到执行完成的过程,就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。

 

通常Java内存分为堆内存(Heap)和栈内存(Stack),栈内存值指的就是虚拟机栈,或说是虚拟机栈中的局部变量表部分。

 

局部变量表存放了编译期可知的各种基本数据类型(boolean,byte,char,short,int,float,long,double),对象引用(reference类型,引用指针...)和returnAddress类型(指向了一条字节码 指令的地址)

 

64为长度的long和double类型的数据会占用2个局部变量空间(Slot),其余的数据类型只占用1个。局部变量表所需的变量空间在编译期间完成分配,当进入一个方法时,这个方法需要在栈帧中分配多大空间是完全确定的,方法运行期间不会改变局部变量表的大小。

 

异常:1.如果线程请求的栈深度大于虚拟机所允许的深度,将抛出StackOverflowError异常

2.如果虚拟机栈可动态扩展(大部分java虚拟机栈都可动态扩展),扩展时无法申请到足够内存,抛出OutOfMemoryError异常

  • 本地方法栈(Native  Method  Stack)

与虚拟机栈作用相似,虚拟机栈为虚拟机执行Java(字节码)方法服务,本地方法栈为虚拟机用到的Native方法服务。虚拟机规范中没有对本地方法栈中使用的语言,方式与数据结构进行强制规定,因此虚拟机可以自由实现它。

  • 堆(Heap)(线程共享)

对大多数应用来说,Java堆是Java虚拟机所管理的内存中最大的一块。被所有线程共享,存放对象实例,几乎所有对象实例都在这里分配内存。

 

堆是垃圾收集器管理的主要区域,GC堆(Garbage Collected Heap)

 

堆细分为:新生代和老年代

更细致分:Eden空间,From Survivor空间,To Survivor空间

 

Java堆可以处于物理上不连续的内存空间中,只要逻辑上连续即可。当前主流虚拟机都是按照可扩展来实现的(通过 -Xmx 和 -Xms控制)。如果堆中没有内存完成实例分配,并且堆也无法再扩展,就会抛出OutOfMemoryError异常。

  • 方法区(Method Area)(线程共享)(HotSpot虚拟机中永久代)
存储已被虚拟机加载的 类信息常量静态变量即时编译器编译后的代码等数据。虽然Java虚拟机规范把方法区描述为堆的一个逻辑部分,但是它却有一个别名叫做 Non-Heap(非堆),与Java堆区分。

 

Java虚拟机规范对方法区的限制非常宽松,除了和Java堆一样不需要连续的内存和可以选择固定大小或可扩展外,还可以选择不实现垃圾收集。垃圾回收在这个区域比较少出现,回收的目标主要是针对常量池和对类型的卸载。当方法区无法满足内存分配需求时,将抛出OutOfMemoryError异常。

  • 运行时常量池(Runtime  Constant  Pool)

是方法区的一部分。Class文件中除了有类的版本,字段,方法,接口等描述信息外,还有一项信息是常量池(Constant Pool Table),用于存放编译期生成的各种字面量和符号引用,这部分内容将在类加载后进入方法区的运行时常量池中存放。

 

Java虚拟机对Class文件的每一部分(包括常量池)的格式都有严格规定,每个字节用于存储哪种数据都必须符合规范上的要求才会被虚拟机认可,装载和执行,但对于运行时常量池,Java虚拟机规范没有做任何细节要求,一般来说,处理保存Class文件中描述的符号引用外,还会把翻译出来的直接引用也存储在运行时常量池中。

 

运行时常量池相对于Class文件常量池的另外一个重要特征是具备动态性,Java语言并不要求常量一定只有编译期才能产生,不是预置入Class文件中常量池的内容才能进入方法区运行时常量池。运行期间也可能将新的常量放入池中,如:String类的intern()方法。

 

运行时常量池是方法区的一部分,所以当常量池无法再申请到内存时会抛出OutOfMemoryError异常。

  • 直接内存(Direct Memory)
并不是虚拟机运行时数据区的一部分,也不是Java虚拟机规范中定义的内存区域。但是这部分内存也被频繁使用,也可能导致OutOfMemoryError异常。

 

Java中新加入的NIO(New Input/Output)类,引入了一种基于通道(Channel)与缓冲区(Buffer)的I/O方法,可以使用Native函数库直接分配堆外内存,然后通过一个存储在Java堆中的DirectByteBuffer对象作为这块内存的引用进行操作。可以在一些场景中显著提高性能,因为避免了在Java堆和Native堆中来回复制数据。

2.Hotspot虚拟机对象

HotSpot虚拟机在Java堆中对象分配,布局和访问的过程。

1.对象创建

1. 当虚拟机遇到一条new指令时,首先将去检查这个指令的参数是否能在常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已被加载,解析和初始化过。如果没有,那必须先执行相应的类加载过程。

 

2. 类加载检查通过后,接下来虚拟机将为新生对象分配内存(把一块确定大小的内存从Java堆中划分出来)。对象所需内存的大小在类加载完成后便可确定。

 

指针碰撞(Bump the Pointer):假设Java堆中内存是绝对规整的,所有用过的内存都放在一边,空闲的内存放在另一边,中间放一个指针作为分界点的指示器,那所分配内存就仅仅是把那个指针项空闲空间挪动一段与对象大小相等的距离。

 

空闲列表(Free List):如果Java堆中内存不规整,已使用的内存和空闲内存相互交错,虚拟机就必须维护一个列表,记录哪些内存块是可用的,在分配的时候从列表中找到一块足够大的空间划分给对象实例,并更新列表上的记录。

 

具体选择哪种分配方式由Java堆是否规整决定,而Java堆是否规整又由所采用的垃圾收集器是否带有压缩整理功能决定。

使用Serial,ParNew等带Compact过程的收集器:系统采用的分配算法是指针碰撞

使用CMS这种基于Mark-Sweep算法的收集器:通常采用空闲列表。

 

问题:对象创建在虚拟机中是非常频繁的行为,即使是仅仅修改一个指针所指向的位置,在并发情况下也不是线程安全的。

 

解决一:对分配内存空间的动作进行同步处理,虚拟机采用CAS配上失败重试的方式保证更新操作的原子性

解决二:把内存分配的动作按照线程划分在不同的空间中进行,每个线程在Java堆中预先分配一小块内存,称为本地线程分配缓冲(Thread Local Allocation Buffer,TLAB。各个线程分配内存时在各自的TLAB上分配,只有TLAB用完并分配新的TLAB时,才需要同步锁定。

通过 -XX:+/-UserTLAB 参数来设定。

 

3. 内存分配完成后,虚拟机需要将分配到的内存空间都初始化为零值,如果使用TLAB,这一工作过程也可以提前至TLAB分配时进行。保证了对象的实例字段在Java代码中可以不赋初始值就直接使用,程序能访问到这些字段的数据类型所对应的零值。

 

4.接着,虚拟机要对对象进行必要的设置,例如这个对象是哪个类的实例,如何才能找到类的元数据信息,对象的哈希码,对象的GC分代年龄等信息。这些信息存放在对象的对象头(Object Header)之中。根据虚拟机当前的运行状态的不同,如是否启用偏向锁等,对象头会有不同的设置方式。

 

5. 执行init方法初始化对象,从虚拟机角度看,上面步骤后新的对象就已经产生了,从Java视角来看,对象创建才刚刚开始。执行new指令后会接着执行方法(由字节码中是否跟随invokespecial指令所决定),将对象按照程序员的意愿进行初始化。

2.对象内存布局

对象在内存中存储的布局可以分为3块区域:对象头(Header),实例数据(Instance Data)和对齐填充(Padding)。

HotSpot虚拟机的对象头包括两部分信息:

1.Mark word :

用于存储对象自身的运行时数据(哈希码HashCode,GC分代年龄,锁状态标志,线程持有的锁,偏向线程ID,偏向时间戳等),长度是32bit(32位虚拟机中)和64bit(64位虚拟机中)

 

对象要存储的运行时数据很多,其实已经超出了32位,64位Bitmap结构所能记录的极限,但是对象头信息是与对象自身定义的数据无关的额外存储成本,考虑到虚拟机的空间效率,Mark Word被设计成一个非固定的数据结构以便在极小的空间内存储尽量多的信息,它会根据对象的状态复用自己的存储空间。

 

如:32位HotSpot虚拟机中,如果对象处于未被锁定的状态下,32bit中的  25bit存储对象哈希码,4bit存储对象分代年龄,2bit存储锁标志位,1bit固定为0.

其他状态(轻量级锁定,重量级锁定,GC标记,可偏向)下对象的存储内容

存储内容 标志位 状态
对象哈希码,对象分代年龄 01 未锁定
指向锁记录的指针 00 轻量级锁定
指向重量级锁的指针 10 膨胀(重量级锁定)
空,不需要记录信息 11 GC标记
偏向线程ID,偏向时间戳,对象分代年龄 01 可偏向

2.类型指针:

对象指向它的类元数据的指针。虚拟机通过这个指针来确定这个对象是哪个类的实例。并不是所有的虚拟机实现都必须在对象数据上保留类型指针,换句话说,查找对象的元数据信息并不一定要经过对象本身。

如果对象是一个Java数组,在对象头中还必须有一块用于记录数组长度的数据,因为虚拟机可以通过普通Java对象的元数据信息确定Java对象的大小,但是从数组的元数据中却无法确定数组的大小。

实例数据(InstanceData):

对象真正存储的有效信息,程序在代码中定义的各种类型的字段内容(无论是父类继承还是子类中定义的)。存储顺序受虚拟机分配策略参数(FieldsAllocationStyle)和字段在Java源码中定义顺序的影响。

HotSpot默认分配策略为  longs/doubles,ints,shorts/chars,bytes/booleans,oops(Ordinary Object Pointer)。

相同宽度的字段总是被分配到一起,满足这个条件的情况下,父类的变量会出现在子类之前。如果CompactFields参数为true(默认true),那么子类之中较窄的变量也可能会插入到父类变量的空隙中。

对其和填充:

不是必然存在的,也没有特别含义,仅仅是占位符的作用。HotSpot VM 的自动内存管理系统要求对象其实地址必须是8字节的整数倍,对象的大小必须是8字节的整数倍。对象头部分正好是8字节的倍数(1,2倍),因此对象实例数据部分没有对齐时,就需要通过填充来补全。

3.对象访问定位

建立对象是为了使用对象,Java程序需要通过栈上的reference数据来操作堆上的具体对象。由于reference类型在Java虚拟机规范中只规定了一个指向对象的引用,并没有定义这个引用应该通过何种方式去定位,访问堆中的对象的具体位置,所以对象访问方式也取决于虚拟机实现而定。

 

  • 使用句柄访问:

Java堆中会划分出一块内存来作为句柄池,reference中存储的就是对象的句柄地址,句柄中包含了对象实例数据与类型数据各自的具体地址信息。

jvm笔记1--Java内存区域与内存溢出_第2张图片

  • 使用直接指针访问:

jvm笔记1--Java内存区域与内存溢出_第3张图片

 

句柄访问的好处在于reference中存储的是稳定的句柄地址,在对象被移动(垃圾回收)时只会改变句柄中的实例数据指针,而reference本身不需要修改。

 

直接指针访问方式的最大好处就是速度更快,节省了一次指针定位的时间开销,由于对象的访问在Java中非常频繁。HotSpot是使用第二种方式进行对象访问的。

3.OutOfMemoryError异常

Java虚拟机规范的描述中,除了程序计数器外,虚拟机内存的其他几个运行时区域都有发生OutOfMemoryError异常的可能。

1.Java堆溢出

只要不断创建对象,并且保证GC Roots到对象之间有可达路径保证垃圾回收机制不会清除这些对象,那么在对象数量达到最大堆的容量限制后就会产生内存溢出异常。
/**
 * VM Args: -Xms20m -Xmx20m -XX:+HeapDumpOnOutOfMemoryError
 * 
 * @author 
 * 
 */
public class OutOfMemoryError {
	static class OOMOBject {

	}

	public static void main(String[] args) {
		// System.out.println("heh");
		List list = new ArrayList();
		while (true) {
			list.add(new OOMOBject());
		}
	}
}
 
java.lang.OutOfMemoryError: Java heap space
Dumping heap to java_pid3224.hprof ...
Heap dump file created [24767005 bytes in 0.533 secs]
Exception in thread "main" java.lang.OutOfMemoryError: Java heap space

当java堆内存溢出时,异常堆栈信息"java.lang.OutOfMemoryError"会跟着进一步提示"Java heap space"。

解决方法:

通过工具查看堆内存快照,确定是内存泄漏(Memory Leak) 还是内存溢出(Memory Overflow)。

 

如果是内存泄漏:

可以进一步通过工具查看泄露对象到GC Roots的引用链。于是就能找到泄漏对象是通过怎样的路径与GC Roots相关联并导致垃圾收集器无法自动回收它们的。掌握了泄漏对象的类型信息及GC Roots引用链的信息,就可以比较准确地定位出泄露代码的位置。

 

不是内存泄漏:

内存中的对象确实都还必须活着,就应当检查虚拟机的堆参数(-Xms 与-Xmx),与机器物理内存对比看是否还可以调大,从代码上检查是否存在某些对象生命周期过长,持有状态时间过长的情况,尝试减少程序运行期的内存消耗。

2.虚拟机栈和本地方法栈溢出

HotSpot虚拟机中并不区分虚拟机栈和本地方法栈,因此对于HotSpot来说,虽然-Xoss参数(设置本地方法栈大小)存在,但实际上是无效的,栈容量只由-Xss参数设定。

 

实验:

  • 使用-Xss参数减少栈内存容量。结果:抛出StackOverflowError异常,异常出现时输出的堆栈深度相应缩小。
  • 定义大量的本地变量,增大此方法帧中本地变量表的长度,结果:抛出StackOverflowError异常时输出的堆栈深度相应缩小。
/**
 * VM Args: -Xss128k
 * 
 * @author 
 *
 */
public class JavaVMStackSOF {
	private int stackLength = 1;

	public void stackLeak() {
		stackLength++;
		stackLeak();
	}

	public static void main(String[] args) {
		JavaVMStackSOF oom = new JavaVMStackSOF();
		try {
			oom.stackLeak();
		} catch (Throwable e) {
结论:在单个线程下,无论是由于栈帧太大还是虚拟机栈容量太小,当内存无法分配的时候,虚拟机抛出的都是StackOverflowError异常。

 

操作系统分配给每个进程的内存是有限制的,譬如32位的Windows限制为2GB。虚拟机提供了参数来控制Java堆和方法区的这两部分内存的最大值。

剩余的内存 = 2GB(系统限制) - Xmx(最大堆内存) - MaxPermSize(最大方法区内存),程序计数器消耗内存很小,可以忽略。如果虚拟机进程本身消耗的内存不计,剩下的内存就由虚拟机栈和本地方法栈瓜分。每个线程分配到的栈容量越大,可以建立的线程数量自然就越少,建立线程时就越容易耗尽内存。

 

注意:

如果是建立多线程导致的内存溢出,在不能减少线程数或者更换64位虚拟机的情况下,就只能通过减少最大堆和减少栈容量来换取更多的线程

 

创建线程导致内存溢出异常:

 

/**
 * VM Args: -Xss2M
 * 
 * @author lss
 *
 */
public class JavaVMStackOOM {
	private void dontStop() {
		while (true) {

		}
	}

	public void stackLeakByThread() {
		while (true) {
			Thread thread = new Thread(new Runnable() {
				@Override
				public void run() {
					dontStop();
				}
			});
			thread.start();
		}
	}

	public static void main(String[] args) {
		JavaVMStackOOM javaVMStackOOM = new JavaVMStackOOM();
		javaVMStackOOM.stackLeakByThread();
	}
}

3.方法区和运行时常量池溢出

String.intern()是一个Native方法,作用:如果字符串常量池中已经有一个等于此String对象的字符串,则返回代表池中这个字符串的String对象,否则,将此String对象包含的字符串添加到常量池中,并且返回此对象的引用。

 

通过 -XX:PermSize 和 -XX:MaxPermSize 限制方法区大小。

/**
 * VM Args: -XX:PermSize=10M -XX:MaxPermSize=10M
 * 
 * @author lss
 *
 */
public class RuntimeConstantPoolOOM {

	public static void main(String[] args) {
		// 使用List保持对常量池的引用,防止Full GC 回收常量池行为
		List list = new ArrayList();
		int i = 0;
		while (true) {
			list.add(String.valueOf(i++).intern());
		}

	}
}
java.lang.OutOfMemoryError: PermGen space
Dumping heap to java_pid3892.hprof ...
Heap dump file created [5852055 bytes in 0.081 secs]
Exception in thread "main" java.lang.OutOfMemoryError: PermGen space
	at java.lang.String.intern(Native Method)
	at com.lss.RuntimeConstantPoolOOM.main(RuntimeConstantPoolOOM.java:20)
PermGen  space 说明运行时常量区属于方法区(HotSpot虚拟机中的永久代)的一部分。

方法区用于 存放Class的相关信息,如类名,访问修饰符,常量池,字段描述,方法描述等。

测试思路:运行时产生大量的类去填满方法区,借助CGLib直接操作字节码运行时生成大量的动态类。


实际应用中:像Spring,Hibernate在对类进行增强时,都会使用到CGLib这类字节码技术,增强的类越多,就需要越大的方法区来保证动态生成的Class可以加载入内存。

 

借助CGLib是方法区内存溢出:

	/**
	 * VM Args: -XX:PermSize=10M -XX:MaxPermSize=10M
	 */
	public static void cglibOom() {
		while (true) {
			// 借助cglib创建代理对象
			Enhancer enhancer = new Enhancer();
			enhancer.setSuperclass(OOMObject.class);
			enhancer.setUseCache(false);
			enhancer.setCallback(new MethodInterceptor() {
				@Override
				public Object intercept(Object obj, Method method, Object[] params, MethodProxy proxy)
						throws Throwable {
					return proxy.invokeSuper(obj, params);
				}
			});
			enhancer.create();
		}
	}
 
Caused by: java.lang.OutOfMemoryError: PermGen space
	at java.lang.ClassLoader.defineClass1(Native Method)
	at java.lang.ClassLoader.defineClassCond(ClassLoader.java:632)
	at java.lang.ClassLoader.defineClass(ClassLoader.java:616)
	... 12 more

方法区溢出也是一种常见的内存溢出异常,一个类要被垃圾回收,判定条件比较苛刻。在经常动态生成大量Class的应用中,需要特别注意类的回收状况,如:大量JSP或动态产生JSP文件的应用(JSP第一次运行时需要编译为Java类)

4.本机直接内存溢出

DirectMemory容量可以通过-XX:MaxDirectMemorySize指定,如果不指定,则默认与Java堆最大值(-Xmx )一样

 

	/**
	 * VM Args:-Xmx20M -XX:MaxDirectMemorySize=10M
	 * 
	 * @throws Exception
	 */
	public static void directMemoryOOM() throws Exception {
		Field unsafeField = Unsafe.class.getDeclaredFields()[0];
		unsafeField.setAccessible(true);
		Unsafe unsafe = (Unsafe) unsafeField.get(null);
		while (true) {
			unsafe.allocateMemory(1024 * 1024);
		}
	}
 
Exception in thread "main" java.lang.OutOfMemoryError
	at sun.misc.Unsafe.allocateMemory(Native Method)
	at com.lss.RuntimeConstantPoolOOM.directMemoryOOM(RuntimeConstantPoolOOM.java:43)
	at com.lss.RuntimeConstantPoolOOM.main(RuntimeConstantPoolOOM.java:27)
由DirectMemory导致的内存溢出,一个明显的特征是在Heap Dump文件中不会看见明显的异常,如果OOM后Dump文件很小,而程序中又直接或间接使用了NIO,那就可以考虑检查一下是不是这方面的原因。

 

 

你可能感兴趣的:(Java内存结构,对象创建步骤,对象访问定位,内存溢出,堆栈,读书笔记,jvm)