《深入理解Java虚拟机》-1-Java内存区域与内存溢出异常

刚工作的时候,Leader跟我说:你现在只知道写业务代码,但不了解自己的JVM运行情况,怎么去调优,怎么去排查故障。只有真正了解掌控JVM,才能称为一个真正的Java专家。《深入理解Java虚拟机》这本书,是介绍JVM知识的一本十分难得的书,值得去反复阅读、揣摩、反思。这个系列的文章,是我在阅读这本书的过程中的点滴笔记,如果喜欢,请更多支持原书作者出版的图书。同时,如果喜欢本文,请给与多多支持。

1.概述

对于C、C++开发人员来说,在内存管理方面,拥有对每个对象的绝对控制能力,从对象的产生到终结,承担着全部责任。

对于Java开发人员来说,在虚拟机的帮助下,不需要为每个对象去写删除释放方法,不容易出现内存泄露和内存溢出的问题。不过,正是由于太过依赖于JVM,一旦出现内存泄露和内存溢出的问题,排查错误将会是一件很难的工作。

2.运行时数据区域

Java虚拟机在执行Java程序的过程中会把它管理的内存划为若干个不同的数据区域。

《深入理解Java虚拟机》-1-Java内存区域与内存溢出异常_第1张图片
Java虚拟机运行时数据区

2.1 程序计数器

程序计数器:一块较小的内存空间,可以看作是当前线程所执行的字节码的行号指示器。每条线程都需要有一个独立的程序计数器。

在JVM的概念模型中,字节码解释器工作时,通过改变这个计数器的值来选取下一条需要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。

如果线程正在执行的是一个Java方法,计数器记录的值是正在执行的虚拟机字节码指令的地址;如果正在执行的是一个Native方法,计数器记录的值为空。

Tip: 此内存区域是唯一一个在Java虚拟机规范中没有规定任何OutOfMemeoryError情况的区域。

2.2 Java虚拟机栈

Java虚拟机栈:每个Java方法在执行的同时都会创建一个栈帧(Stack Frame)用于存储局部变量表、操作数栈、动态链接、方法出口等信息。每个方法从调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。

经常有人把Java内存区分为堆内存(Heap)和栈内存(Stack),这种分法比较粗糙。实际上,“栈”实际就是虚拟机栈,或者说虚拟机栈中的局部变量表部分。

局部变量表存放了编译期可知的各种基本数据类型(boolean、byte、char、short、int、float、long、double)、对象引用(一个指向对象起始地址的引用指针,或一个代表对象的句柄或其他与此对象相关的位置)和returnAddress类型(指向一条字节码指令的地址)。

Tip:在Java虚拟机规范中,对这个区域规定了两种异常状况:
如果线程请求的栈深度大于虚拟机允许的深度,则抛出StackOverflowError异常;
如果虚拟机栈可动态扩展,如果扩展时无法申请到足够的内存,则抛出OutOfMemoryError异常。

2.3 本地方法栈

本地方法栈:与虚拟机栈所发挥的作用非常相似,区别在于 虚拟机栈为虚拟机执行Java方法服务,而本地方法栈则为虚拟机使用到的Native方法服务。与虚拟机栈一样,本地方法栈区域也会抛出StackOverflowError和OutOfMemoryError异常。

2.4 Java堆

Java堆:被所有线程共享的一块内存区域,在虚拟机启动时创建。此内存区域的唯一目的就是存放对象实例,几乎所有对象实例都是在这里分配内存。

Java堆是垃圾收集器管理的主要区域,因此也成为GC堆。

从内存回收角度来看,Java堆可以细分为:新生代和老年代;再细致些有Eden空间、From Survivor空间、To Survivor空间等。

从内存分配角度来看,线程共享的Java堆可能划分出多个线程私有的分配缓冲区(TLAB)。

Tip:如果在堆中没有内存完成实例分配,并且堆也无法再扩展时,将会抛出OutOfMemoryError异常。可以通过-Xmx和-Xms来控制堆大小。

2.5 方法区

方法区:线程共享的内存区域,用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。

这个区域的内存回收目标主要是针对常量池的回收和对类型的卸载,一般来说,这个区域的回收成绩比较难以令人满意。

根据Java虚拟机规范的规定,当方法区无法满足内存分配需求时,将会抛出OutOfMemoryError异常。

2.6 运行时常量池

运行时常量池:是方法区的一部分。Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池,用于存放编译期生成的各种字面量和符号引用,这部分内容将在类加载后进入方法区的运行时常量池中存放。

2.7 直接内存

直接内存:并不是虚拟机运行时数据区的一部分,也不是Java虚拟机规范中定义的内存区域。但是这部分内存也被频繁地使用,也可能导致OutOfMemoryError异常出现。

在JDK 1.4 中新加入了NIO类,引入了一种基于通道(Channel)与缓存区(Buffer)的I/O方式,可以使用Native函数库直接分配堆外内存,然后通过一个存储在Java堆中的DirectByteBuffer对象作为这块内存的引用进行操作,这样避免了在Java堆和Native堆中来回复制数据。

Tip:若忽略直接内存的限制,导致各个内存区域总和大于物理内存限制,会导致动态扩展时出现OutOfMemoryError异常。

3.虚拟机对象探秘

3.1 对象的创建

在语言层面上,创建对象通常仅仅是一个new操作而已;但是在虚拟机中,对象的创建是一个复杂的过程。

  • A. 虚拟机遇到一条new指令时,首先将去检查这个指令的参数是否能在常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已被加载、解析和初始化过。如果没有,则先执行相应的类加载过程。

  • B. 在类加载检查通过后,接下来虚拟机将为新生对象分配内存。
    在使用Serial、ParNew等带Compact过程的收集器时,系统采用的分配算法是 指针碰撞
    在使用CMS这种基于Mark-Sweep算法的收集器时,通常采用 空闲列表

  • C. 内存分配完成后,虚拟机需要将分配到的内存空间都初始化为零值。

  • D. 虚拟机要对对象进行必要的设值,例如这个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的GC分代年龄等信息。这些信息存放在对象的对象头之中。

  • E. 执行new指令之后会接着执行方法,把对象按照程序员的意愿进行初始化,这样一个真正可用的对象才算完全产生出来。

3.2 对象的内存布局

在HotSpot虚拟机中,对象在内存中存储的布局可以分为3块区域:对象头(Header)、实例数据(Instance Data)和对齐填充(Padding)。

  • A. 对象头:包含两部分信息,第一部分用于存储对象自身的运行时数据,如哈希码、GC分代年龄、锁状态标志、线程持有的锁、偏移线程ID、偏向时间戳等;另一部分是类型指针,即对象指向它的类元数据的指针,虚拟机通过这个指针来确定这个对象是哪个类的实例。

  • B. 实例数据:对象真正存储的有效信息,也是在程序代码中所定义的各种类型的字段内容。这部分的存储顺序会收到虚拟机分配策略参数和字段在Java源代码中定义顺序的影响。HotSpot虚拟机默认的分配策略为longs/doubles、ints、shorts/chars、bytes/booleans、oops(Ordinary Object Pointers),相同宽度的字段总是被分配到一起。

  • C. 对齐填充:并不是必然存在。对象的大小必须是8字节的整数倍,当对象实例数据部分没有对齐时,就需要通过对齐填充来补全。

3.3 对象的访问定位

Java程序需要通过栈上的reference数据来操作堆上的具体对象

目前主流的访问方式有使用句柄和直接指针两种:

  • A. 若使用句柄访问,Java堆中将会划分出一块内存来作为句柄池,reference中存储的就是对象的句柄地址,而句柄中包含了对象实例数据与类型数据各自的具体地址信息。
《深入理解Java虚拟机》-1-Java内存区域与内存溢出异常_第2张图片
通过句柄访问对象
  • B. 若使用直接指针访问,Java堆对象的布局中就必须考虑如何放置访问类型数据的相关信息,而reference中存储的直接就是对象地址。
《深入理解Java虚拟机》-1-Java内存区域与内存溢出异常_第3张图片
通过直接指针访问对象

你可能感兴趣的:(《深入理解Java虚拟机》-1-Java内存区域与内存溢出异常)