五、JVM从入门到精通之运行时数据区分析(篇二)

前言

上一篇中我们将运行时数据区的PC寄存器及栈空间做了详细的讲解说明,接下来我们会对运行时数据区的其他部分进行剖析说明,Are you ready?
go!

一、本地方法栈

五、JVM从入门到精通之运行时数据区分析(篇二)_第1张图片

1.1 什么是本地方法?

简单的讲,一个Native Method就是一个Java调用非Java代码的接口。一个Native Method是这样的一个方法:该方法的实现由非Java语言实现,比如C。这个特征并非Java特有,很多其他的编程语言都有这一机制,比如C++中,你可用 extern “c"告知C++编译器去调用一个C的函数。

本地接口的作用是融合不同的编程语言为Java所用,他的初衷是融合C/C++程序。

1.2 为什么要使用Native Method?

Java 使用起来非常方便,然后有些层次的任务用Java实现起来不容易,或者我们对程序的效率很在意时,问题就来了。

1、与Java 环境外交互

有时Java应用需要与Java外面的环境交互,这是本地方法存在的主要原因。
你可以想想Java需要与一些底层系统,如操作系统或某些硬件交换信息时的情况。本地方法正是这样一种交流机制:它为我们提供了一个非常简洁的接口,而且我们无需去了解Java应用之外繁琐的细节。

2、与操作系统交互
JVM支持着Java语言本身和运行时库,它是Java程序赖以生存的平台,它由一个解释器(解释字节码)和一些连接到本地代码库组成。然而不管怎样,它毕竟不是一个完整的系统,它经常依赖于一些底层系统的支持,。这些底层系统常常是强大的操作系统。通过使用本地方法,我们得以用Java实现了jre的与底层系统的交互,甚至JVM的一些部分就是用C写的。还有,如果我们要使用一些Java语言本身没有提供封装的操作系统的特性时,我们也需要使用本地方法。

3、Sun^s Java

Sun的解释器是用C实现的,这使得它能像一些普通的C一样与外部交互,jre大部分是用java实现的,它也通过一些本地方法与外界交互,例如:类Java.lang.Thread的setPriority()方法就是Java实现的,但是它实现调用的是该类里的本地方法setPriority0()。这个本地方法是用c实现的,并被植入JVM内部,在Windows 95的平台上,这个本地方法最终将调用Win32 SetPriority()API.这是一个本地方法的具体实现由JVM直接提供,更多的情况是本地方法由外部的动态链接库(external dynamic link libiary)提供,然后被JVM调用

1.3 现状

目前该方法的调用的越来越少了,除非是与硬件有关的应用,比如通过Java程序驱动打印机或者Java系统管理设备,在企业级应用中已经比较少见。因为现在的异构领域间的通信很发达,比如可以使用Socket通信,也可以使用Web Service等等,不多做介绍。

1.4 本地方法栈(Native Method Stack)

五、JVM从入门到精通之运行时数据区分析(篇二)_第2张图片

Java虚拟机栈用于管理Java方法的调用,而本地方法栈是用于管理本地方法的调用。

  • 本地方法栈,也是线程私有的。
  • 允许被实现成固定或者是可动态扩展的内存大小。(在内存溢出方面是相同的)
    1、如果线程请求分配的栈容量超过本地放发展允许的最大容量,Java虚拟机将会抛出一个StackOverflowError异常。
    2、 如果本地方法可以动态扩展,并且在尝试扩展的时候无法申请到足够的内存,或者在创建新的线程时没有足够的内存去创建对应的本地方法栈,那么Java虚拟机将会抛出一个OutofMemoryError异常。
  • 本地方法是使用C语言实现的
  • 他的具体做法是Native Method Stack中登记native方法,在Execution Engine执行时加载本地方法库。

本地方法可以通过本地接口来访问虚拟机内部的运行时数据区。
它甚至可以直接使用本地处理器中的寄存器
直接从本地内存的堆中分配任意数量的内存。

并不是所有的JVM都支持本地方法,因为Java虚拟机规范并没有明确要求本地方法栈的使用语言】具体实现方式。数据结构等,如果JVM产品不打算支持native方法,也可以无需实现本地方法栈。

二、堆

没错 大家最关心的环节来了,那就是 ------堆: boom: 它来了

五、JVM从入门到精通之运行时数据区分析(篇二)_第3张图片

一个运行的JVM实例就是一个进程(几个并发运行的程序就需要几个进程也就是几个JVM实例),一个进程中包含一个方法区、堆以及多个线程,而每个线程拥有自己的虚拟机栈、本地方法栈、PC寄存器

2.1 堆的核心概述

  • 一个JVM实例只存在一个堆内存,堆也是Java内存管理的核心区域。
  • Java 堆区在JVM启动的时候即被创建,其空间大小也就确定了。是JVM管理的最大一块内存空间。
    堆内存的大小是可以调节的
    -《Java虚拟机规范》规定,堆可以处于 物理机上不连续的内存空间中,但在逻辑上它应该被视为连续的
  • 所有的线程共享Java堆,在这里还可以划分线程私有的缓冲区(Thread Local Allocation Buffer,TLAB).
  • 《Java虚拟机规范》中对Java堆的描述是:所有的对象实例以及数组都应该在运行时分配在堆上。
    “几乎”所有的对象实例都在这里分配内存,从实际使用角度看的
  • 数组和对象可能永远不会存储在栈上,因为栈帧中保存引用,这个引用指向对象或者数组在堆中的位置。
  • 在方法结束后,堆中的对象不会马上被移除,仅仅在垃圾收集的时候才会被移除。
  • 堆,是GC(Garbage Collection,垃圾收集器)执行垃圾回收的重点区域。

五、JVM从入门到精通之运行时数据区分析(篇二)_第4张图片

2.2 堆的细分内存结构

五、JVM从入门到精通之运行时数据区分析(篇二)_第5张图片

现代垃圾回收器大部分都基于分代收集器理论设计,堆空间细分为:

  • Java7及之前堆内存逻辑上分为三部分:新生代+老年代+永久区
  • Java 8及以后堆内存逻辑上分为三部分:新生代+老年代+元空间

约定:
新生代=新生区=年轻代
养老区=老年区=老年代
永久区=永久代

2.3 如何利用Java VisualVM 观察堆的划分结构

1、当配好jdk的环境变量后在cmd命令中输入 jvisualvm 命令打开 Java VisualVM工具
五、JVM从入门到精通之运行时数据区分析(篇二)_第6张图片
2、打开后的界面如下
五、JVM从入门到精通之运行时数据区分析(篇二)_第7张图片
3、接下来可以安装相关插件,例如Visual GC
网址:Java VisualVM 下载插件网址链接
五、JVM从入门到精通之运行时数据区分析(篇二)_第8张图片
五、JVM从入门到精通之运行时数据区分析(篇二)_第9张图片
五、JVM从入门到精通之运行时数据区分析(篇二)_第10张图片

4、最后选择安装即可

5、查看堆的详细情况
五、JVM从入门到精通之运行时数据区分析(篇二)_第11张图片

2.4 堆空间大小的设置

  • Java堆区用于存储Java对象实例,那么堆的大小在JVM启动时就已经设定好了,大家可以通过选项“-Xmx"和”-Xms"来进行设置

"-Xms”用于表示堆区的起始内存,等价于-XX:InitialHeapSize

"-Xmx"用于表示堆区的最大内存,等价于-XX:MaxHeapSize

  • 一旦堆区中的内存大小超过“-Xmx"所指定的最大内存时,将会抛出OutOfMemoryError异常。
  • 通常会将-Xms和-Xmx两个参数配置相同的值,其目的是为了能够在java垃圾回收机制清理完堆区后不需要重新分隔计算堆区的大小,从而提高性能。

默认情况下
初始内存大小:物理电脑内存大小/64
最大内存大小:无力电脑内存大小/4

2.5 堆中的年轻代与老年代

  • 存储在JVM中的Java对象可以被划分为两类:
    一类是生命周期较短的瞬时对象,这类对象的创建和消亡都非常迅速
    另外一类对象的生命周期却非常长,在某些极端的情况下还能够与JVM的生命周期保持一致。

  • Java堆区进一步细分的话,可以划分为年轻代(YoungGen)和老年代(OldGen)

  • 其中年轻代又可以划分为Eden空间、Survior0空间和Survivor1空间(有时也叫做from区、to区)。

五、JVM从入门到精通之运行时数据区分析(篇二)_第12张图片
下面这些参数开发中一般不会调:
五、JVM从入门到精通之运行时数据区分析(篇二)_第13张图片

  • 配置新生代与老年代在堆结构的占比:
    默认-XX:NewRatio=2,表示新生代占1,老年代占2,新生代占整个堆的1/3
    可以修改-XX:NewRatio=4,表示新生代占1,老年代占4,新生代占整个堆的1/5

  • 在HotSpot中,Eden空间和另外两个SURVIVOR空间所占比例是8:1:1,当然开发人员可以通过选项‘-XX:SurvivorRatio"调整这个空间比例。比例如:-XX:SurvivorRatio=8

几乎所有的Java对象都是在Eden区被new出来的。
绝大部分的Java对象的销毁都在新生代进行了
IBM公司专门研究表明,新生代中80%的对象都是“朝生夕死“的。

2.6 图解对象分配的一般过程

为新对象分配内存是一件非常严谨和复杂的任务,JVM的设计者们不仅需要考虑内存如何分配、在哪里分配等问题,。并且由于内存分配算法与内存回收算法密切相关,所以还需要考虑GC执行完内存回收后是否会在内存空间中产生内存碎片。
五、JVM从入门到精通之运行时数据区分析(篇二)_第14张图片

步骤:

  • new 的对象先放伊甸园区,此区有大小限制。
  • 当伊甸园的空间填满时,程序又需要创建对象,JVM的垃圾回收器将对伊甸园区进行垃圾回收(Minor GC),将伊甸园区中的不再被其他对象所引用的对象进行销毁。再加载新的对象放到伊甸园区
  • 然后将伊甸园中的剩余对象移动到幸存者0区
  • 如果再次触发垃圾回收,此时上次幸存下来的放到幸存者0区的,如果没有回收,就会放到幸存者1区
  • 如果再次经历垃圾回收,此时会重新放回到幸存者0区,接着再去幸存者1区。
  • 啥时候能去养老去呢?可以设置次数,默认是15次。可以设置参数:-XX:MaxTenuringThreshold=进行设置。

  • 总结:

    针对幸存者S0,S1区的总结:复制之后有交换,谁空谁是to区
    关于垃圾回收:频繁在新生区收集,很少在养老区收集,几乎不在永久区/元空间收集。

    2.7 对象分配的特殊情况

  • 新对象申请内存空间时,如果Eden区放的下,就会放在Eden区中,如果放不下就发生YGC/MinorGC,发生YGC的同时,因为有幸存的对象要放到幸存区(Servivor)中,所以还需要判断Servivor是否放的下,放的下就放到S0/S1区域,放不下就晋升老年代
  • 发生YGC/MinorGC后再次判断是否Eden放的下?是就放在Eden区中,否则判断老年代是否放的下,放得下就放到老年代中(如果对象是超大对象,直接放到老年代中),放不下老年代发生FGC
  • FGC后如果还是放不下就抛出OOM异常
  • 五、JVM从入门到精通之运行时数据区分析(篇二)_第15张图片

    重点:

    1、当发生YGC/MinorGC时,不仅Eden区会发生垃圾回收,幸存区也会发生垃圾回收
    2、如果创建的对象过大,就可能直接放到老年代中
    3、当对象存活的次数超过阈值时,也会放入到老年代

    三、Minor GC、Major GC、Full GC

    JVM在进行GC时,并非每次都对上面三个内存(新生 代、老年代;方法区)区域一起回收的,大部分时候回收的都是指新生代。
    针对HotSpot VM的实现,它里面的GC按照回收区域又分为两大种类型;一种是部分收集(Partial GC),一种是整堆收集(Full GC)

    • 部分收集:不是完整收集整个Java堆的垃圾收集。其中又分为:
      新生代收集(Minor GC):只是新生代(Eden/s0,s1)的垃圾收集
      老年代收集(Maror GC/Old GC):只是老年代的垃圾收集。目前,只有CMS GC 会有单独收集老年代的行为。注意,很多时候Major GC会和Full GC 混合使用,需要具体分辨是老年代回收还是整堆回收。
      混合收集(Mixed GC):收集整个新生代以及部分老年代的垃圾收集。目前,只有G1 GC会有这种行为
      整堆收集(Full GC):收集整个java堆和方法区的垃圾收集。

    3.1 年轻代GC(Minor GC)触发机制:

  • 当年轻代空间不足时,就会触发Minor GC,这里的年轻代满指的是Ede区满,Survicor满不会引发。每次(Minor GC会清理年轻代的内存。)
  • 因为Java 对象大多都具备朝生夕灭的特性,所以Minor GC 非常频繁,一般回收速度也比较快,这一定义既清晰又易于理解。
  • Minor GC会引发STW,暂停其他用户的线程,等垃圾回收结束,用户线程才恢复运行。

  • 3.2 Major GC/Full GC 老年代GC触发机制

    老年代GC(Major GC/Full GC)触发机制:

  • 指发生在老年代的GC,对象从老年代消失时,我们说“Major GC”或“Full GC"发生了
  • 出现了Major GC',经常会伴随至少一次的Minor GC (但非绝对的,在parallel Scavenge收集器的收集策略里就有直接进行Major GC的策略选择过程)。
  • 也就是在老年代空间不足时,会先尝试触发Minor GC如果之后空间还不足,则触发Major GC

  • Major GC的速度一般会比Minor GC慢10倍以上,STW的时间更长。
  • 如果Major GC后,内存还不足,就OOM了。
  • 3.3 Full GC触发机制(后面会细讲)

    触发Full GC 的情况有下面五种:

  • 1、调用System.gc()时,系统建议执行full gc,但是不必然执行
  • 2、老年代空间不足
  • 3、方法区空间不足
  • 4、通过Minor gc后进入老年代的平均大小大于老年代的可用内存
  • 5、由Eden区、survivor space0(from space)区向survivor space1(to space)区复制时,对象大小大于To Space 可用内存,则把该对象转存到老年代,且老年代的可用内存小于该对象大小
  • full gc 是开发中或调优中尽量要避免的。这样暂停时间会短一些。

    3.4 为什么要对堆进行分代(分区)?

    经研究,不同对象的生命周期不同,70%-99%的对象是临时对象。

  • 新生代:有Eden、两块大小相同的Survivor(又称为from/to,so/s1)构成,to总为空
  • 老年代:存放新生代中经历多次GC仍然存活的对象。
  • 其实不分代完全可以,分代的唯一理由就是优化GC性能。如果没有分代,那么所有的对象都在一块,GC的时候要找到那些对象没用,一些长久存在的每次都会经过扫描,比较影响效率。

    3.5 对象内存分配策略

    3.5.1 针对不同年龄段的对象分配原则如下所示:

  • 优先分配到Eden
  • 大对象直接分配到老年代
  • 尽量避免程序中出现过多的大对象

  • 长期存活的对象分配到老年代
  • 动态对象年龄判断
  • 如果Survivor区中相同年龄的所有对象大小的总和大于Survivor空间的一半,年龄大于或等于该年龄的对象可以直接进入老年代,无须等到MaxTenuringThreshold中要求的年龄。

  • 空间分配担保
  • -XX:HandlePromotionFailure

    3.5.2 堆是分配对象存储的唯一选择吗?

    在《深入理解Java虚拟机》中关于Java堆内存有这样一段描述:
    随着JIT编译期的发展与逃逸分析技术逐渐成熟,栈上分配、标量替换优化技术将会导致一些微妙的变化,所有的对象都分配到堆上也渐渐变得不那么“绝对”了。
    在Java虚拟机中,对象是在Java堆中分配内存的,这是一个普遍的常识。但是,有一种特殊情况,那就是如果经过逃逸分析(Escape Analysis)后发现,一个对象并没有逃逸出方法的话,那么就可能被优化成栈上分配。这样就无需在堆上分配内存,也无须’进行垃圾回收了。这也是最常见的堆外存储技术。
    此外,前面提到的基于openJDK深度定制的TaoBaoVM,其中创新的GCIH (Gc
    invisible heap)技术实现off-heap,将生命周期较长的Java对象从heap中移至heap外,并且Gc不能管理ccIH内部的Java对象,以此达到降低Gc的回收频率和提升Gc的回收效率的目的。

    3.5.3 逃逸分析概述

    • 如何将堆上的对象分配到栈,需要使用逃逸分析手段,这是一种可以有效减少Java程序中同步负载和内存堆分配压力的跨函数全局数据流分析算法。

    • 通过逃逸分析,Java HotSpot编译器能够分析出一个新的对象的引用的使用范围从而决定是否要将这个对象分配到堆上。

    • 逃逸分析的基本行为就是分析对象动态作用域:
      当一个对象在方法中被定义后,对象只在方法内部使用,则认为没有发生逃逸。
      当一个对象在方法中被定义后,它被外部方法所引用,则认为发生逃逸。例如作为调用参数传递到其他地方中。

    package com.jvmTest.userClassLoader;
    
    /*
    * 如何快速的判断是否发生了逃逸分析;
    * 大家就看new的对象实体是否有可能在方法外被调用。
    * */
    public class EscapeAnalysis {
    
        public EscapeAnalysis obj;
    
        //方法返回EscapeAnalysis对象,发生逃逸
        public EscapeAnalysis getInstance(){
            return obj==null?new EscapeAnalysis():obj;
        }
    
        //为成员属性赋值,发生逃逸
        public  void setObj(){
            this.obj=new EscapeAnalysis();
        }
    
        //对象的作用域仅在当前方法中有效,没有发生逃逸
        public void UseEscapeAnalysis(){
            EscapeAnalysis e=new EscapeAnalysis();
        }
        
        //引用成员变量的值,发生逃逸
        public void useEscapeAnalysis1(){
            EscapeAnalysis e=getInstance();
        }
    
    }
    

    五、JVM从入门到精通之运行时数据区分析(篇二)_第16张图片

    注意我们说判断逃逸分析是以对象实体来说的,不要判断成了对象引用了哦

    3.6 为什么有TLAB(Thread Local Allocation Buffer )?


    TLAB(Thread Local Allocation Buffer ) 译为:缓冲区

  • 堆区是线程共享区域,任何线程都可以访问堆区中的共享数据
  • 由于对象实例的创建在JVM中非常频繁,因此在并发环境下从堆区中划分内存空间是线程不安全的
  • 为避免多个线程操作同一地址,需要使用加锁等机制,进而影响分配速度。
  • 3.6.1 什么是TLAB?

    • 从内存模型而不是垃圾收集的角度,对Eden区域继续进行划分,JVM为每个线程分配了一个私有缓存区域,他包含在Eden空间内
    • 多线程同时分配内存时,使用TALB可以避免一系列的非线程安全问题,同时还能够提升内存分配的吞吐量,因此我们可以将这种内存分配方式称之为快速分配策略
    • 据我所知所有OpenJDK衍生出来的JVM都提供了TLAB的设计。

    3.6.2 TLAB的再说明

    • 尽管不是所有的对象实例都能够在TLAB中成功分配内存,但JVM确实是将TLAB作为内存分配的首选。
    • 在程序中,开发人员可以通过选项”-XX:UserTLAB"设置是否开启TLAB空间。
    • 默认情况下,TLAB空间的内存非常小,仅占用整个Eden空间的1%,当然我们可以通过选项“-XX:TLABWasteTargetPercent"设置TLAB空间所占用Eden空间的百分比大小。
    • 一旦对象在TLAB空间分配内存失败时,JVM就会尝试着通过使用加锁机制确保数据操作的原子性,从而直接在Eden空间中分配内存。

    四、堆空间的参数设置

    官网参考链接:https://docs.oracle.com/javase/8/docs/technotes/tools/unix/java.html

    堆空间常用的jvm参数:

    • XX:+PrintFlagsInitial :查看所有的参数的默认初始值
    • -XX:+PrintFlagsFinal:查看所有的参数的最终值
    • -Xms: 初始值堆空间内存(默认为物理内存的1/64)
    • -Xmx:最大堆空间内存(默认为无力内存的1/4)
    • -Xmn:设置新生代的大小。(初始值及最大值)
    • -XX:NewRatio:配置新生代与老生代在堆结构的占比
    • -XX:SurvivorRatio:设置新生代中Eden和S0/S1的空间比例
    • -XX:MaxTenuringThreadshold: 设置新生代垃圾的最大年龄
    • -XX:+PrintGCDetails:输出详细的GC处理日志

    多个设置之间用空格隔开

    好了到此,我们本篇就把运行时数据区的本地方法栈和堆的情况讲解完了,下篇我们就将讲解运行时数据区的剩余部分,方法区的情况以及代码优化,记得关注点赞哦

    推荐阅读

    上一篇:四、JVM从入门到精通之运行时数据区分析(篇一)

    下一篇:六、JVM从入门到精通之运行时数据区分析(篇三)

你可能感兴趣的:(JVM从入门到精通,jvm,虚拟机,运行时数据区)