JVM系列知识

博客:http://www.cnblogs.com/redcreen/archive/2011/05/04/2036387.html

jvm系列知识汇总: https://mp.weixin.qq.com/s/M2IYpIjo02CvgMptvlUKZw

《深入理解java虚拟机》(精华):http://www.cnblogs.com/prayers/p/5515245.html

jvm调优:https://blog.csdn.net/wuzhilon88/article/details/49201891

软引用、弱引用,

1、虚拟机 

        所谓虚拟机,就是一套虚拟的机器。它是一款软件,用来执行一系列虚拟计算机指令,大体上虚拟机可以分为系统虚拟机和程序虚拟机,大名鼎鼎的Visual Box、Vmare就属于系统虚拟机,他们完全是对物理计算机的仿真,提供了一个可以运行完整操作系统的软件平台。程序虚拟机典型代表就是Java虚拟机,它专门为执行单个计算机程序而设计,在java虚拟机中执行的指令我们称为java字节码指令。无论是系统虚拟机还是程序虚拟机,在上面运行的软件都被限制于虚拟机提供的资源中。Java发展至今,出现过很多虚拟机,最初Unc使用的一款叫Classic的Java虚拟机,到现在引用最广泛的是HotSpot虚拟机,除了Sun以外,还有BEA的JRockit,目前JRocket和Hotspot都被Oracle收入旗下,大有整合的趋势。

 

2、基本概念

        类加载子系统:负责从文件系统或者网络中加载Class信息,加载的信息存放在一块称之为方法区的内存空间。(Class文件校验器、安全管理器、策略文件)

        方法区:就是存放类信息、常量信息、常量池信息、包括字符串字面量和数字常量等。(永久代和元空间:https://www.cnblogs.com/dennyzhangdd/p/6770188.html

        java堆:在java虚拟机启动的时候建立java堆,它是java程序最主要的内存工作区域,几乎所有的对象实例都存放到java堆中,堆空间是所有线程共性的,

        直接内存:java的NIO库允许java程序使用直接内存,从而提高性能,通常直接内存速度会优于java堆。读写频繁的场合可能会考虑使用。

        java栈:每个虚拟机线程都有一个私有的栈,一个线程的java栈在线程创建的时候会被创建,java栈中保存着局部变量、方法参数、同时还有java的方法调用、返回值等。

        本地方法栈:本地方法栈和java栈非常类似,最大不同为本地方法栈用于本地方法调用。java虚拟机允许java直接调用本地方法(通常使用C编写)。

        垃圾收集系统:java的核心,也是必不可少的,java有一套自己进行垃圾清理的机制,开发人员无需手工清理。

        PC(Program Counter)寄存器:每个线程私有的空间,java虚拟机会为每个线程创建PC寄存器,在任意时刻,一个java线程总是在执行一个方法,这个方法被称为当前方法,如果是本地方法,则PC寄存器值为undefined,寄存器存放如当前执行环境指针、程序技术群、操作栈指针、计算的变量指针等信息。

        执行引擎:它负责执行虚拟机的字节码。一般会先进行编译成机器码和执行。

 

3、堆、栈、方法区概念和联系

        堆解决的是数据存储的问题,即数据怎么放、放到哪儿。

        栈解决程序的运行问题,即程序如何执行,或者说如何处理数据。

        方法区则是辅助堆栈的块永久区(Perm),解决堆栈信息的产生,是先决条件。

        我们创建一个新的对象,User:那么User类的一些信息(类信息、静态信息都存在于方法区中)。而User类被实例化出来之后,被存储到java堆中,一块内存空间。当我们去使用的时候,都是使用User对象的引用,形如User user = new User(); 。这里的user就是存放在java栈中的,即User真实对象的一个引用。

 

4、辨清java堆

        java堆是和java应用程序关系最密切的内存空间,几乎所有的对象都存放在其中,并且java堆完全是自动化管理的,通过垃圾回收机制,垃圾对象会被自动清理,不需要显示的释放。

        根据垃圾回收机制不同,java堆有可能拥有不同的结构。最为常见的就是将整个java堆分为新生代和老年代,其中新生代存放新生的对象或者年龄不大的对象,老年代则存放老年对象。

        新生代分为eden区、s0区、s1区,s0和s1也被称为from和to区域,他们是两块大小相等并且可以互换角色的空间。

        绝大多数情况下,对象首先分配在eden区,在一次新生代回收后,如果对象还存活,则会进入s0和s1区,之后每经过一次新生代回收,如果对象存活则它的年龄就加1,当对象达到一定的年龄后,则进入老年代。

 

5、垃圾回收算法

        引用计数法:这是个比较古老而经典的垃圾收集算法,其核心就是在对象被其他所引用时,计数加1,而当引用失效时则减1,但是这种方式有非常严重的问题:无法处理循环引用的情况、还有就是每次进行加减操作比较浪费系统性能。

        标记清除法:就是分为标记和清除两个阶段进行处理内存中的对象,当然这种方式也有非常大的弊端,就是空间碎片问题,垃圾回收后的空间不是连续的,不连续的内存空间的工作效率要低于连续的内存空间。

        复制算法:其核心思想就是将内存空间分为两块,每次只使用其中一块,在垃圾回收时,将正在使用的内存中的存留对象复制到未被使用的内存块中去,之后去清除之前正在使用的内存中所有的对象,反复去交换两个内存的角色,完成垃圾收集。(java中新生代的from和to空间就是使用这个算法)

        标记整理(压缩)法:标记压缩法在标记清楚法基础之上做了优化,把存活的对象压缩到内存的一端(减少碎片的影响),而后进行垃圾清理。(java中老年代使用的就是标记整理(压缩)法)

        分代算法:就是根据对象的特点,把内存分成N块,而后根据每个内存的特点使用不同的算法。对于新生代和老年代来说,新生代回收频率很高,但是每次回收耗时都很短;而老老年代回收频率较低(老年代中的对象都是存活较久的对象),但是耗时会相对较长,所以应该尽量减少老年代的GC。

        分区算法:其主要就是将整个内存分为N多个独立空间,每个小空间都可以独立使用,这样细粒度的控制一次回收多少个小空间和哪些个小空间,而不是对整个空间进行GC,从而提升性能,并减少GC的停顿时间。

        可达性分析算法:Java通过这个算法发现垃圾,该方法的基本思想是通过一系列的“GC Roots”对象作为起点进行搜索,如果在“GC Roots”和一个对象之间没有可达路径,则称该对象是不可达的,不过要注意的是被判定为不可达的对象不一定就会成为可回收对象。被判定为不可达的对象要成为可回收对象必须至少经历两次标记过程,如果在这两次标记过程中仍然没有逃脱成为可回收对象的可能性,则基本上就真的成为可回收对象了。

 

6、java栈

        java栈是一块线程私有的内存空间,一个栈,一般由三部分组成:局部变量表、操作数栈和帧数据区。

        局部变量表:用于保存函数的参数及局部变量。

        操作数栈:主要保存计算过程的中间结果,同时作为计算过程中变量临时的存储空间。

        帧数据区:除了局部变量表和操作数栈以外,栈还需要一些数据来支持常量池的解析,这里帧数据区保存着访问常量池的指针,方便程序访问常量池,另外,当函数返回或者出现异常时,虚拟机必须有一个异常处理表,方便发送异常的时候找到异常的代码,因此异常处理表也是帧数据区的一部分。

   

7、java方法区

        java方法区和堆一样,方法区是一块所有线程共享的内存区域,它保存系统的类信息,比如类的字段,方法,常量池等。方法区的大小决定了系统可以保存多少个类,如果系统定义太多的类,导致方法区溢出。虚拟机同样会抛出内存溢出错误。方法区可以理解为永久区(Perm)。

 

8、虚拟机参数

        在虚拟机运行的过程中,如果可以根据系统的运行状态,那么对于问题的故障排查会有一定的帮助,为此,虚拟机提供了一些跟踪系统状态的参数,使用给定的参数执行java虚拟机,就可以在系统运行时打印相关日志,用于分析实际问题。我们进行虚拟机参数配置,其实主要是围绕着堆、栈、方法区进行配置。

        

9、堆分配参数

        -XX:+PrintGC   使用这个参数,虚拟机启动后,只要遇到GC就会打印日志

        -XX:UseSerialGC  配置串行回收器

        -XX:+PrintGCDetails  乐于查看详细信息,包括各个区的情况

        -Xms   设置java程序启动时初始化堆大小

        -Xmx   设置java程序能获得的最大堆大小

        -Xmx20m -Xms5m -XX:+PrintCommandLineFlags:   可以将隐式或者显示传给虚拟机的参数输出 

        在实际工作中,我们可以直接将初始的堆大小与最大堆大小设置相等,这样的好处是可以减少程序运行时的垃圾回收次数,从而提高性能。

 

        -Xmn    可以设置新生代的大小,设置一个比较大的新生代会减少老年代的大小,这个参数对系统性能以及GC行为有很大影响,新生代大小一般会设置整个堆空间的1/3到1/4左右。

        -XX:SurvivorRatio    用来设置新生代中eden空间和from/to空间的比例。(含义:-XX:SurvivorRatio=eden/from=eden/to)

        不同的堆分布情况,对系统执行会产生一定的影响,在实际工作中,应该根据系统的特定做成合理的配置。基本策略:尽可能将对象预留在新生代,减少老年代的GC次数。

        除了可以设置新生代的绝对大小(-Xmn),还可以使用(-XX:NewRatio)设置新生代和老年代的比例:-XX:NewRation=老年代/新生代

 

10、堆溢出处理

        在java程序的运行过程中,如果堆空间不足,则会抛出内存溢出的错误(Out of Memory)OOM,一旦这类问题发生在生产环境,可能引起严重的业务中断,java虚拟机提供了-XX:+HeapDumpOnOutOfMemoryError,使用该参数可以在内存溢出时导出整个堆信息,与之配合使用的还有参数-XX:HeapDumpPath,可以设置导出堆的存放路径。

        可以采用一些内存分析工具分析问题。如:Memory Analysizer

        各种java溢出:https://www.cnblogs.com/lin-xuan/p/5271354.html#_label4

 

11、栈配置

        java虚拟机提供了参数-Xss来指定线程的最大栈空间,整个参数也直接决定了函数可调用的最大深度。

 

12、方法区配置

        和java堆一样,方法区是一块所有线程共享的内存区域,它用于保存系统的类信息,方法区(永久区)可以保存多少信息可以对其进行配置,在默认情况下,-XX:MaxPermSize为64MB,如果系统运行时,生产大量的类,就需要设置一个相对适合的方法区,以免出现永久区内存溢出的问题。

        -XX:PermSize=64M    -XX:MaxPermSize=64M

 

13、直接内存配置

        直接内存也是java程序中非常重要的组成部分,特别是广泛用在NIO中,直接内存跳过了java堆,使java程序可以直接访问原生堆空间,因此在一定程度上加快了内存空间的访问速度。但是说直接内存一定就可以提高内存访问速度也不见得,具体情况具体分析。

        相关配置参数:-XX:MaxDirectMemorySize,如果不设置默认值为最大堆空间。即-Xmx。直接内存使用达到上限时。就会触发垃圾回收,如果不能有效的释放空间,也会引起系统的OOM。

                                  

14、Client和Server虚拟机工作模式

        目前java虚拟机支持Client和Server两种运行模式,使用参数-client可以指定使用Client模式,使用-server即使用Server模式。可以直接在命令行查看当前计算机系统自行选择的运行模式。java -version即可。

        二者区别:Client模式相对Server启动较快,如果不追求系统的长时间使用性能,仅仅是测试,可以使用Client模式。而Server模式则启动比较慢,原因是会对其进行复制的系统性能信息收集和使用更复制的算法对程序进优化。一般我们的生产环境都会使用Server模式,长期运行其性能远远快于Client模式

        JDK1.7后不提供Clent模式,64位的只支持Server模式

 

15、垃圾回收概念和其算法

        垃圾回收(Garbage Collection ,简称GC),GC中的垃圾,特指于内存中、不会再被使用的对象,而回收就是相当于把垃圾“倒掉”。垃圾回收有多种算法:如引用计数法、标记压缩法、复制算法、分代、分区的思想。java新生代采用的复制算法,老年代采用的标记压缩法。具体参考第5点

 

16、垃圾回收时的停顿现象

        垃圾回收器的任务是识别和回收垃圾对象进行内存清理,为了让垃圾回收器可以高效的执行,大部分情况下,会要求系统进入一个停顿的状态。停顿的目的是终止所有应用线程,只有这样系统才会有新的垃圾产生,同时停顿保证了系统状态在某一个瞬间的一致性,也有益于更好的标记删除对象。因此在垃圾回收时,都会产生应用程序的停顿。

 

17、对象如何进入老年代

        一般而言,对象首次创建会被放置在新生代的eden区,如果没有GC介入,则对象不会离开eden区,那么eden区的对象如何进入老年代呢?一般来讲,只要对象的年龄达到一定的大小,就会自动离开新生代进入老年代。对象年龄是由对象经历数次GC决定的,在新生代每次GC之后,如果对象没有被回收则年龄加1。虚拟机提供了个一个参数来控制新生代对象的最大年龄,当超过这个年龄范围就会晋升老年代

        -XX:MaxTenuringThreShold   默认情况下为15。

        根据MaxTenuringThreShold 参数,可以指定新生代对象经过多少次回收后进入老年代。另外,大对象(新生代eden区无法装入时,也会直接进入老年代)。JVM里提供了一个参数可以设置对象的大小超过指定的大小之后,直接晋升老年代。但是要注意,虚拟机对于体积不大的对象,会优先分配到TLAB区域,因此失去了在老年代分配的机会。

        -XX:PretenureSizeThreshold

 

18、TLAB

        TLAB全称是Thread Local Allocation Buffer,即线程本地分配缓存,从名字上看是一个线程专用的内存分配区域,是为了加速对象分配而生的。每一个线程都会产生一个TLAB,该线程独享的工作区域,java虚拟机使用这种TLAB区来避免线程冲突问题,提高了对象分配的效率。TLAB空间一般不会太大,当大对象无法在TLAB分配时,则会直接分配到堆上。

        -XX:+UseTLAB        使用TLAB

        -XX:+TLABSize        设置TLAB大小

        -XX:TLABRefillWasteFraction        设置维护进入TLAB空间的单个对象大小,它是一个比例值,默认64,即如果对象大于整个空间的1/64,则在堆创建对象。

        -XX:+PrintTLAB        查看TLAB信息

        -XX:+ResizeTLAB        自调整TLABRefillWasteFraction阈值。

 

19、对象创建流程

        一个对象创建在什么位置,jvm会有一个比较细节的流程,根据数据的大小,参数的设置,决定如何创建分配,以及其位置。

        首先,会尝试在栈上分配。如果失败,会尝试在TLAB分配。如果在TLAB分配失败,会去判断是否满足进入老年代的条件。如果不满足,则在eden分配。

 

20、垃圾收集器

        串行垃圾回收器

        并行垃圾回收器

        CMS回收器

        G1回收器

 

21、串行回收器

        串行回收器是指使用单线程进行垃圾回收的回收器。每次回收时,串行回收器只有一个工作线程,对于并行能力较弱的计算机来说,串行回收器的专注性和独占性往往有更好的性能表现。串行回收器可以在新生代和老年代使用,根据作用于不同的堆空间,分为新生代串行回收器和老年代串行回收器。

        使用-XX:+UseSerialGC参数可以设置使用新生代串行回收器和老年代串行回收器。

 

22、并行回收器(ParNew回收器)

        并行回收器在串行回收器基础上做了改进,它可以使用多个线程同时进行垃圾回收,对于计算能力强的计算机而言,可以有效的缩短垃圾回收所需的实际时间。

        ParNew回收器是一个工作在新生代的垃圾收集器,他只是简单的将串行回收器多线程化,他的回收策略和算法与串行回收器一样。

        使用-XX:+UseParNewGC  新生代ParNew回收器,老年代则使用串行回收器。

        ParNew回收器工作时的线程数量可以使用-XX:ParallelGCThreads参数指定,一般最好和计算机的cpu相当,避免过多的线程影响性能。

 

23、并行回收器(ParallelGC回收器)

        新生代ParallelGC回收器,使用了复制算法的收集器,也是多线程独占形式的收集器,但ParallelGC回收器有个非常重要的特点,就是它非常关注系统的吞吐量。

        提供了两个非常关键的参数控制系统的吞吐量

        -XX:MaxGCPauseMillis:设置最大垃圾收集停顿时间,可用把虚拟机在GC停顿的时间控制在MaxGCPauseMillis范围内,如果希望减少GC停顿时间,可以将MaxGCPauseMillis设置的很小,但是会导致GC频繁,从而增加了GC的总时间,降低了吞吐量。所以需要根据实际情况设置该值。

        -XX:GCTimeRatio:设置吞吐量大小,它是一个0到100之间的整数,默认情况下他的取值是99,那么系统将花费不超过1/(1+n)的时间用于垃圾回收,也就是1/(1+99)=1%的时间。

        另外还可以指定-XX:+UseAdaptiveSizePolicy打开自适应模式,在这种模式下,新生代的大小、eden、from/to的比例,以及晋升老年代的对象年龄参数会被自动调整,以达到在堆大小、吞吐量和停顿时间之间的平衡点。

 

24、并行回收器(ParallelOldGC回收器)

        老年代ParallelOldGC回收器也是一种多线程的回收器,和新生代的ParallelGC回收器一样,也是一种关注吞吐量的回收器,他使用了标记整理(压缩)算法进行实现。

        -XX:+UseParallelOldGC    进行设置

        -XX:+ParallelGCThreads   也可以设置垃圾收集时的线程数量。

 

25、CMS回收器(当前使用的最多)

        CMS全称为:Concurrent Mark Sweep  意为并发标记清除,他使用的标记清除法,主要关注系统停顿时间。

        使用 -XX:+UseConcMarkSweepGC进行设置。

        使用 -XX:+ConcGCThreads设置并发线程数量。

        CMS并不是独占的回收器,也就说CMS回收的过程中,应用程序仍然在不停的工作,又会有新的垃圾不断的产生,所以在使用CMS的过程中。应该确保应用程序的内存足够可用。CMS不会等到应用程序饱和的时候才去回收垃圾,而是在某一阈值的时候开始回收,回收阈值可用指定的参数进行设置,-XX:CMSInitiatingOccupancyFraction来指定,默认为68,也就是说当老年代的空间使用率达到68%的时候,会执行CMS回收。如果内存使用率增长的很快,在CMS执行的过程中,已经出现了内存不足的情况,此时CMS回收就会失败,虚拟机将启动老年代串行回收器进行垃圾回收,这会导致应用程序中断,直到垃圾回收完成后才会正常工作,这个过程GC的停顿时间可能比较长,所以-XX:CMSInitiatingOccupancyFraction的设置要根据实际的情况。

        标记清楚法有个缺点就是存在内存碎片的问题,那么CMS有个参数设置-XX:+UseCMSCompactAtFullCollection可以使CMS回收完成之后进行一次碎片整理,-XX:CMSFullGCsBeforeCompaction 参数可以设置进行多次CMS回收之后,对内存进行一次压缩。

 

26、G1回收器

        G1回收器(Garbage-First)是在JDK1.7中提出的垃圾回收器,从长期目标来看是为了取代CMS回收器,G1回收器拥有独特的垃圾回收策略,G1属于分代垃圾回收器,区分新生代和老年代,依然有eden区和from/to区,它并不要求整个eden区或者新生代、老年代的空间都继续,它使用了分区算法。

        并行性:G1回收期间可多线程同时工作。

        并发性:G1拥有与应用程序交替执行能力,部分工作可与应用程序同时执行,在整个GC期间不完全阻塞应用程序。

        分代GC:G1依然是一个分代的收集器,但是它是兼顾新生代和老年代一起工作,之前的垃圾收集器,它们或者在新生代工作,或者在老年代工作,因此这是一个很大的不同

        空间整理:G1在回收过程中,不会像CMS那样在若干次GC后需要进行碎片整理,G1采用了有效复制对象的方式,减少空间碎片。

        可预见性:由于分区的原因,G1可以只选取部分区域进行回收,缩小了回收的范围,提升了性能。

        使用-XX:+UseG1GC        应用G1收集器

        使用-XX:MaxGcPauseMillis        指定最大停顿时间

        使用-XX:ParallelGCThreads        设置并行回收的线程数量

        

27、JDK命令行工具

        jps、jstat、jinfo、jmap、jhat、jstack、Greys

 

28、FullGC问题排查

 

 

 

 

        

 

 

你可能感兴趣的:(java)