垃圾收集机制(GC是在什么时候,对什么东西,做了什么事情?)
是什么时候?
1)系统空闲的时候;2)系统自身决定,不可预测的时间/调用System.gc()的时候;3)能说出新生代、老年代结构,能提出minor gc/full gc。
对什么东西?
1)不使用的对象;2)超出作用域的对象;3)从gc root开始搜索,搜索不到的对象。
做什么事情?
1)删除不使用的对象,腾出内存空间。
垃圾收集算法,各自特点?
标记-清除算法
最基础的算法,分标记和清除两个阶段:首先标记处所需要回收的对象,在标记完成后统一回收所有被标记的对象。
两点不足:一个效率问题,标记和清除过程都效率不高;一个是空间问题,标记清除之后会产生大量不连续的内存碎片(类似于我们电脑的磁盘碎片),空间碎片太多导致需要分配大对象时无法找到足够的连续内存而不得不提前触发另一次垃圾回收动作。
特点:可回收对象直接被清除,留下内存碎片。
复制算法
为了解决效率问题,出现了“复制”算法,他将可用内存按容量划分为大小相等的两块,每次只需要使用其中一块。当一块内存用完了,将还存活的对象复制到另一块上面,然后再把刚刚用完的内存空间一次清理掉。这样就解决了内存碎片问题,但是代价就是可以用内容就缩小为原来的一半。
特点:解决了碎片问题,但是内存利用率低。
标记-整理算法
复制算法在对象存活率较高时就会进行频繁的复制操作,效率将降低。因此又有了标记-整理算法,标记过程同标记-清除算法,但是在后续步骤不是直接对对象进行清理,而是让所有存活的对象都向一侧移动,然后直接清理掉端边界以外的内存。
特点:解决了碎片问题。
分代收集算法
当前商业虚拟机的GC都是采用分代收集算法,这种算法并没有什么新的思想,而是根据对象存活周期的不同将堆分为:新生代和老年代,方法区称为永久代。(在新的版本中已经将永久代废弃,引入了元空间的概念,永久代使用的是JVM内存而元空间直接使用物理内存)这样就可以根据各个年代的特点采用不同的收集算法。
新生代中的对象“朝生夕死”,每次GC时都会有大量对象死去,少量存活,使用复制算法。新生代又分为Eden区和Survivor区(Survivor from、Survivor to),大小比例默认为8:1:1。
老年代中的对象因为对象存活率高、没有额外空间进行分配担保,就使用标记-清除或标记-整理算法。
新产生的对象优先进去Eden区,当Eden区满了之后再使用Survivor from,当Survivor from 也满了之后就进行Minor GC(新生代GC),将Eden和Survivor from中存活的对象copy进入Survivor to,然后清空Eden和Survivor from,这个时候原来的Survivor from成了新的Survivor to,原来的Survivor to成了新的Survivor from。复制的时候,如果Survivor to 无法容纳全部存活的对象,则根据老年代的分配担保(类似于银行的贷款担保)将对象copy进去老年代,如果老年代也无法容纳,则进行Full GC(老年代GC)
PS:
大对象直接进入老年代:JVM中有个参数配置-XX:PretenureSizeThreshold,令大于这个设置值的对象直接进入老年代,目的是为了避免在Eden和Survivor区之间发生大量的内存复制。
长期存活的对象进入老年代:JVM给每个对象定义一个对象年龄计数器,如果对象在Eden出生并经过第一次Minor GC后仍然存活,并且能被Survivor容纳,将被移入Survivor并且年龄设定为1。每熬过一次Minor GC,年龄就加1,当他的年龄到一定程度(默认为15岁,可以通过XX:MaxTenuringThreshold来设定),就会移入老年代。但是JVM并不是永远要求年龄必须达到最大年龄才会晋升老年代,如果Survivor 空间中相同年龄(如年龄为x)所有对象大小的总和大于Survivor的一半,年龄大于等于x的所有对象直接进入老年代,无需等到最大年龄要求。
能不能自己写一个类叫java.lang.String
可以,但在应用的时候,需要用自己的类加载器去加载,否则,系统的类加载器永远只是去加载jre.jar包中的那个java.lang.String。
Java 中堆和栈有什么区别?
JVM 中堆和栈属于不同的内存区域, 使用目的也不同。栈常用于保存方法帧和局部变量, 而对象总是在堆上分配。栈通常都比堆小, 也不会在多个线程之间共享, 而堆被整个 JVM 的所有线程共享。
JVM类加载机制或类的生命周期
生命周期:加载、验证、准备、解析和初始化五个阶段
加载:类的加载是通过类加载器完成的,加载器将.class文件的二进制文件装入JVM的方法区,并且在堆区创建描述这个类的java.lang.Class对象。用来封装数据。
验证:用来确认此二进制文件是否适合当前的JVM版本。
准备:为静态成员分配内存空间,并设置默认值。
解析:指的是转换常量池中的代码作为直接引用的过程,直到所有的符号引用都可以被运行程序使用,建立完整的对应关系。
初始化:初始化之后类的对象就可以正常使用了,直到一个对象不再使用之后,将被垃圾回收,释放空间。当没有任何引用指向Class对象时就会被卸载,结束类的生命周期。
类加载器有哪些?
bootstrapclassloader 负责加载系统类
extclassloader 负责加载扩展类,一般对应的是jre\lib\ext目录中的类
appclassloader 负责加载应用类,加载classpath指定的类,是最常用的加载器。同时也是java中默认的加载器
类的动态加载和静态加载
静态加载类:在编译时刻加载类,例如new Number();
动态加载类:在运行阶段加载类,例如Class.forName("java.lang.Number");
区别
静态加载类,在编译阶段就需要提供,不提供编译器会报错。比如源程序中Student s = new Student();,如果源程序中没有定义Student类,那么编译器就会报错。
动态加载类,在编译阶段可以缺席,编译器不会报错,在运行阶段需要提供。比如源程序中Class c = Class.forName("com.bowen.demo.Student");,如果源程序中并没有定义Student类,编译器并不会报错,可以通过编译。
JVM运行时数据区
第一块:程序计数器
程序计数器是用于存储每个线程下一步将执行的JVM指令,如该方法为native的,则程序计数器中不存储任何信息。
第二块:虚拟机栈
虚拟机栈是线程私有的,每个线程创建的同时都会创建虚拟机栈,虚拟机栈中存放的为当前线程中局部基本类型的变量(Java中定义的八种基本类型:boolean、char、byte、short、int、long、float、double)、部分的返回结果以及Stack Frame,非基本类型的对象在虚拟机栈上仅存放一个指向堆上的地址。
第三块:堆(Heap)
JVM用来存储对象实例以及数组值的区域,可以认为Java中所有通过new创建的对象的内存都在此分配,Heap中的对象的内存需要等待GC进行回收。
(1) 堆是JVM中所有线程共享的,因此在其上进行对象内存的分配均需要进行加锁,这也导致了new对象的开销是比较大的。
(2) Sun Hotspot JVM为了提升对象内存分配的效率,对于所创建的线程都会分配一块独立的空间TLAB(Thread Local Allocation Buffer),其大小由JVM根据运行的情况计算而得,在TLAB上分配对象时不需要加锁,因此JVM在给线程的对象分配内存时会尽量的在TLAB上分配,在这种情况下JVM中分配对象内存的性能和C基本是一样高效的,但如果对象过大的话则仍然是直接使用堆空间分配。
(3) TLAB仅作用于新生代的Eden Space,因此在编写Java程序时,通常多个小的对象比大的对象分配起来更加高效。
(4) 所有新创建的Object 都将会存储在新生代Yong Generation中。如果Young Generation的数据在一次或多次GC后存活下来,那么将被转移到Old Generation。新的Object总是创建在Eden Space。
第四块:方法区(Method Area)
(1)在Sun JDK中这块区域对应的为Permanet Generation,又称为持久代。
(2)方法区存放了所加载的类的信息(名称、修饰符等)、类中的静态变量、类中定义为final类型的常量、类中的Field信息、类中的方法信息,当开发人员在程序中通过Class对象中的getName、isInterface等方法来获取信息时,这些数据都来源于方法区,同时方法区也是全局共享的,在一定的条件下它也会被GC,当方法区需要使用的内存超过其允许的大小时,会抛出OutOfMemory的错误信息。
第五块:运行时常量池(Runtime Constant Pool)
存放的为类中的固定的常量信息、方法和Field的引用信息等,其空间从方法区域中分配。
第六块:本地方法栈(Native Method Stacks)
JVM采用本地方法栈来支持native方法的执行,此区域用于存储每个native方法调用的状态。
对象“已死”的判定算法
由于程序计数器、Java虚拟机栈、本地方法栈都是线程独享,其占用的内存也是随线程生而生、随线程结束而回收。而Java堆和方法区则不同,线程共享,是GC的所关注的部分。
在堆中几乎存在着所有对象,GC之前需要考虑哪些对象还活着不能回收,哪些对象已经死去可以回收。
有两种算法可以判定对象是否存活:
1.)引用计数算法:给对象中添加一个引用计数器,每当一个地方应用了对象,计数器加1;当引用失效,计数器减1;当计数器为0表示该对象已死、可回收。但是它很难解决两个对象之间相互循环引用的情况。
2.)可达性分析算法:通过一系列称为“GC Roots”的对象作为起点,从这些节点开始向下搜索,搜索所走过的路径称为引用链,当一个对象到GC Roots没有任何引用链相连(即对象到GC Roots不可达),则证明此对象已死、可回收。Java中可以作为GC Roots的对象包括:虚拟机栈中引用的对象、本地方法栈中Native方法引用的对象、方法区静态属性引用的对象、方法区常量引用的对象。
在主流的商用程序语言(如我们的Java)的主流实现中,都是通过可达性分析算法来判定对象是否存活的。
JVM对象的四种引用类型
(1)强引用:默认情况下,对象采用的均为强引用。(这个对象的实例没有其他对象引用,GC时才会被回收)
(2)软引用:软引用是Java中提供的一种比较适合于缓存场景的应用。(只有在内存不够用的情况下才会被GC)
(3)弱引用:在GC时一定会被GC回收。
(4)虚引用:由于虚引用只是用来得知对象是否被GC。
你多学一样本事,就少说一句求人的话,现在的努力,是为了以后的不求别人,实力是最强的底气。记住,活着不是靠泪水博得同情,而是靠汗水赢得掌声。
——《写给程序员朋友》