Java内存管理 - GC机制【翻译】

https://howtodoinjava.com/java/garbage-collection/revisiting-memory-management-and-garbage-collection-mechanisms-in-java/

想必很多人都了解什么是Java中的垃圾回收(GC),但大多数人并不了解GC是如何工作的
你不是那大多数人所以你在看这篇文章。

在这篇Java内存管理的浅文中,我们将尝试告诉你什么是当前正在使用的GC算法以及算法的由来。

1 Java中的内存管理

Java中由GC负责进行内存管理。这和远古时代的做法截然相反,在这之前我们都是需要自己手动进行内存的分配和释放的。

形式化的来说,GC负责了:

  • 分配内存
  • 确保所有被引用的对象存货
  • 当对象不再被引用时回收它们对应的内存

在程序执行期间,程序创建了很多的对象并且每个对象都有其生命周期。在内存中,那些被其他对象引用着的对象称之为存活对象
那些不再被任何存活对象引用的对象我们称之为死对象(dead objects)或者垃圾。
这个处理分配内存空间的过程我们称之为垃圾回收(garbage collection)。

GC可以解决很多问题,但不是所有问题都可以处理的了的。我们可以无限的创建新的对象同时保持一直引用他们,这样内存总会到达上限从而引发OOM(Out of memory error)。
GC实际上是一个很复杂且耗时的操作,同时消耗的是它自己的资源。GC本质上也是需要消耗堆空间的。

垃圾回收的时间点取决于不同的垃圾回收器。通常来说当堆空间占满时,或者到达一个阈值时会触发一次GC。

Java HotSpot虚拟机在J2SE 5.0中有4个版本的垃圾回收器。这些都是分代回收器,我们会在之后的章节详细介绍什么是分代回收器。

2 引用计数机制(reference counting mechanism)

这是古早版GC所使用的机制。这项技术中,每个对象都维护着其他对象或者栈对其的引用数。每当有一个新的对象引用它时计数加一反之则减一。当计数为零时意味着该对象可以被回收。

这种机制的优势在于实现简单消耗内存少。但同时其也有着致命的缺点,例如当两个对象循环引用时这两个对象将永远不会被回收。

3 标记擦除机制(mark and sweep mechanism)

Java内存管理 - GC机制【翻译】_第1张图片
mark-and-sweep1.gif

这种机制解决了上述的对象循环引用的问题。在这种算法中,收集器会先指定某些对象为默认的可到达的对象,通常是一些全局变量或者是栈中的局部变量。

下一步,算法会从这些根对象出发不断追溯,将所有可到达的对象都标记为存活对象。这个过程会持续到所有的对象都被检查并标记为止。那些在追溯过程中仍然没有被标记的对象被认定为死对象。

在使用标记擦除算法时,死对象不会立马被清除。而是在容许内存被全部消耗殆尽时触发清除工作。当清除工作开始时,所有正在执行的程序都会被迫停止(叫做世界停止,stop the world)直到擦除工作结束。当所有死对象多被清除过后程序恢复执行。

在这项技术中,除了需要暂定程序之外,对内存空间的碎片重组(de-fragmentation)也是一个不小的开销。

碎片重组:但我们对死对象完成擦除工作后,整个内存空间上是零散的,因此需要做一次碎片重组让这些零散的内存空间变得紧凑起来。

4 停止复制GC(stop and copy GC)

和标记擦除一样,我们也需要先标记所有的存活对象,差异在于如何处理这些存活的对象。

停止复制技术中,整个堆空间被切分成了两部分,同一时间只有一部分是可用的,另一部分在这段时间是不可用的。

当一次GC被触发时,会首先标记所有的存货对象,然后将所有的存活对象复制到另一个半区。原本半区的对象被认定为死对象并被垃圾回收。

和上一个算法一样,此算法中我们也只处理存活对象。此外由于我们不需要进行碎片重组,在复制完成时整个内存空间都是紧凑的。

很明显这个算法也有明显的缺点,即我们在同一时间内只能使用整个内存空间的一半。

5 分代停止复制(generational stop and copy)

和停止复制算法类似,这次我们将整个内存分成三个部分。我们这次换个名字叫他们代(generation)。分别叫做年轻代老年代永久代

大部分的对象都是在年轻代中创建。当年轻代中的对象在数次年轻代垃圾回收中存活后,会被提升至老年代,当然有些大对象也会被直接分配到老年代。永久代通常用来存放那些不会被轻易回收的对象,例如对象的class和方法。

当年轻代被填满时会触发一次年轻代GC(通常叫做minor collection)。当老年代或者永久代被填满时会触发一次全GC(通常叫做major collection)。

通常情况下年轻代会被先回收,使用的GC算法取决于配置,这是因为对年轻代的回收通常更加高效。在GC中存活的对象会被放入老年代中。老年代的GC不会那么的频繁,道理很简单:因为老年代的对象已经存活了足够长的时间,通常来说他们也会继续存活很长的时间。对于每一代的碎片重组都是单独执行的。

这种算法的优势在于我们可以尽早的在年轻代中发现死对象并处理他们,而且不再需要对整个内存空间进行扫描而是只对年轻代进行扫描。
缺点在于我们仍然需要执行碎片重组,并且在执行GC时需要stop the world。

6 如果提高Java的内存使用效率

  1. 不要过度分配内存。按需分配。尤其在处理Java array时。
  2. 不要一直握着引用。当对象不再需要时即时将其null掉。
  3. 解决内存泄漏
  4. 在每一次版本更新时做性能分析
  5. 不要使用System.gc()

你可能感兴趣的:(Java内存管理 - GC机制【翻译】)