ParallelScavenge ＋ Parallel Old

ParalletScavenge：复制算法，多线程，关注吞吐率

Copying GC（GC复制算法):

最早是Robert R.Fenichel和Jerome C.Yochelson提出，简单说将空间分为From和To，当From空间完全占满时，gc将活动对象全部复制到To空间，复制完成后，From和To的使命互换。

为了保证From中所有活着的对象都能复制到To里，要求From和To空间大小一致。

coping(){
  free = to_start;
  for(r : roots){
    *r = copy(*r)
  }
  swap(from_start,to_start)
}
/**
*free设在To空间的开头
*第四行copy函数，复制能从根引用到的对象及其子对象，返回＊r所在的新空间。
*然后交换From和To，对From空间进行gc
*/
 
copy(obj){
  if(obj.tag != COPIED){
    copy_data(free,obj,obj.size);
    obj.tag = COPIED;
    obj.forwarding = free;
    free = obj.size
 
    for(child : children(obj.forwarding){
      *child = copy(*child)
    }
  }
  return obj.forwarding
}
/**
*obj.tag 并不是单独的一个域，只是占用了obj的field1，一旦obj被复制完毕，其在From空间的域值更改没有关系
*obj.forwarding也不是一个单独的域，占用了obj.field2,用来标识新空间的位置
* 由更上可知，需要每个对象至少有两个域
* 深度遍历
*/

//分配
new_obj(size){
  if(free + size > from_start + HEAP_SIZE /2){
    copying(); //空间不足，gc
    if(free + size > from_start + HEAP /2){
       allocation_fail();//还是不够，分配失败
    }
  }
  obj = free;
  obj.size = size;
  free += size;
  return obj;
}

copying算法的总结：

1 copying算法的时间复杂度只跟活跃对象的个数有关，可以在较短时间内完成gc，吞吐量较高

2 分配速度快，移动指针，不涉及空闲链表

3 不会产生碎片，复制的行为本身包含了压缩

4 深度优先，具有引用关系的对象靠在一起。利于缓存的使用（局部性原理）。

5 堆的利用率低

6 递归的进栈出栈消耗比迭代的形式大，但用迭代的形式是广度优先，jdk以前是广度，现在都是深度；有进阶算法可以近似接近深度优先而不需要递归

Parallel Old：标记－整理，多线程

Mark Compact GC 标记－压缩算法:

首先看Donald E.Knuth研究出来的Lisp2算法：

compaction_phase(){
  set_forwarding_ptr();
  adjust_ptr();
  move_obj();
}
 
set_forwarding_ptr(){
  scan = new_address = heap_start;
  while(scan < heap_end){  //第一次搜索堆
    if(scan.mark == TRUE){  //被标记为活对象
      scan.forwarding = new_address;//new_address指向移动后的地址
      new_address += scan.size；
    }
    scan += scan.size; //扫描下一个活对象
  }
}
 
adjust_ptr(){
  for(r : roots){
    *r = (*r).forwarding;
  }
  
  scan = heap_start;
  while(scan < heap_end){  //第二次搜索堆
    if(scan.mark = TRUE){
      for(child : children(scan))
        *child = (*child).forwarding
    }
    scan += scan.size;
  }
}
 
move_obj(){
  scan = free = heap_start;
  while(scan < heap_end){//第三次搜索堆
     if(scan.mark = TRUE){
        new_address = scan.forwarding;
        copy_data(new_address,scan,scan.size);
        new_address.forwarding = null;
        new_address.mark = FALSE:
        free += new_address.size;
        scan += scan.size;
     }
  }
}

总结：

1 堆利用率高

2 压缩空间，没有碎片

3 时间消耗大：需要搜索三次堆，且时间与堆大小成正比

还有一个Two-Finger算法，可以做到只搜索两次，但要求所有对象整理成大小一致，这个约束比较苛刻，jvm用的应该是Lisp2。

分代垃圾回收：

可行性来源于经验：“大部分的对象在生成后很快就变成了垃圾，很少有对象能活得很久”

有些GC算法的时间是和活着的对象的个数成正比，比如标记－清除MarkSweep，复制Copying；

minorGC：新生代GC，minor指小规模的；

majorGC：老年代GC

promotion：新生代对象经过若干次gc仍活着的晋升为老年代。

Ungar的分代垃圾回收：David Ungar研究出来的将copying算法与分代思想结合

1 堆划分为4个空间：生成空间new_start，2个大小相等的幸存空间survivor1_start,survivor2_start，老年代空间old_start

2个幸存空间类似于copying gc中的From和To，每次利用生成空间＋1个幸存空间，gc后活着的对象复制到另一个幸存空间

2 考虑：新生代gc：需要考虑老年代空间对新生代空间中对象的引用

Remembered Set & Card Table

Remembered Set：实现部分垃圾收集时（partial gc），用于记录从非收集部分指向收集部分的指针的集合的抽象数据结构了。

在分代垃圾回收里，Remembered Set 用来记录老年代对象对新生代对象的跨代引用；在regional collector中，Remembered Set 用来记录跨region的指针。

粒度；数据结构；写屏障

3 对象的晋升

MaxTenuringThreshold 定义了晋升老年代的对象的最大年龄，大于这个年龄，一定会晋升，小于这个年龄，也有可能晋升，取决于TargetSurvivorRatio。

当年龄为age的对象的大小之和超过了targetSurvivorratio * survivor，则实际用来判断是否晋升的年龄是这个动态的age，不是maxtenuringthreshold

ParallelScavenge ＋ Parallel Old

ParalletScavenge：复制算法，多线程，关注吞吐率

Parallel Old：标记－整理，多线程

分代垃圾回收：

你可能感兴趣的:(jvm,垃圾回收)