• 《深入理解Java虚拟机》读书笔记3--垃圾回收算法


    转载:http://blog.csdn.net/tjiyu/article/details/53983064

    下面先来了解Java虚拟机垃圾回收的几种常见算法:标记-清除算法、复制算法、标记-整理算法、分代收集算法、火车算法,介绍它们的算法思路,有什么优点和缺点,以及主要应用场景。

    1、标记-清除算法

           标记-清除(Mark-Sweep)算法是一种基础的收集算法。

    1、算法思路

           "标记-清除"算法,分为两个阶段:

    (A)、标记

          首先标记出所有需要回收的对象;

           标记过程如《Java虚拟机垃圾回收(一) 基础》"2-4、判断对象生存还是死亡"中所述--分为两个标记过程(详细请参考前文):

    (1)、第一次标记

           在可达性分析后发现对象到GC Roots没有任何引用链相连时,被第一次标记;

           并且进行一次筛选:此对象是否必要执行finalize()方法;

           对有必要执行finalize()方法的对象,被放入F-Queue队列中;    

    (2)、第二次标记

           GC将对F-Queue队列中的对象进行第二次小规模标记;

           在其finalize()方法中重新与引用链上任何一个对象建立关联,第二次标记时会将其移出"即将回收"的集合;

           对第一次被标记,且第二次还被标记(如果需要,但没有移出"即将回收"的集合),就可以认为对象已死,可以进行回收

    (B)、清除

          两次标记后,还在"即将回收"集合的对象将被统一回收;

           执行过程如下图:

    2、优点

           基于最基础的可达性分析算法,它是最基础的收集算法;

           而后续的收集算法都是基于这种思路并对其不足进行改进得到的;

    3、缺点

           主要有两个缺点:

    (A)、效率问题

           标记和清除两个过程的效率都不高;

    (B)、空间问题

           标记清除后会产生大量不连续的内存碎片;

           这会导致分配大内存对象时,无法找到足够的连续内存;

           从而需要提前触发另一次垃圾收集动作;

    4、应用场景

          针对老年代的CMS收集器;

    2、复制算法

           "复制"(Copying)收集算法,为了解决标记-清除算法的效率问题;

    1、算法思路

           (A)、把内存划分为大小相等的两块,每次只使用其中一块;

           (B)、当一块内存用完了,就将还存活的对象复制到另一块上(而后使用这一块);

           (C)、再把已使用过的那块内存空间一次清理掉,而后重复步骤2;    

          执行过程如下图:

    2、优点

           这使得每次都是只对整个半区进行内存回收;

           内存分配时也不用考虑内存碎片等问题(可使用"指针碰撞"的方式分配内存);

          实现简单,运行高效;

           (关于"指针碰撞"请参考《Java对象在HotSpot虚拟机中的创建过程》)

    3、缺点

    (A)、空间浪费

          可用内存缩减为原来的一半,太过浪费(解决:可以改良,不按1:1比例划分);

    (B)、效率随对象存活率升高而变低

          当对象存活率较高时,需要进行较多复制操作,效率将会变低(解决:后面的标记-整理算法);

    4、应用场景

          现在商业JVM都采用这种算法(通过改良缺点1)来回收新生代;

    新生代:新建的对象都放到新生代

    老年代:多次回收没有被回收的对象或者大对象

          如Serial收集器、ParNew收集器、Parallel Scavenge收集器、、G1(从局部看);

    5、HotSpot虚拟机的改良算法

    (A)、弱代理论

           分代垃圾收集基于弱代理论(weak generational hypothesis),具体描述如下:

           (1)、大多数分配了内存的对象并不会存活太长时间,在处于年轻代时就会死掉;

           (2)、很少有对象会从老年代变成年轻代;

           其中IBM研究表明:新生代中98%的对象都是"朝生夕死";

            所以并不需要按1:1比例来划分内存(解决了缺点1);

    (B)、HotSpot虚拟机新生代内存布局及算法

                          (1)、将新生代内存分为一块较大的Eden空间和两块较小的Survivor空间;

                          (2)、每次使用Eden和其中一块Survivor;

                          (3)、当回收时,将Eden和使用中的Survivor中还存活的对象一次性复制到另外一块Survivor;

                          (4)、而后清理掉Eden和使用过的Survivor空间;

                          (5)、后面就使用Eden和复制到的那一块Survivor空间,重复步骤3;

             默认Eden:Survivor=8:1,即每次可以使用90%的空间,只有一块Survivor的空间被浪费;

    (C)、分配担保

           如果另一块Survivor空间没有足够空间存放上一次新生代收集下来的存活对象时,这些对象将直接通过分配担保机制(Handle Promotion)进入老年代;

           分配担保在以后讲解垃圾收集器执行规则时再详解;

           更多请参考:http://docs.oracle.com/javase/8/docs/technotes/guides/vm/gctuning/generations.html#sthref16

    3、标记-整理算法

           "标记-整理"(Mark-Compact)算法是根据老年代的特点提出的。

    1、算法思路

    (1)、标记

          标记过程与"标记-清除"算法一样;

    (2)、整理

           但后续不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动;

           然后直接清理掉端边界以外的内存;

    执行过程如下图:

    2、优点

    (A)、不会像复制算法,效率随对象存活率升高而变低

           老年代特点:

           对象存活率高,没有额外的空间可以分配担保;

           所以老年代一般不能直接选用复制算法算法;

           而选用标记-整理算法;

    (B)、不会像标记-清除算法,产生内存碎片

           因为清除前,进行了整理,存活对象都集中到空间一侧;

    3、缺点

           主要是效率问题:除像标记-清除算法的标记过程外,还多了需要整理的过程,效率更低;

    4、应用场景

           很多垃圾收集器采用这种算法来回收老年代;

          如Serial Old收集器、G1(从整体看);

    4、分代收集算法

           "分代收集"(Generational Collection)算法结合不同的收集算法处理不同区域。

    1、算法思路

           基于前面说的弱代理论,其实并没有什么新的思想;

           只是根据对象存活周期的不同将内存划分为几块;

           这样就可以根据各个年代的特点采用最适当的收集算法;

           一般把Java堆分为新生代和老年代;

    (A)、新生代

           每次垃圾收集都有大批对象死去,只有少量存活;

           所以可采用复制算法;

    (B)、老年代

           对象存活率高,没有额外的空间可以分配担保;

          使用"标记-清理"或"标记-整理"算法;

          结合上面对新生代的内存划分介绍和上篇文章对Java堆的介绍,可以得出HotSpot虚拟机一般的年代内存划分,如下图:

    2、优点      

           可以根据各个年代的特点采用最适当的收集算法;

    3、缺点      

           仍然不能控制每次垃圾收集的时间;

    4、应用场景

          目前几乎所有商业虚拟机的垃圾收集器都采用分代收集算法;

          如HotSpot虚拟机中全部垃圾收集器:Serial、ParNew、Parallel Scavenge、Serial Old、Parallel Old、CMS、G1(也保留);

  • 相关阅读:
    linux中anaconda环境下pytorch的安装(conda安装本地包)
    multi-label image classification:多标签图像分类总结
    TensorFlow,Keras限制GPU显存
    Linux常用文件操作命令
    卷积神经网络 CNN
    pycharm配置tensorflow环境 适用于Python3.6 CPU
    tensorflow模型ckpt转pb以及其遇到的问题
    使用delimiter //,解决mysql end报错问题
    C#死亡延迟队列DelayQueue
    如何发出人传人的裂变朋友圈?
  • 原文地址:https://www.cnblogs.com/xiaolovewei/p/8027245.html
Copyright © 2020-2023  润新知