• 【JVM虚拟机】(2)---GC 算法与种类


    GC 算法与种类

      对于垃圾收集(GC), 我们需要考虑三件事情:哪些内存需要回收?如何判断是垃圾对象?垃圾回收算法有哪些?

    一、GC的工作区域

    1、不是GC的工作区域

        (1)程序计数器、虚拟机栈和本地方法栈三个区域是线程私有的,随线程生而生,随线程灭而灭;

        (2)栈中的栈帧随着方法的进入和退出而进行入栈和出栈操作,每个栈帧中分配多少内存基本上是在类结构确定下来时就已知的,因此这几个区域的内存分配和回收都具有确定性。

    在这几个区域不需要过多考虑回收的问题,因为方法结束或线程结束时,内存自然就跟随着回收了。

    2、GC的工作区域(哪些内存需要GC回收?)

    (1)垃圾回收重点关注的是堆和方法区部分的内存。

           因为一个接口中的多个实现类需要的内存可能不一样,一个方法的多个分支需要的内存也可能不一样,我们只有在程序处于运行期间才能知道会创建哪些对象,这部分内存的分

    配和回收都是动态的,所以垃圾回收器所关注的主要是这部分的内存。

    二、垃圾对象的判定

    Java堆中存放着几乎所有的对象实例,垃圾收集器对堆中的对象进行回收前,要先确定这些对象是否还有用,哪些还活着。对象死去的时候才需要回收。

    1、引用计数法

          引用计数法的逻辑是:在堆中存储对象时,在对象头处维护一个counter计数器,如果一个对象增加了一个引用与之相连,则将counter++。

    如果一个引用关系失效则counter–。如果一个对象的counter变为0,则说明该对象已经被废弃,不处于存活状态。

    优点

        1)可即刻回收垃圾,每个对象都知道自己的被引用数,当counter为0时,对象就会把自己作为空闲空间连接到空闲链表,也就是在对象变成垃圾的同时就会被回收.

        2)最大暂停时间短,每次通过指向mutator生成垃圾时,这部分垃圾都会被回收,大幅削减了mutator的最大暂停时间。

    缺点

        1)引用和去引用伴随加法和减法,影响性能

        2)很难处理循环引用

    2、可达性分析算法

          这种算法的基本思路是通过一系列名为“GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链,当一个对象到GC Roots没有任何引用链相连时,就证明此对象是不可用的

    Java语言是通过可达性分析算法来判断对象是否存活的。

    在Java语言里,可作为GC Roots的对象包括下面几种:

          (1)虚拟机栈(栈帧中的本地变量表)中引用的对象。

          (2)方法区中的类静态属性引用的对象。

          (3)方法区中的常量引用的对象。

          (4)本地方法栈中JNI(Native方法)的引用对象。

     三、垃圾回收算法

    1、标记-清除算法

    简单来说有两个步骤:标记、清除。

      (1). 标记阶段:找到所有可访问的对象,做个标记

      (2). 清除阶段:遍历堆,把未被标记的对象回收

     缺  点

       (1)因为涉及大量的内存遍历工作,所以执行性能较低,这也会导致“stop the world”时间较长,java程序吞吐量降低;

       (2)对象被清除之后,被清除的对象留下内存的空缺位置会造成内存不连续,空间浪费。

    2、标记整理(压缩)算法 

    标记-整理算法适合用于存活对象较多的场合,如老年代。它在标记-清除算法的基础上做了一些优化。

         (1)、标记阶段:它的第一个阶段与标记/清除算法是一模一样的。

         (2)、整理阶段:移动所有存活的对象,且按照内存地址次序依次排列,然后将末端内存地址以后的内存全部回收。

           上图中可以看到,标记的存活对象将会被整理,按照内存地址依次排列,而未被标记的内存会被清理掉。如此一来,当我们需要给新对象分配内存时,JVM只需要持有一个内存的起始地址即可,这比维护一个空闲

    列表显然少了许多开销。

    优点

          标记/整理算法不仅可以弥补标记/清除算法当中,内存区域分散的缺点,也消除了复制算法当中,内存减半的高额代价。

    缺点

         标记/整理算法唯一的缺点就是效率也不高。不仅要标记所有存活对象,还要整理所有存活对象的引用地址。从效率上来说,标记/整理算法要低于复制算法。 

    3、复制算法

          复制算法简单来说就是把内存一分为二,但只使用其中一份,在垃圾回收时,将正在使用的那份内存中存活的对象复制到另一份空白的内存中,最后将正在使用的内存空间的对象清除,完成垃圾回收。

    优点
           复制算法使得每次都只对整个半区进行内存回收,内存分配时也就不用考虑内存碎片等复杂情况,只要移动堆顶指针,按顺序分配内存即可,实现简单,运行高效。
    缺点
           复制算法的代价是将内存缩小为原来的一半,这个太要命了。

    注意(重要)

           现在的虚拟机使用复制算法来进行新生代的内存回收。因为在新生代中绝大多数的对象都是“朝生夕亡”,所以不需要将整个内存分为两个部分,而是分为三个部分,一块为Eden(伊面区)和两块较小的

    Survivor(幸存区)空间(默认比例->8:1:1)。每次使用Eden和其中的一块Survivor,垃圾回收时候将上述两块中存活的对象复制到另外一块Survivor上,同时清理上述Eden和Survivor。所以每次新生代就可以使用90%

    的内存。只有10%的内存是浪费的。(不能保证每次新生代都少于10%的对象存活,当在垃圾回收复制时候如果一块Survivor不够时候,需要老年代来分担,大对象直接进入老年代) 

    总的来讲:复制算法不适用于存活对象较多的场合,如老年代(复制算法适合做新生代的GC)

     4、三种算法总结

    相同点

          (1)三个算法都基于根搜索算法去判断一个对象是否应该被回收,而支撑根搜索算法可以正常工作的理论依据,就是语法中变量作用域的相关内容。

          (2)在GC线程开启时,或者说GC过程开始时,它们都要暂停应用程序(stop the world)。

    区别

    三种算法比较:

           效率:复制算法>标记-整理算法>标记-清除算法;

           内存整齐度:复制算法=标记-整理算法>标记-清除算法

           内存利用率:标记-整理算法=标记-清除算法>复制算法

     5、分代收集算法

          首先这不是一种新算法,它是一种思想。现在使用的Java虚拟机并不是只是使用一种内存回收机制,而是分代收集的算法。就是将内存根据对象存活的周期划分为几块。一般是把堆分为新生代、和老年代。短命对

    象存放在新生代中,长命对象放在老年代中。

        这个图是我拷贝来的,但要记住java8以后,已经没有永久区了,之前永久区存放的东西基本上放到了元空间中。

    对于不同的代,采用不同的收集算法:

           新生代:由于存活的对象相对比较少,因此可以采用复制算法该算法效率比较快。

           老年代:由于存活的对象比较多哈,可以采用标记-清除算法或是标记-整理算法。

    参考

       1、Java垃圾回收(GC)机制详解

       2、深入理解JVM:Java垃圾收集

     想太多,做太少,中间的落差就是烦恼。想没有烦恼,要么别想,要么多做。少校【16】 

  • 相关阅读:
    heat模板
    Leetcode812.Largest Triangle Area最大三角形面积
    Leetcode812.Largest Triangle Area最大三角形面积
    Leetcode811.Subdomain Visit Count子域名访问计数
    Leetcode811.Subdomain Visit Count子域名访问计数
    Leetcode806.Number of Lines To Write String写字符串需要的行数
    Leetcode806.Number of Lines To Write String写字符串需要的行数
    Leetcode819.Most Common Word最常见的单词
    Leetcode819.Most Common Word最常见的单词
    Leetcode783.Minimum Distance Between BST Nodes二叉搜索树结点最小距离
  • 原文地址:https://www.cnblogs.com/qdhxhz/p/9211095.html
Copyright © 2020-2023  润新知