• Java进阶教程:垃圾回收


    Java进阶教程:垃圾回收

    垃圾回收

    什么是垃圾回收

      垃圾回收(Garbage Collection,GC),顾名思义是释放垃圾占用的空间,防止内存泄漏。有效的使用可以使用的内存,对内存堆中已经死亡的或者长时间没有使用的对象进行清除和回收

    如何判断垃圾呢

      为了判断对象是否存活,JVM引入了GC Roots。如果一个对象与GC Roots之间没有直接或间接的引用关系,比如某个对象失去任何引用的对象。或者两个互相环岛状循环引用的对象等,判断这些对象“死缓”,是可以被回收的。

      这种算法又称之为可达性分析算法。

    可达性分析算法

    可达性分析算法

      可达性分析算法(Reachability Analysis)的基本思路是,通过一些被称为引用链(GC Roots)的对象作为起点,从这些节点开始向下搜索,搜索走过的路径被称为(Reference Chain),当一个对象到 GC Roots 没有任何引用链相连时(即从 GC Roots 节点到该节点不可达),则证明该对象是不可用的

      

      通过可达性分析算法,成功解决了引用计数无法解决的“循环依赖”问题。只要你无法与 GC Root 建立直接或间接的连接,系统就会判定你为可回收对象。

      在Java语言中,可作为GC Root的对象包括以下四种:

    • 虚拟机栈中引用的对象
    • 方法区中静态属性引用的对象
    • 方法区中常量引用的对象
    • 本地方法栈中JNI引用的对象  

     

    怎么回收垃圾

      在确定了哪些垃圾可以被回收后,垃圾收集器要做的事情就是开始进行垃圾回收,但是这里面涉及到一个问题是:如何高效地进行垃圾回收。由于Java虚拟机规范并没有对如何实现垃圾收集器做出明确的规定,因此各个厂商的虚拟机可以采用不同的方式来实现垃圾收集器,这里我们讨论几种常见的垃圾收集算法的核心思想。

    标记清除

      

      标记清除算法(Mark-Sweep),先对即可回收的垃圾进行标记,然后清理掉,就像上图一样,清理掉的垃圾就变成未使用的内存区域,等待被再次使用。逻辑很清晰,但是它存在一个很大的问题,那就是内存碎片。会导致我们想要一个连续的大一点的空间,但是被分散在各个地方,无法申请到。

    复制

      

      复制算法(Copying)是在标记清除算法上演化而来,解决标记清除算法的内存碎片问题。它将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。保证了内存的连续可用,内存分配时也就不用考虑内存碎片等复杂情况,逻辑清晰,运行高效。

       但是它也有一个问题,就是空间必须拆分,即你有10G内存,但是能分配的最大单个对象只有5G。

    标记整理

      

       标记整理算法(Mark-Compact)标记过程仍然与标记 --- 清除算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,再清理掉端边界以外的内存区域

       它仍然有一个致命问题,就是效率问题,它对内存变动更频繁,需要整理所有存活对象的引用地址,在效率上比复制算法要差很多

     

    分代收集算法

      分代收集算法(Generational Collection)严格来说并不是一种思想或理论,而是融合上述3种基础的算法思想,而产生的针对不同情况所采用不同算法的一套组合拳。对象存活周期的不同将内存划分为几块。一般是把 Java 堆分为新生代和老年代,这样就可以根据各个年代的特点采用最适当的收集算法。在新生代中,每次垃圾收集时都发现有大批对象死去,只有少量存活,那就选用复制算法,只需要付出少量存活对象的复制成本就可以完成收集。而老年代中因为对象存活率高、没有额外空间对它进行分配担保,就必须使用标记-清理或者标记整理算法来进行回收

    Java堆的结构

       

      Java堆分为两个区域,年轻代和老年代,其中年轻代又分为Eden区和Survivor,Survivor分为Form 和To 两个区。

    Eden

      大多数情况下,对象会在新生代Eden区中进行分配,当Eden区没有足够空间进行分配时,虚拟机会发起一次Minor GC,Minor GC相比Major GC更频繁,回收速度也更快。

      通过Minor GC之后,Eden会被清空,Eden区中绝大多数对象会被回收,而那些无需回收的存活对象,就会进入Survivor的Form区,若Form区不够,则直接进入Old区。

    Survivor

      Survivor区相当于Eden区与Old区的一个缓存,类似我们交通灯中的黄灯。Survivor区存在的意义就是减少被送到老年区的对象,从而减少Major GC的发生。Survivor的预筛选保证,只有经历16次Minor GC还能在新生代中存活的对象,才能被送到老年代。Survivor设置两个的原因是,Survivor内部使用特殊的清理算法(类似于复制算法),可以解决内存碎片化。

    Old

      老年代占据着2/3的堆内存空间,只有在Major GC的时候才会进行清理。在老年代,对象存活率很高,如果复制的话很麻烦,采用标记整理算法较好。

    特殊情况

      大对象是需要大量连续内存空间的对象,这部分对象直接进入老年代。

     

    参考链接

    • https://mp.weixin.qq.com/s/v7hXr1RHKJpS20LxctvCFg
    • 《深入理解Java虚拟机》。

     

  • 相关阅读:
    基于51的串行通讯原理及协议详解(uart)
    linux下各目录的作用
    firefox插件之 vimperator 的使用
    samba的使用
    debian系统下安装ssh服务
    Aircrack-ng 工具箱
    linux系统下静态IP的设置
    HTML 与 css 的简单学习
    微软亚洲实验室一篇超过人类识别率的论文:Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification ImageNet Classification
    概率论中的一些常见的分布与公式
  • 原文地址:https://www.cnblogs.com/MrSaver/p/11197627.html
Copyright © 2020-2023  润新知