• JVM:垃圾回收机制和调优手段


    转载请注明出处: jiq•钦's technical Blog - 季义钦


    引言:

    我们都知道JVM内存由几个部分组成:堆、方法区、栈、程序计数器、本地方法栈

    JVM垃圾回收仅针对公共内存区域即:堆和方法区进行,由于仅仅有这两个区域在执行时才干知道须要创建哪些对象,其内存分配和回收都是动态的。

    本文主要讨论两点,一是垃圾回收策略,二是调优的方法。


    一、垃圾回收机制


    1.1 分代管理

    将堆和方法区依照对象不同年龄进行分代:

    u  堆中会频繁创建对象,基于一种分代的思想,依照对象存活时间将堆划分为新生代和旧生代两部分。我们不能一次垃圾回收新生代存活的对象就放入旧生代,而是要经过几次GC后还存活的对象,我们才放入旧生代,所以我们又把新生代再次划分为Eden区和两个Survivor区,让对象创建在Eden区,然后在两个Survivor之间重复复制,最后仍然存活的对象才拷贝到旧生代中。

    u  方法区存放的是常量、载入的字节码文件信息等,信息相对稳定。

    由于不会频繁创建对象,所以不须要分代,直接GC就可以。

     

    由此我们JVM垃圾回收要扫描的范围是:


    注:图片来自网络

     

    新生代:

    1.      全部新对象创建发生在Eden区。Eden区满后触发新生代上的minor GC,将Eden区和非空暇Survivor区存活对象拷贝到还有一个空暇的Survivor区中。

    2.      永远保证一个Survivor是空的,新生代minor GC就是在两个Survivor区之间相互复制存活对象,直到Survivor区满为止。

     

    旧生代:

    1.      Eden区满后触发minor GC将存活对象拷贝到Survivor区,Survivor区满后触发minor GC将存活对象拷贝到旧生代。

    2.      经过新生代的两个Survivor之间多次复制,仍然存活下来的对象就是年龄相对照较老的。就能够放入到旧生代了。随着时间推移。假设旧生代也满了。将触发Full GC,针对整个堆(包含新生代、旧生代和持久代)进行垃圾回收。

     

    持久代:

    持久代假设满,将触发Full GC


    1.2 垃圾回收

    要执行gc关键在于两点,一是检測出垃圾对象,二是释放垃圾对象所占用的空间。


    1.2.1 检測垃圾对象

    检測出垃圾对象一般有两种算法:

    1、 引用计数法

    2、 可达性分析

    引用计数法由于无法检測对象之间相互循环引用的问题,基本没有被採用。如今主流的语言的垃圾收集中检測垃圾对象主要还是“可达性分析”方法。以下也主要介绍JVM可达性分析方法检測垃圾对象。

     

    “可达性分析”算法描写叙述?

    通过一系列的名为“GC Root”的对象作为起点,从这些节点向下搜索,搜索所走过的路径称为引用链(Reference Chain),当一个对象到GC Root没有不论什么引用链相连时,则该对象不可达。该对象是不可使用的。垃圾收集器将回收其所占的内存。所以JVM推断对象须要存活的原则是:能够被一个根对象到达的对象。

     

    什么是能够到达呢?

    就是对象A中引用了对象B,那么就称A到B可达。

     

    GCRoot对象集合?

    a. java虚拟机栈(栈帧中的本地变量表)中的引用的对象。(当前栈帧的对象引用)

    b.方法区中的类静态属性引用的对象。(static对象引用)

    c.方法区中的常量引用的对象。(final对象引用)

    d.本地方法栈中JNI本地方法的引用对象。


    除了堆之外,方法区也须要进行垃圾回收GC,那么怎样检測出方法区的垃圾对象呢?

    方法区中的“废弃常量”和“没用的类”须要回收以保证永久代不会发生内存溢出。

    1、推断废弃常量的方法(常量不再须要):假设常量池中的某个常量没有被不论什么引用所引用,则该常量是废弃常量。

    2、推断没用的类(class文件不再须要):

    (1).该类的全部实例都已经被回收,即java堆中不存在该类的实例对象。

    (2).载入该类的类载入器已经被回收。

    (3).该类所相应的java.lang.Class对象没有不论什么地方被引用。无法在不论什么地方通过反射机制訪问该类的方法。

    当持久代(方法区)满时,将触发Full GC,依据以上标准清除掉废弃的常量和没用的类。


    1.2.2 释放空间

    1、垃圾回收算法

    前面已经介绍了怎样检測出垃圾对象,在检測出垃圾对象之后,须要依照特定的垃圾回收算法进行内存回收,常见的垃圾回收算法包含:

    复制(Copying)

    标记-清除(Mark-Sweep)

    标记-整理(Mark-Compact)

    分代(Generational Collection),借助前面三种算法实现

    这里就不一一详述,感兴趣能够自行百度。


    2、垃圾收集器实现

    上面算法都是理论性的东西,Java虚拟机规范没有规定垃圾收集器具体怎样实现,因此不同厂商、不同版本号虚拟机提供的垃圾收集器可能有所差异。

    以下列举HotSpot(Sun JDK和Open JDK自带)虚拟机提供的六种垃圾收集器实现:

    收集器名称

    应用目标

    採用算法

    引入版本号

    执行方式

    Serial

    新生代

    复制算法

    Jdk1.3.1前

    串行,单线程

    ParNew

    新生代

    复制算法

     

    并行,多线程

    Parallel Scavenge

    新生代

    复制算法

    Jdk1.4

    并行。多线程

    Serial Old

    旧生代

    标记-整理

     

    串行,单线程

    Parallel Old

    旧生代

    标记-整理

    Jdk1.6

    并行,多线程

    CMS

    旧生代

    标记-清除

    Jdk1.5

    并发。多线程

    并行(Parallel):多条垃圾收集线程并行工作,而用户线程仍处于等待状态

    并发(Concurrent):垃圾收集线程与用户线程一段时间内同一时候工作(不是并行,而是交替执行)

     

    总结:

    1、  两个串行收集器、三个并行收集器、一个并发收集器。

    2、  ParNew收集器是Serial的多线程版本号

    3、  Serial Old收集器是Serial收集器的旧生代版本号。

    4、  Parallel Scavenge收集器以吞吐量为目标,适合在后台运算而不须要太多交互的任务。


    5、  Parallel Old收集器是Parallel Scavenge的旧生代版本号。

    6、  Parallel Scavenge收集器和Parallel Old收集器是名副事实上的“吞吐量优先”组合。

    7、  除CMS外,其它收集器工作时都须要暂停其它全部线程,CMS是第一款真正意义上的并发(Concurrent)收集器,第一次实现了让垃圾收集器线程与用户线程同一时候工作,是一款以最短停顿时间为目标的收集器。适合交互性较多的场景,这也是与Parallel Scavenge/Parallel Old吞吐量优先组合的差别。


    8、  新生代由于回收留下的对象少,所以採用标记-复制法。

    9、  旧生代由于回收留下的对象多,所以採用标记-清除/标记-整理算法。


    3、选择所需垃圾收集器

    虚拟机提供了參数,以便用户依据自己的需求设置所需的垃圾收集器:

    JVM执行參数

    新生代

    旧生代

    -XX:+UseSerialGC(Client模式默认值)

    Serial

    Serial Old

    -XX:+UseParNewGC

    ParNew

    Serial Old

    -XX:+UseConcMarkSweepGC

    ParNew

    CMS(Serial Old备用)

    -XX:+UseParallelGC(Server模式默认值)

    Parallel Scavenge

    Serial Old

    -XX:+UseParallelOldGC

    Parallel Scavenge

    Parallel Old


    二、性能调优

    2.1 性能调优的目的

    降低minor gc的频率、以及full gc的次数


    2.2 性能调优的手段

    1.使用JDK提供的内存查看工具。如JConsoleJava VisualVM

    2.控制堆内存各个部分所占的比例

    3.採用合适的垃圾收集器


    手段1:内存查看工具(如jstat)和GC日志分析

    n  -verbose.gc:显示GC的操作内容。打开它,能够显示最忙和最空暇收集行为发生的时间、收集前后的内存大小、收集须要的时间等。

    n  -xx:+printGCdetails:具体了解GC中的变化。

    n  -XX:+PrintGCTimeStamps:了解这些垃圾收集发生的时间。自JVM启动以后以秒计量。

    n  -xx:+PrintHeapAtGC:了解堆的更具体的信息。

    此外还包含通过jmap+MAT的方式分析可能发生的内存泄露的原因,哪些对象占用内存较大等。


    手段2:针对新生代和旧生代的比例

    假设新生代太小,会导致频繁GC。并且大对象对直接进入旧生代引发full gc

    假设新生代太大,会诱发旧生代full gc,并且新生代的gc耗时会延长

    建议新生代占整个堆1/3合适,相关JVM參数例如以下:

    n  -Xms:初始堆大小

    n  -Xmx:最大堆大小

    n  - Xmn:新生代大小

    n  -XX:PermSize=n:持久代最大值

    n  -XX:MaxPermSize=n:持久代最大值

    n  -XX:NewRatio=n:设置新生代和旧生代的比值。如:为3。表示新生代与旧生代比值为1:3,新生代占整个新生代旧生代和的1/4


    手段3:针对Eden和Survivor的比例

    假设Eden太小。会导致频繁GC

    假设Eden太大,会导致大对象直接进入旧生代。降低对象在新生代存活时间

    n  -XX:SurvivorRatio=n:新生代中Eden区与两个Survivor区的比值。注意Survivor区有两个。如:3,表示Eden:Survivor=3:2。一个Survivor区占整个年轻代的1/5

    n  -XX:PretenureSizeThreshold:直接进入旧生代中的对象大小。设置此值后,大于这个參数的对象将直接在旧生代中进行内存分配。

    n  -XX:MaxTenuringThreshold:对象转移到旧生代中的年龄,每一个对象经历过一次新生代GC(Minor GC)后,年龄就加1,到超过设置的值后。对象转移到旧生代。


    手段4:採用正确的垃圾收集器

    通过JVM參数设置所使用的垃圾收集器參考前面的介绍,这里关注其它一些设置。

    并行收集器设置

    n  -XX:ParallelGCThreads=n:设置并行收集器收集时并行收集线程数

    n  -XX:MaxGCPauseMillis=n:设置并行收集最大暂停时间,仅对ParallelScavenge生效

    n  -XX:GCTimeRatio=n:设置垃圾回收时间占程序执行时间的百分比。仅对Parallel Scavenge生效

     

    并发收集器设置

    n  -XX:CMSInitiatingOccupancyFraction:默认设置下。CMS收集器在旧生代使用了68%的空间后就会被激活。此參数就是设置旧生代空间被使用多少后触发垃圾收集。注意要是CMS执行期间预留的内存无法满足程序须要。就会出现concurrent mode failure,这时候就会启用Serial Old收集器作为备用进行旧生代的垃圾收集。

    n  -XX:+UseCMSCompactAtFullCollection:空间碎片过多是标记-清除算法的弊端。此參数设置在FULL GC后再进行一个碎片整理过程

    n  -XX:CMSFullGCsBeforeCompaction:设置在若干次垃圾收集之后再启动一次内存碎片整理


  • 相关阅读:
    [Leetcode][Python][DP]Regular Expression Matching
    [LeetCode][Python]Container With Most Water
    [LeetCode][Python]Regular Expression Matching
    [LeetCode][Python]Palindrome Number
    [LeetCode][Python]Largest Number
    前后端数据交互的几个方法
    AngularJS中服务和自定义服务的常见方式及特点
    uniapp解决图形验证码问题及arraybuffer二进制转base64格式图片
    动态面包屑组件(适合嵌套路由)
    vue + antd-vue + 腾讯云点播 完成视频上传功能
  • 原文地址:https://www.cnblogs.com/yjbjingcha/p/8397732.html
Copyright © 2020-2023  润新知