深入探究jvm之GC的参数调优

深入探究jvm之GC的参数调优

　　在上一篇博客记录了GC的算法及种类，这篇博客主要记录一下GC的参数如何调整以提高jvm的性能。

一、堆的回顾：

　　

　　堆的内存空间总体分为新生代和老年代，老年代存放的老年对象，新构造的对象分配在eden区中（栈上分配及新生代内存不足的情况除外）。在经过GC之后，幸存下来的对象会被分配到幸存代中，s0与s1是两块完全相同的内存区域，采用复制算法，在迭代后交换内存空间。经过若干次GC后，仍然未被回收的对象会被分配到老年代中。

二、GC参数--串行收集器（Serial）

　　串行收集器有以下几个特点：

　　1）最古老、最稳定

　　2）效率高

　　3）可能产生较长时间的停顿，只是用一个线程进行回收，无法发挥多核CPU的优势。（全局停顿在上一篇有介绍过）

　　通过-XX:+UseSerialGC参数启用，启用之后，新生代和老年代会使用串行回收，新生代会采用复制算法，老年代会使用标记-压缩算法。（参见上一篇博客）

　　串行回收器的示意图如下：

　　参数分别记录了新生代和老年代的回收情况。

三、GC参数--并行收集器（PerNew）

　　PerNew有以下几个特点：

　　1）是Serial收集器新生代的并行版本

　　2）采用的是复制算法

　　3）是多线程运行的，需要多核CPU的支持。

　　通过-XX:+UsePerNewGC参数启用，启用之后，新生代采用并行回收，而老年代仍然使用串行回收，采用复制算法。可以通过-XX:ParallelGCThreads参数来限制线程的数量；

　　通过-XX:MaxGCPauseMills参数控制最大停顿时间，单位是毫秒；GC会尽力保证回收时间不超过设定值；

　　通过-XX：GCTimeRatio参数控制收集时间占总时间的比，取值范围是0-100；默认是1，即最大允许1%时间用来做GC。

　　上述两个参数是矛盾的，因为停顿时间和吞吐量不可能同时调优的。GC的次数减少，必然导致单次停顿的时间变长，反之亦然；因此在权衡参数时要抓住性能瓶颈。

　　并行回收器的示意图如下：

　　需要注意的一点是，并行收集器只在多核CPU的情况下能提升性能，同时要控制好线程数，否则效率反而打折扣。

四、Paraller收集器

　　Paraller收集器的特点如下：

　　1）类似于ParNew收集器

　　2）新生代采用复制算法，老年代使用标记-压缩算法。

　　3）更加关注于吞吐量

　　-XX:UseParallerGC参数：使用Paraller收集器，新生代采用并行收集，老年代采用串行收集；

　　-XX:UseParallerOldGC参数：使用Paraller收集器，新生代和老年代都采用并行收集。

　　Paraller收集器示例图：

五、CMS收集器（Concurrent Mask Sweep）

　　主要的特点如下：

　　1）采用的是标记-清除算法

　　2）与标记-压缩算法相比，在并发阶段（与应用程序线程同时执行）会降低吞吐量。

　　3）老年代的收集器，并不影响新生代收集器，新生代仍然采用ParNew收集器。

　　通过-XX:UseConcMarkSweepGC参数启用。

　　CMS运行过程比较复杂，着重实现了标记的过程，可分为：

　　①初始标记：根对象可以直接关联到对象（速度很快）；

　　②并发标记：同应用程序线程同时进行，标记所有的对象；

　　③重新标记：由于并发标记时，应用程序线程仍然在运行，因此在正式清理前，需要再次做修正；

　　④并发清除：基于以上的标记结果，直接清理对象。

　　注意，在并发标记阶段，同样会产生全局停顿现象，只不过是尽可能的减少了全局停顿的时间，在应用程序运行过程中，会一直产生垃圾，无法进行标记。

　　CMS收集器示例图如下：

　　由于在一些标记过程中与应用程序并行，以保证可用对象的地址不发生改变，所以只能简化标记算法而采用标记-清除算法。另外，CMS收集器会影响系统整体的吞吐量，如在用户线程运行的过程中，会占用CPU进行GC操作；同时还存在清理不彻底的情况，在一些标记的过程中，用户的应用程序仍然会产生新的垃圾不会被标记。

　　注意，因为和用户的应用程序并发，不能在空间快满时才进行清理操作，通过-XX:CMSInitiatingOccupancyFraction参数设置触发GC的阈值，如果内存预留的空间不足，就会引起concurrent mode failure。发生错误的后备方法是，通过串行收集器进行收集，但会产生比较长时间的停顿。

　　标记-清除算法会产生碎片空间，因此我们需要进行碎片整理：

　　通过-XX:UseCMSCompactAtFullCollection参数使在进行FullGC之后进行一次整理，这个整理过程是独占的，会引起停顿时间变长；

　　通过-XX:CMSFullGCsBeforeCompaction参数设置进行几次FullGC之后进行一次碎片整理；

　　通过-XX:ParallelCMSThreads设定CMS的线程数量。

六、GC参数整理：

　　-XX:+UseSerialGC：在新生代和老年代使用串行收集器；

　　-XX:SurvivorRatio：设置eden区大小和survivor区大小的比例；

　　-XX:NewRatio：设置新生代和老年代的大小比例；

　　-XX:+UseParNewGC：在新生代使用并行收集器；

　　-XX:+UseParellelGC：新生代使用并行回收收集器；

　　-XX:+UseParallelOldGC：老年代使用并行回收收集器；

　　-XX:ParallelGCThreads：设置用于垃圾回收的线程数；

　　-XX:+UseConcMarkSweepGC：新生代使用并行收集器，老年代使用CMS+串行收集器；

　　-XX:ParallelCMSThreads：设定CMS的线程数量；

　　-XX:CMSInitiatingOccupancyFraction：设置CMS收集器在老年代空间被使用多少后被触发；

　　-XX:+UseCMSCompactAtFullCollection：设置CMS收集器在完成垃圾收集后是否要进行一次内存的碎片整理；

　　-XX:CMSFullGCsBeforeCompaction：设定进行多少次CMS垃圾回收之后进行一次内存压缩；

　　-XX:+CMSClassUnloadingEnabled：允许对类元数据进行回收；

　　-XX:CMSInitiatingPermOccupancyFraction：当永久区占用率达到这一百分比时，启用CMS回收；

　　-XX:UseCMSInitiatingOccupancyOnly：只有到达阈值的时候才进行CMS回收。

七、GC参数实例：

　　环境：Tomcat7、JSP网站、JDK6、测试网站的吞吐量及延时。

　　工具：Jmeter，建立10个线程，每个线程请求Tomcat 1000次共1w次。

　　目的：让Tomcat有一个不错的吞吐量。

　　结构：Tomcat与Jmeter分开部署，防止Jmeter对Tomcat的性能产生影响。

　　　　

1、参数：set CATALINA_OPTS=-server -Xloggc:gc.log -XX:+PrintGCDetails -Xms32M -Xmx32M -XX:+HeapDumpOnOutOfMemeryError -XX:+UseSerialGC -XX:PermSize=32M

　　

2、参数：set CATALINA_OPTS=-Xmx512M -XX:MaxPermSize=32M -Xloggc:gc.log -XX:PrintGCDetails

　　将最大堆内存改为512m，结果FullGC发生很少，基本上都是MinorGC。吞吐量由540提高到了650，同时堆大小也在自动拓展，由开始的15872K拓展到38秒的60456K。

3、参数：set CATALINA_OPTS=-Xmx512M -Xms=64M -XX:MaxPermSize=32M -Xloggc:gc.log -XX:PrintGCDetails

　　将堆内存的初始大小设置为64M，GC数量减少，大部分都是MinorGC.吞吐量由651提升到了674。

4、参数：set CATALINA_OPTS=-Xmx512M -Xms=64M -XX:MaxPermSize=32M -Xloggc:gc.log -XX:PrintGCDetails -XX:+UseParallelGC -XX:+UseParallelOldGC

　　 -XX:ParallelGCThreads

　　新生代和老年代都使用并行回收收集器，GC原本压力不大，所以影响很小。

5、参数：set CATALINA_OPTS=-Xmx40M -Xms40M -XX:MaxPermSize=32M -Xloggc:gc.log -XX:PrintGCDetails

　　减少堆大小，增加GC压力，默认使用串行回收收集器，吞吐量为646。

6、参数：set CATALINA_OPTS=-Xmx40M -Xms40M -XX:MaxPermSize=32M -Xloggc:gc.log -XX:PrintGCDetails -XX:+UseParallelOldGC -XX:ParallelGCThreads

　　减少堆大小，增加GC压力，老年代使用并行回收收集器，吞吐量由646提高到了685。

7、参数：set CATALINA_OPTS=-Xmx40M -Xms40M -XX:MaxPermSize=32M -Xloggc:gc.log -XX:PrintGCDetails -XX:+UseParNewGC

　　减少堆大小，增加GC压力，新生代使用并行回收收集器，吞吐量由685下降到了660。可见老年代的GC回收机制对系统性能影响更大一些。

8、不添加任何参数，使用JDK6与JDK7对比

　　发现JDK版本对于系统性能影响不容忽视。升级JDK版本可能会带来额外的性能提升！
相关阅读:
Luogu4113 采花（树状数组）题解
 Luogu P2572 [SCOI2010]序列操作（线段树）题解
 CF525D Arthur and Walls（贪心染色）题解
 CF425A Sereja and Swaps（暴力枚举+贪心）题解
 CF482A Diverse Permutation（贪心构造）题解
 CF545C Woodcutters（贪心）题解
 学习笔记---ST表
 python列表解析式，生成器，及部分内建函数使用方法
 python之set集合，字典详解
 使用css3写出来的表情包，酷酷的！！！
原文地址：https://www.cnblogs.com/liuyk-code/p/10278865.html