转载请注明出处: jiq•钦's technical Blog - 季义钦
引言:
我们都知道JVM内存由几个部分组成:堆、方法区、栈、程序计数器、本地方法栈
JVM垃圾回收仅针对公共内存区域即:堆和方法区进行,由于仅仅有这两个区域在执行时才干知道须要创建哪些对象,其内存分配和回收都是动态的。
本文主要讨论两点,一是垃圾回收策略,二是调优的方法。
一、垃圾回收机制
1.1 分代管理
将堆和方法区依照对象不同年龄进行分代:
u 堆中会频繁创建对象,基于一种分代的思想,依照对象存活时间将堆划分为新生代和旧生代两部分。我们不能一次垃圾回收新生代存活的对象就放入旧生代,而是要经过几次GC后还存活的对象,我们才放入旧生代,所以我们又把新生代再次划分为Eden区和两个Survivor区,让对象创建在Eden区,然后在两个Survivor之间重复复制,最后仍然存活的对象才拷贝到旧生代中。
u 方法区存放的是常量、载入的字节码文件信息等,信息相对稳定。
由于不会频繁创建对象,所以不须要分代,直接GC就可以。
由此我们JVM垃圾回收要扫描的范围是:
注:图片来自网络
新生代:
1. 全部新对象创建发生在Eden区。Eden区满后触发新生代上的minor GC,将Eden区和非空暇Survivor区存活对象拷贝到还有一个空暇的Survivor区中。
2. 永远保证一个Survivor是空的,新生代minor GC就是在两个Survivor区之间相互复制存活对象,直到Survivor区满为止。
旧生代:
1. Eden区满后触发minor GC将存活对象拷贝到Survivor区,Survivor区满后触发minor GC将存活对象拷贝到旧生代。
2. 经过新生代的两个Survivor之间多次复制,仍然存活下来的对象就是年龄相对照较老的。就能够放入到旧生代了。随着时间推移。假设旧生代也满了。将触发Full GC,针对整个堆(包含新生代、旧生代和持久代)进行垃圾回收。
持久代:
持久代假设满,将触发Full GC
1.2 垃圾回收
要执行gc关键在于两点,一是检測出垃圾对象,二是释放垃圾对象所占用的空间。
1.2.1 检測垃圾对象
检測出垃圾对象一般有两种算法:
1、 引用计数法
2、 可达性分析
引用计数法由于无法检測对象之间相互循环引用的问题,基本没有被採用。如今主流的语言的垃圾收集中检測垃圾对象主要还是“可达性分析”方法。以下也主要介绍JVM可达性分析方法检測垃圾对象。
“可达性分析”算法描写叙述?
通过一系列的名为“GC Root”的对象作为起点,从这些节点向下搜索,搜索所走过的路径称为引用链(Reference Chain),当一个对象到GC Root没有不论什么引用链相连时,则该对象不可达。该对象是不可使用的。垃圾收集器将回收其所占的内存。所以JVM推断对象须要存活的原则是:能够被一个根对象到达的对象。
什么是能够到达呢?
就是对象A中引用了对象B,那么就称A到B可达。
GCRoot对象集合?
a. java虚拟机栈(栈帧中的本地变量表)中的引用的对象。(当前栈帧的对象引用)
b.方法区中的类静态属性引用的对象。(static对象引用)
c.方法区中的常量引用的对象。(final对象引用)
d.本地方法栈中JNI本地方法的引用对象。
除了堆之外,方法区也须要进行垃圾回收GC,那么怎样检測出方法区的垃圾对象呢?
方法区中的“废弃常量”和“没用的类”须要回收以保证永久代不会发生内存溢出。
1、推断废弃常量的方法(常量不再须要):假设常量池中的某个常量没有被不论什么引用所引用,则该常量是废弃常量。
2、推断没用的类(class文件不再须要):
(1).该类的全部实例都已经被回收,即java堆中不存在该类的实例对象。
(2).载入该类的类载入器已经被回收。
(3).该类所相应的java.lang.Class对象没有不论什么地方被引用。无法在不论什么地方通过反射机制訪问该类的方法。
当持久代(方法区)满时,将触发Full GC,依据以上标准清除掉废弃的常量和没用的类。1.2.2 释放空间
1、垃圾回收算法
前面已经介绍了怎样检測出垃圾对象,在检測出垃圾对象之后,须要依照特定的垃圾回收算法进行内存回收,常见的垃圾回收算法包含:
u 复制(Copying)
u 标记-清除(Mark-Sweep)
u 标记-整理(Mark-Compact)
u 分代(Generational Collection),借助前面三种算法实现
这里就不一一详述,感兴趣能够自行百度。
2、垃圾收集器实现
上面算法都是理论性的东西,Java虚拟机规范没有规定垃圾收集器具体怎样实现,因此不同厂商、不同版本号虚拟机提供的垃圾收集器可能有所差异。
以下列举HotSpot(Sun JDK和Open JDK自带)虚拟机提供的六种垃圾收集器实现:
收集器名称 | 应用目标 | 採用算法 | 引入版本号 | 执行方式 |
Serial | 新生代 | 复制算法 | Jdk1.3.1前 | 串行,单线程 |
ParNew | 新生代 | 复制算法 |
| 并行,多线程 |
Parallel Scavenge | 新生代 | 复制算法 | Jdk1.4 | 并行。多线程 |
Serial Old | 旧生代 | 标记-整理 |
| 串行,单线程 |
Parallel Old | 旧生代 | 标记-整理 | Jdk1.6 | 并行,多线程 |
CMS | 旧生代 | 标记-清除 | Jdk1.5 | 并发。多线程 |
并行(Parallel):多条垃圾收集线程并行工作,而用户线程仍处于等待状态
并发(Concurrent):垃圾收集线程与用户线程一段时间内同一时候工作(不是并行,而是交替执行)
总结:
1、 两个串行收集器、三个并行收集器、一个并发收集器。
2、 ParNew收集器是Serial的多线程版本号
3、 Serial Old收集器是Serial收集器的旧生代版本号。
4、 Parallel Scavenge收集器以吞吐量为目标,适合在后台运算而不须要太多交互的任务。
5、 Parallel Old收集器是Parallel Scavenge的旧生代版本号。
6、 Parallel Scavenge收集器和Parallel Old收集器是名副事实上的“吞吐量优先”组合。
7、 除CMS外,其它收集器工作时都须要暂停其它全部线程,CMS是第一款真正意义上的并发(Concurrent)收集器,第一次实现了让垃圾收集器线程与用户线程同一时候工作,是一款以最短停顿时间为目标的收集器。适合交互性较多的场景,这也是与Parallel Scavenge/Parallel Old吞吐量优先组合的差别。
8、 新生代由于回收留下的对象少,所以採用标记-复制法。
9、 旧生代由于回收留下的对象多,所以採用标记-清除/标记-整理算法。
3、选择所需垃圾收集器
虚拟机提供了參数,以便用户依据自己的需求设置所需的垃圾收集器:
JVM执行參数 | 新生代 | 旧生代 |
-XX:+UseSerialGC(Client模式默认值) | Serial | Serial Old |
-XX:+UseParNewGC | ParNew | Serial Old |
-XX:+UseConcMarkSweepGC | ParNew | CMS(Serial Old备用) |
-XX:+UseParallelGC(Server模式默认值) | Parallel Scavenge | Serial Old |
-XX:+UseParallelOldGC | Parallel Scavenge | Parallel Old |
二、性能调优
2.1 性能调优的目的
降低minor gc的频率、以及full gc的次数
2.2 性能调优的手段
1.使用JDK提供的内存查看工具。如JConsole和Java VisualVM
2.控制堆内存各个部分所占的比例
3.採用合适的垃圾收集器
手段1:内存查看工具(如jstat)和GC日志分析
n -verbose.gc:显示GC的操作内容。打开它,能够显示最忙和最空暇收集行为发生的时间、收集前后的内存大小、收集须要的时间等。
n -xx:+printGCdetails:具体了解GC中的变化。
n -XX:+PrintGCTimeStamps:了解这些垃圾收集发生的时间。自JVM启动以后以秒计量。
n -xx:+PrintHeapAtGC:了解堆的更具体的信息。
此外还包含通过jmap+MAT的方式分析可能发生的内存泄露的原因,哪些对象占用内存较大等。
手段2:针对新生代和旧生代的比例
假设新生代太小,会导致频繁GC。并且大对象对直接进入旧生代引发full gc
假设新生代太大,会诱发旧生代full gc,并且新生代的gc耗时会延长
建议新生代占整个堆1/3合适,相关JVM參数例如以下:
n -Xms:初始堆大小
n -Xmx:最大堆大小
n - Xmn:新生代大小
n -XX:PermSize=n:持久代最大值
n -XX:MaxPermSize=n:持久代最大值
n -XX:NewRatio=n:设置新生代和旧生代的比值。如:为3。表示新生代与旧生代比值为1:3,新生代占整个新生代旧生代和的1/4
手段3:针对Eden和Survivor的比例
假设Eden太小。会导致频繁GC
假设Eden太大,会导致大对象直接进入旧生代。降低对象在新生代存活时间
n -XX:SurvivorRatio=n:新生代中Eden区与两个Survivor区的比值。注意Survivor区有两个。如:3,表示Eden:Survivor=3:2。一个Survivor区占整个年轻代的1/5
n -XX:PretenureSizeThreshold:直接进入旧生代中的对象大小。设置此值后,大于这个參数的对象将直接在旧生代中进行内存分配。
n -XX:MaxTenuringThreshold:对象转移到旧生代中的年龄,每一个对象经历过一次新生代GC(Minor GC)后,年龄就加1,到超过设置的值后。对象转移到旧生代。
手段4:採用正确的垃圾收集器
通过JVM參数设置所使用的垃圾收集器參考前面的介绍,这里关注其它一些设置。
并行收集器设置
n -XX:ParallelGCThreads=n:设置并行收集器收集时并行收集线程数
n -XX:MaxGCPauseMillis=n:设置并行收集最大暂停时间,仅对ParallelScavenge生效
n -XX:GCTimeRatio=n:设置垃圾回收时间占程序执行时间的百分比。仅对Parallel Scavenge生效
并发收集器设置
n -XX:CMSInitiatingOccupancyFraction:默认设置下。CMS收集器在旧生代使用了68%的空间后就会被激活。此參数就是设置旧生代空间被使用多少后触发垃圾收集。注意要是CMS执行期间预留的内存无法满足程序须要。就会出现concurrent mode failure,这时候就会启用Serial Old收集器作为备用进行旧生代的垃圾收集。
n -XX:+UseCMSCompactAtFullCollection:空间碎片过多是标记-清除算法的弊端。此參数设置在FULL GC后再进行一个碎片整理过程
n -XX:CMSFullGCsBeforeCompaction:设置在若干次垃圾收集之后再启动一次内存碎片整理