• JVM垃圾回收器理论分析与详解【纯理论】


    继续上次【https://www.cnblogs.com/webor2006/p/10740084.html】的理论继续。。有点吐血的感觉,都不知道学了这么一大堆理论有何实际意义,本身JVM就是个理论体系比较多的东东,所以理论不得不去面对,继续硬着头皮往前进。

    内存结构

    这个在之前的学习中都已经学习过了,复习一下。

    内存分配

    • 堆上分配
      大多数情况在eden【年轻代中的一个区域】上分配,偶尔会直接在old【老年代】上分配,细节取决于GC的实现。
    • 栈上分配
      原子类型的局部变量。

    内存回收

    1、GC要做的是将那些dead的对象所占用的内存回收掉。

    • Hotspot认为没有引用的对象是dead的。
    • Hotspot将引用分为四种:Strong【强引用】、Soft【软引用】、Weak【弱引用】、Phantom【虚引用】,这是大伙熟知的。
      1、Strong既默认通过Object o = new Object()这种方式赋值的引用。
      2、Soft、Weak、Phantom这三种则是继续Reference。

    2、在Full GC时会对Reference类型的引用进行特殊处理。

    • Soft:内存不够时一定会被GC、长期不用也会被GC。
    • Weak:一定会被GC,当被mark为dead,会在ReferenceQueue中通知。
    • Phantom:本来就没引用,当从jvm heap中释放时会通知。

    以上的概念会在未来举例进行代码说明的,先有个印象。

    垃圾收集算法

    以上是一些比较经典的垃圾收集算法,下面会逐个进行说明。

    GC的时机

    1、在分代模型的基础上,GC从时机上分为两种:Scavenge GC和Full GC。

    2、Scavenge GC(Minor GC)

    • 触发时机:新对象生成时,Eden空间满了。
    • 理论上Eden区大多数对象会在Scavenge GC回收,复制算法的执行效率会很高,Scavenge GC时间比较短。

    3、Full GC【这个在实际中一定得要避免】

    • 对整个JVM进行整理,包括Young、Old和Perm。
    • 主要的触发时机:1)Old满了;2)Perm满了;3)system.gc()
    • 效率很低,尽量减少Full GC

    垃圾回收器(Garbage Collector)

    • 分代模型:GC的宏观愿景。
    • 垃圾回收器:GC的具体实现。
    • Hotspot JVM提供多种垃圾回收器,我们需要根据具体应用的需要采用不同的回收器。
    • 没有万能的垃圾回收器,每种垃圾回收器都有自己的适用场景。

    垃圾收集器的“并行”和“并发”

    • 并行(Parallel):指多个收集器的线程同时工作,但是用户线程处于等待状态。
    • 并发(Concurrent):指收集器在工作时同时,可以允许用户线程工作。
      并发不代表解决了GC停顿的问题,在关键的步骤还是要停顿。比如在收集器标记垃圾的时候。但在清除垃圾的时候,用户线程可以和GC线程并发执行。 

    Serial收集器

    • 单线程收集器,收集时会暂停所有工作线程(Stop The World,简单STW),使用复制收集算法,虚拟机运行在Client模式时的默认新生代会采用此收集器。
    • 最早的收集器,单线程进行GC。
    • New和Old Generation都可以使用。
    • 在新生代,采用复制算法:在老年代,采用Mark-Compact算法。
    • 因为是单线程GC,没有多线程切换的额外开销,简单实用。
    • Hotspot Client模式缺省的的收集器

      如图中出现了一个词:“Safepoint”,安全点,在之后会举具体的实例来说明安全点的作用。

    ParNew收集器

    • ParNew收集器就是Serial的多线程版本,除了使用多个收集线程外,其余行为包括算法、STW、对象分配规则、回收策略等都与Serial收集器一模一样。
    • 对应的这种收集器是虚拟机运行在Server模式的默认新生代收集器,在单CPU的环境中,ParNew收集器并不会比Serial收集器有更好的效果。
    • Serial收集器在新生代的多线程版本。
    • 使用复制算法(因为针对新生代)。
    • 只有在多CPU的环境下,效率才会比Serial收集器高。
    • 可以通过-XX:ParallelGCThreads来控制GC线程数的多少。需要结合具体CPU的个数。
    • Server模式下新生代的缺省收集器。

    Parallel Scavenge收集器

    •  Parallel Scavenge收集器也是一个多线程收集器,也是使用复制算法,但它的对象分配规则与回收策略都与ParNew收集器有所不同,它是以吞吐量最大化(既GC时间占总运行时间最小)为目标的收集器实现,它允许较长时间的STW换取总吞吐量最大化。

    Serial Old收集器

    •  Serial Old是单线程收集器,使用标记-整理算法,是老年代的收集器。

    Parallel Old收集器

    • 老年代版本吞吐量优先收集器,使用多线程和标记一整理算法,JVM1.6提供,在此之前,新生代使用了PS收集器的话,老年代除Serial Old外别无选择,因为PS无法与CMS收集器配合工作。【了解既可】
    • Parallel Scavenge在老年代的实现
    • 在JVM1.6才出现Parallel Old
    • 采用多线程,Mark-Compact算法
    • 更注重吞吐量
    • Parallel Scavenge + Parallel Old = 高吞吐量,但GC停顿可能不理想

    CMS(Concurrent Mark Sweep)收集器【特别复杂的一种收集器】

    • CMS是一种以最短停顿时间为目标的收集器,使用CMS并不能达到GC效率最高(总体GC时间最小),但它能尽可能降低GC时服务的停顿时间,CMS收集器使用的是标记-清除算法。
    • 追求最短停顿时间,非常适合Web应用。
    • 只针对老年区,一般结合ParNew使用。
    • Concurrent,GC线程和用户线程并发工作(尽量并发)。
    • Mark-Sweep。
    • 只有在多CPU环境下才有意义 。
    • 使用-XX:+UseConcMarkSweepGC打开。
    • CMS以牺牲CPU资源的代价来减少用户线程的停顿。当CPU个数少于4的时候,有可能对吞吐量影响非常大。
    • CMS在并发清理的过程中,用户线程还在跑。这时候需要预留一部分空间给用户线程。
    • CMS用Mark-Sweep,会带来碎片问题。碎片过多的时候会容易频繁触发Full GC。

    GC垃圾收集器的JVM参数定义

    Java内存泄漏的经典原因

    1、对象定义在错误的范围(Wrong Scope)。

    • 如果Foo实例对象的生命较长,会导致临时性内存泄漏。(这里的names变量其实只是临时作用)
    • JVM喜欢生命周期短的对象,这样做已经足够高效【调整】

      这样一改之后,只要是doIt()方法一结束names的临时变量就立马会被回收。

    2、异常(Exception)处理不当。

    • 错误的做法

      对于有经验的程序员应该不会出现上面的问题,但是这里只是抛出泄漏的场景。
    • 正确的做法

    3、集合数据管理不当。

    • 当使用Array-based的数据结构(ArrayList,HashMap等)时,尽量减少resize:
      a、比如new ArrayList时,尽量估算size,在创建的时候把size确定。
      b、减少resize可以避免没有必要的array copying,gc碎片等问题。
    • 如果一个List只需要顺序访问,不需要随机访问(Random Access),用LinkedList代替ArrayList
      a、LInkedList本质是链表,不需要resize,但只适用于顺序访问。

    以上是对JVM垃圾回收相关理论的整体了解,说实话看完其实头晕晕的,没关系,接下来则会用实践来反证理论。

  • 相关阅读:
    学习笔记:javascript 窗口对象(window)
    学习笔记:javascript内置对象:数组对象
    学习笔记:javascript内置对象:日期对象
    学习笔记:javascript内置对象:数学对象
    学习笔记:javascript内置对象:字符串对象
    初次尝试轮播图
    今天我开通了博客园
    javaweb项目运转流程
    idea tomcat启动无效
    mysql事务管理及spring声明式事务中主动异常抛出使数据库回滚
  • 原文地址:https://www.cnblogs.com/webor2006/p/10982448.html
Copyright © 2020-2023  润新知