1、java内存模型
1.1、运行时数据区分为五大块:
1、程序计数器,应对中断、时间片执行,记录当前执行到的字节码位置,以便后续继续执行;
2、虚拟机栈,即平时所谓的栈区,存储局部变量、动态链接、方法出口等;
3、本地方法栈,为native方法服务,基本同虚拟机栈,在Hotspot中虚拟机栈和本地方法栈被合并;
4、方法区,存储类加载信息、常量、静态变量、运行时常量池;
5、堆区,GC主要工作区,java中存放实例对象的地方。
综上,其实份三大部分,程序计数,栈区(服务java方法-虚拟机栈,服务native方法-本地方法栈),方法区-运行时数据,堆区-对象。
2、GC基础(针对hotspot)
2.1、判断对象死亡
1)引用计数算法(无主流虚拟机使用):为对象添加引用计数器,每一个地方引用,计算加1,引用失效则减1,为了即不再使用。优点是实现简单,判定效率高,存在问题-无法解决对象间互相引用问题:
object A,B包含instance,
A.instance = B; // B_count = 1 , A_count = 1
B.instance = A;//B_count = 2, A_count = 2
A = null; //A_count = 1
B = null; //B_count = 1
A、B已经无法被引用到,但是计数仍然为1,无法被清除。
2)可达性分析:通过一系列GC Roots向下搜索,搜素路径即引用链,在搜索链上的可达,否则不可达。
GC Roots人群:1、虚拟机栈中引用对象,如局部变量;2、方法区中类的静态属性对象;3、方法区中常量引用对象;4、本地方法栈中Native方法引用对象。
引用分类:1、强引用,new出来的对象,GC不敢碰;
2、软引用,有用但非必需,GC一般不碰,在要内存溢出时,会进行垃圾第二次回收,此时才会清除软引用,提供了SoftReference类(可用作缓存?);
3、弱引用,非必需对象,比软引用更软,活不过第二集就是他,在GC下次运行时,不管内存够不够都会被清理,提供WeakReference类;
4、虚引用(幽灵引用、幻像引用),最弱。有他没他不影响对象生存时间,无法通过他得到对象实例,唯一作用:在被收集器回收时,会得到一个通知。提供PhantomReference类;
3)finalize()方法,GC可达性分析后,不在引用链上的对象,有一次执行finalze()方法自救的机会(仅执行一次),虚拟机判断有必要finalze()后,会把对象放入F-Queue队列中,并创建一个低优先级线程Finalizer去执行该方法。
4)提一下,方法区也有垃圾回收,即永久代的回收,如常量池无引用对象的回收。
2.2、垃圾收集算法
2.2.1 标记-清除算法:两个阶段,标记和清除;两个问题,效率和空间,标记算法和清除算法本身效率不高(循环遍历),另外清除后存在大量不连续内存碎片,分配较大对象时,无内存可用。
2.2.2 复制算法,基本思想:把内存分为两个部分,一部份用完了,就把已存活的对象依次复制到另一半上去。算法简单高效,也无碎片问题。缺点是费钱,好好的内存,利用率只有一半。
2.2.3 标记-整理算法:复制算法如果每次清理都有很多对象保留,那么复制一次到另一边的内存效率更低。针对这种情况,还是先标记,只是在清理时不是直接干掉无用对象,而是把存活对象向内存的一端移动,最后直接清理边界外的内存。
2.3、年代划分
1)根据IBM研究,java中的对象98%时朝生夕死,所以死的比较快的区域叫新生代,新生代中一部分比较顽强在经历多次GC(hotspot默认15次)后还没被回收,就会被分入老年代。
正经讲就是java堆中,根据对象存活周期的不同,对象被分为新生代和老年代。根据这个特点垃圾收集也采用分代收集算法,复制算法效率高,但是复制对象成本高,适合新生代中在每次收集时大批对象死去,只需复制少量对象就可完成收集。而老年代对象成活率高,一般采用标记-清除,或者标记整理算法。
2)新生代延伸,上面说新生代采用复制算法,但是2.2.2中也说了复制算法空间利用率低。因此现在把新生代进一步划分:一块较大的Eden区,和两块较小的Survivor区。
因为在新生代空间,每次收集时,只会有少量对象存活,这样1:1划分使用空间和复制空间就没有意义。实际中新生代每次使用Eden和其中一块Survivor存储对象,垃圾收集时,再把存活的对象复制到另一块Survivor空间。Hotspot中两个区域的比例默认8:1,即每次新生代有80%+10%的内存空间存储新生代,只有10%被闲置。
3)上面90%使用率的情况适合于绝大多数对象回收场景,但是在某些情况下,一次垃圾回收时存活的对象超过了10%新生代空间,即一块Survivor空间不够用,这时只能依赖其他内存(老年代),新生代无法容纳的存活对象将直接进入老年代,这种行为即分配担保。
3、HotSpot算法实现
3.1、枚举根节点
即上文提到过的可达性分析,符合GC Roots条件的变量也太多(常量、类静态属性、本地变量表),因此引入了安全点的概念,Sefepoint会选取指令序列复用的的点(每条指令执行都很快,如果出现某些指令长时间执行,最明显的就是指令序列复用,如循环跳转、方法调用等)。可达性分析时就会从这些安全点来遍历。
另外要提的是-Stop The World! GC在进行可达性分析时,整个执行系统都会被暂停在一点上,因为一边进行对象引用关系分析,一遍还运行程序改变引用关系的话,就无从分析了。这个时GC卡顿的根源,也是各种垃圾收集器优化的重点。
3.2、垃圾收集器
to be continue!!!
参考:
1、https://blog.csdn.net/u011080472/article/details/51324422