JVM的垃圾收集算法,最终是要由垃圾收集器实现的。不同厂商、不同版本的虚拟机的垃圾收集器实现差别很大。本文只介绍HotSpot中的垃圾收集器,包括:串行收集器、并行收集器、新生代Parallel Scavenge收集器、CMS、G1。
一、整体介绍
在新生代工作的收集器:Serial、ParNew、Parallel Scavenge
在老年代工作的收集器:CMS、Serial old、 Parallel old
同时工作在新生代和老生代的实用的收集器目前只有G1收集器,自JDK9以后G1收集器是默认收集器。
新生代的收集器和老年代的收集器,是要配合使用的,而且配合选择上是有一定要求的。如上图中,新生代和老年代收集器能用钱连接在一起的,就是可以配合使用的。此外可以使用Serial old给CMS做备用收集器,当CMS不能工作的时候,切换到Serial old处理。
二、串行收集器
Serial收集器/Serial Old收集器是单线程的收集器,在垃圾收集时,只启一个GC线程进行回收,暂停所有用户线程,会Stop-the-World。
它的优点是简单,对于单cpu,由于没有多线程交互的开销,可能更高效,是Client模式下的默认新生代收集器。
三、并行收集器
ParNew收集器,只用于新生代,使用多线程进行垃圾回收,在垃圾收集时,一样会Stop-the-World。
在并发能力好的CPU环境里,它停顿的时间要比串行收集器短;但对于单CPU或并发能力较弱的CPU,由于多线程的交互开销,可能比串行回收器更差。它是Server模式下首选的新生代售后机器,且能(实际上也只能)和CMS收集器配合使用,只要启用了CMS收集器,新生代就会自动使用ParNew收集器。
可以通过-XX:ParallelGCThreads指定线程数,最好与CPU数量一致。
四、Parallel Scavenge收集器
新生代Parallel Scavenge收集器,对应老年代使用Parallel Old收集器。Parallel Scavenge收集器也是使用复制算法的并行收集器,和ParNew很类似,但更关注吞吐量,能最高效率的利用CPU,适合运行后台应用。
五、CMS(Concurrent Mark and Sweep 并发标记清除)收集器
CMS收集器与前面的收集器有很大不同,它是真正GC线程和用户线程能并发的收集器。前面讲的并行收集器只是GC线程并行,垃圾收集时还是要停止全部用户线程。Serial old将作为CMS发生错误的备用收集器。CMS收集器是JDK8的默认收集器。
CMS收集器工作的时候分成四个大的步骤:
1.初始标记:只标记GC Roots能直接关联到的对象;
2.并发标记:进行GC Roots Tracing的过程;判断哪些对象是垃圾对象;
3.重新标记:修正并发标记期间,因程序运行导致标记发生变化的那一部分对象;
4.并发清除:并发回收垃圾对象。并发清理后还有一个“重置线程”小动作,重置一下状态。
优点是并发执行,停顿时间少。
缺点是:1、并发执行,对CPU资源压力大;
2、无法处理在并行回收过程中产生的垃圾,可能导致FullGC
3、采用的标记清除算法会导致大量碎片,从而在分配大对象时可能触发FullGC
有一些参数可以设置,比如-XX:CMSInitiatingOccupancyFraction用来设置CMS收集器在老年代空间被使用多少后触发回收,默认80%
六、G1(Garbage-First)收集器:
G1收集器是一款面向服务端应用的收集器,与其它收集器相比,具有如下特点:
1.G1把内存划分成多个独立的区域(Region)
2.G1仍采用分代思想,保留了新生代和老年代,但它们仅是逻辑概念,不再是物理隔离的,而是一部分Region的集合,且不需要Region是连续的
3.G1能充分利用多CPU、多核环境硬件优势,尽量缩短STW
4.G1整体上采用标记-整理算法,局部是通过复制算法,不会产生内存碎片,因此不会因为分配大对象导致FullGC的发生。一般情况下G1是不会发生FullGC的
5.G1的停顿时间可预测,能明确指定在一个时间段内,消耗在垃圾收集上的时间不能超过多长时间
6.G1跟踪各个Region里面垃圾堆的价值大小,在后台维护一个列表,每次根据允许的时间来回收价值最大的区域,从而保证有闲时间内的高效收集。G1的回收叫MixedGC,会回收整个新生代及部分价值较高的老年代
G1跟CMS收集器相似,工作的时候也分成四个大的步骤:
1.初始标记:只标记GC Roots能直接关联到的对象;
2.并发标记:进行GC Roots Tracing的过程;判断哪些对象是垃圾对象
3.最终标记:修正并发标记期间,因程序运行导致标记发生变化的那一部分对象。(类似CMS的重新标记)
4.筛选回收:根据时间来进行价值最大化的回收。这一步并不是要把所有垃圾都收集完,而是根据时间要求,收集回收价值最大的区间
回收过程如下图所示:
回收前:
回收后:
G1收集器也有一些参数可以设置,比如下面两个,其它参数参见JVM规范。
可通过-XX:MaxGCPauseMillis设置最大GC停顿时间,这是个软目标,JVM将尽可能(但不保证)停顿小于这个时间
可通过-XX:InitiatingHeapOccupancyPercent设置堆占用了多少的时候触发GC,默认为45%