0
点赞
收藏
分享

微信扫一扫

【JVM · GC】垃圾回收器

路西法阁下 2022-01-31 阅读 141

1. GC分类与性能指标

1.1 垃圾回收期器概述

  • 垃圾收集器没有在规范中进行过多的规定,可以由不同的厂商、不同版本的JVM来实现。
  • 由于 JDK 版本处于高速迭代过程中,因此Java 发展至今已经衍生了众多的GC版本。
  • 从不同角度分析垃圾收集器,可以将GC(Garbage Collector)分为不同的类型。

1.2 垃圾回收器分类

1.2.1 按线程数分类

  • 线程数 分,可以分为 串行垃圾回收器 和 并行垃圾回收器。按线程数

  • 串行回收指在同一时间段内只允许有一个CPU用于执行垃圾回收操作,此时工作线程被暂停,直至垃圾收集工作结束。

    • 在注诸如 单CPU处理器 或较小的应用内存等硬件平台不是特别优越的场合,串行回收器的性能表现可以超过并行回收器、并发回收器。所以,串行回收默认被应用在客户端的Client模式下的JVM中
    • 在并发能力较强的CPU上,并行回收器产生的停顿时间要短于串行回收。
  • 与穿行回收相反,并行收集可以运用多个CPU同时执行垃圾回收,因此提升了应用的吞吐量,不过并行回收仍然和串行回收一样,采用独占式,使用了 “Stop-the-World” 机制。

1.2.2 按工作模式分类

  • 工作模式 分,可以分为 并发式垃圾回收器 和 独占式垃圾回收器。
    • 并发式垃圾回收器与应用程序线程交替工作,以尽可能减少应用程序的停顿时间。
    • 独占式垃圾回收器(Stop the World)一旦运行,就停止应用程序中的所有用户线程直至垃圾回收过程完全结束。

安工作模式

1.2.3 按碎片处理方式分类

  • 碎片处理方式 分,可分为 压缩式垃圾回收器 和 非压缩式垃圾回收器。
    • 压缩式垃圾回收器会在回收完成后,对存活对象进行压缩整理,消除回收后的碎片。
      • 再分配对象空间:指针碰撞
    • 非压缩式垃圾回收器不进行这步操作。
      • 再分配对象空间:空闲列表

1.2.4 按工作的内存区间分类

  • 工作的内存区间 分,可以分为 年轻代垃圾回收器 和 老年代垃圾回收器。

1.3 评估GC的性能指标

  • 吞吐量:运行用户代码的时间占总运行时间的比例(a / (a + b))
    • (总运行时间:程序的运行时间a + 内存回收的时间b)
  • 垃圾收集开销:吞吐量的补数,垃圾收集所用时间与总运行时间的比例(b / (a + b))
  • 暂停时间:执行垃圾收集时,程序的工作线程被暂停的时间。
  • 收集频率:相对于应用程序的执行,收集操作发生的频率。
  • 内存占用:Java堆区所占的内尺寸大小。
  • 快速:一个对象从诞生被回收经历的时间。

这三者(吞吐量、暂停时间、内存占用)共同构成了一个 “不可能” 三角形。三者总体的表现会随着技术进步而越来越好。一款优秀的收集器通常最多同时满足其中的两项。

这三项里,暂停时间的重要性日益凸显。因为随着硬件发展,内存占用多谢越来越能容忍,硬件性能的提升也有助于降低收集器运行时对应用程序的影响,即提高了吞吐量。而内存的扩大,对延迟反而带来负面效果。

简单来说,主要抓住两点:

  • 吞吐量
  • 暂停时间

1.3.1 吞吐量(throughput)

  • 吞吐量就是CPU用于运行用户代码的时间与CPU总消耗时间的比值,即吞吐量 = 运行用户代码时间 / (运行用户代码时间 + 垃圾收集时间)。
    • 比如:虚拟机总共运行了100分钟,其中垃圾收集花掉1分钟,那吞吐量就是99%。
  • 这种情况下,用用程序能容忍较高的暂停时间,因此,高吞吐量的应用程序有更长的时间基准,快速响应是不必考虑的。
  • 吞吐量优先,意味着在单位时间内,STW的时间最短:0.2 + 0.2 = 0.4。

吞吐量

1.3.2 暂停时间(pause time)

  • “暂停时间” 指一个时间段内应用程序线程暂停,让GC线程执行的状态
    • 例如,GC期间100毫秒的暂停时间意味着在这100毫秒内没有应用程序线程是活动的。
  • 暂停时间优先,意味着尽可能让单次STW的时间最短:0.1 + 0.1 + 0.1 + 0.1 + 0.1 = 0.5。

暂停时间

1.3.3 吞吐量 vs 暂停时间

  • 高吞吐量较好是因为这会让应用程序的最终用户感觉只有应用程序在做 “生产性” 工作。直觉上,吞吐量越高程序运行越快。
  • 低暂停时间(低延迟)较好是 因为从最终用户的角度来看,无论是GC还是其他原因导致一个应用 被挂起始终是不好的。这取决于应用程序的类型,有时候甚至短暂的200毫秒暂停都可能打断中断用户体验。因此,具有低的较大暂停时间是非常重要的,特别是对于一个 交互式应用程序
  • 不幸的是 “高吞吐量” 和 “低暂停时间” 是一对相互竞争的目标(矛盾)。
    • 如果选择以吞吐量优先,那么 必然需要降低内存回收的执行频率,但是这样会导致GC需要更长的暂停时间来执行内存回收。
    • 如果选择以低延迟优先为原则,那么为了降低每次执行内存回收的暂停时间,也 只能频繁地执行内存回收,但这又引起了年轻代内存的缩减和导致程序吞吐量的下降。

在 设计/使用 GC算法时,我们必须确定我们的目标:一个GC算法只可能针对两个目标之一(即只专注于 较大吞吐量/最小暂停时间),或尝试找到一个二者的折衷。

现在标准:在最大吞吐量优先的情况下,降低停顿时间。

2. 不同的垃圾回收器概述

垃圾收集机制是Java的招牌能力,极大的提高了开发效率。

不同的垃圾回收器和不同厂商的JVM是相关的。

2.1 垃圾收集器发展史

有了虚拟机,就一定需要垃圾收集机制,这就是 Garbage Collection,对应的产品我们称为 Garbage Collector。

  • 1999年,JDK 1.3.1 对应Serial GC,第一款GC。ParNew垃圾收集器是Serial收集器的多线程版本。
  • 2002年2月,Parallel GC 和 Concurrent Mark Sweep GC 跟随 JDK 1.4.2 一起发布。
  • Parallel GC 在 JDK 6 之后成为HotSpot默认GC。
  • 2012年,在JDK1.7u版本中,G1可用。
  • 2017年,JDK 9 中 G1 变为默认的垃圾收集器,以代替CMS。
  • 2018年3月,JDK 10 中 G1 垃圾收集器的并行完整垃圾回收,实现滨兴性来改善最坏情况下的延迟。
  • 2019年9月,JDK 11 发布,引入Epsilon 了垃圾收集器,又被称为 “No-Op(无操作)” 回收器。同时,引入ZGC(Oracle JDK):可伸缩的低延迟垃圾回收器(Experimental)。
  • 2019年3月,JDK 12 发布,增强G1,自动返回未用堆内存给操作系统。同时,引入 Shenandoah GC(Red Hat Open JDK):低停顿时间的GC(Experimental)。
  • 2019年9月,JDK 13发布,增强 ZGC,自动返回未用堆内存给操作系统。
  • 2020年3月,JDK14 发布。删除CMS垃圾回收器。扩展ZGC在macOS和Windows上的应用。

2.2 七款经典的垃圾收集器

  • 串行回收器:Serial、Serial Old
  • 并行回收器:ParNew、Parallel Scavenge、parallel Old
  • 并发回收器:CNS、G1

垃圾回收器

官方链接地址:

https://www.oracle.com/technetwork/java/javase/tech/memorymanagement-whitepaper-1-150020.pdf

2.3 垃圾收集器与分代间关系

垃圾收集器与分代关系

  • 新生代收集器:Serial、ParNew、Parallel Scavenge
  • 老年代收集器:Serial Old、Parallel Old、CMS
  • 整堆收集器:G1

垃圾收集器关系

(实线代表 JDK 14 允许的组合,虚线代表 JDK 8及以前允许的组合)

  1. 两个收集器间有连线,表明它们可以搭配使用:
    • Serial/Serial Old、Serial/CMS、ParNew/Serial Old、ParNew/CMS、Parallel Scavenge/Serial Old、Parallel Scavenge/Parallel Old、G1
  2. 其中 Serial Old 作为 CMS 出现 “Concurrent Mode Failure” 失败的后备预案。
  3. (红色虚线)由于维护和兼容性测试的成本,在 JDK 8 时将Serial + CMS、ParNew + Serial Old 这两个组合声明为废弃(JEP 173),并在 JDK 9 中完全取消了这些组合的支持(JEP 214),即:移除。
  4. (绿色虚线)JDK 14 中:弃用 Parallel Scavenge 和 Serial Old GC 组合(JEP 366)。
  5. (青色虚线)JDK 14 中:删除CMS垃圾回收器(JEP 363)。

默认垃圾收集器:JDK 9 默认为G1 GC 单体;JDK 8 默认为Parallel Scavenge GC + Parallel Old GC 组合。


  • 为什么要有很多收集器?因为Java的使用场景很多,移动端、服务器等。所以就需要针对不同的场景,提供不同的垃圾收集器,提高垃圾收集的性能。
  • 虽然我们会对各个收集器进行比较,但并非了挑选一个最好的收集器出来。没有一种放之四海而皆准、任何场景下都适用的完美收集器存在,更没有万能的收集器。所以,我们选择的只是对具体应用最合适的收集器

2.4 查看默认垃圾回收器

  • -XX:+PrintCommandLineFlags:查看命令行相关参数(包含使用的垃圾收集器)
  • 使用命令行指令:jinfo -flag <相关垃圾回收器参数> <进程ID>

默认垃圾收集器:JDK 9 默认为G1 GC 单体;JDK 8 默认为Parallel Scavenge GC + Parallel Old GC 组合。

-XX:+PrintCommandLineFlags(JDK 1.8):

打印信息

jinfo -flag <相关垃圾回收器参数> <进程ID>(JDK 1.8):

查询信息

-XX:+PrintCommandLineFlags(JDK 9 ~ 15):

打印信息

3. Serial 回收器:串行回收

  • Serial 收集器是最基本、历史最悠久的垃圾收集器了。JDK 1.3 之前回收新生代唯一的选择。

  • Serial 收集器作为 HotSpot 中 Client 模式下的默认新生代垃圾收集器。

  • Serial 收集器采用复制算法、串行回收、“Stop-the-World” 机制的方式执行内存回收。

  • 除了年轻代之外,Serial收集器还提供用于执行老年代垃圾收集的 Serial Old收集器。Serial Old 收集器同样也采用了串行回收和 “Stop-the-World” 机制,只不过内存回收算法使用的是标记-压缩算法。

    • Serial Old 是运行在 Client 模式下默认的老年代的垃圾回收器。

    • Serial Old在Server模式下主要有两个用途:

      1. 与新生代的Parallel Scavenge配合使用

      2. 作为老年代CMS收集器的后备垃圾收集方案

Serial收集器

这个收集器是一个单线程的收集器,但它的 “单线程” 的意义并不仅仅说明它 只会使用一个CPU 或 一条收集线程去完成垃圾收集工作,更重要的意义是在它进行垃圾收集时,必须暂停其他所有的工作线程,直至它收集结束(Stop The World)。

  • 优势:简单而高效(与其他收集器的单线程比),对于限定单个 CPU 的环境来说,Serial收集器由于没有线程交互的开销,专心做垃圾收集自然可以获得最高的单线程收集效率。
    • 运行在Client模式下的虚拟机是个不错的选择。
  • 在用户的桌面应用场景中,可用内存一般不大(几十MB ~ 一两百 MB),可以在较短的时间内完成垃圾收集(几十ms ~ 一百多ms),只要不频繁发生,使用串行回收器是可以接受的
  • 在 HotSpot虚拟机中,使用 -XX:+UseSerialGC 参数可以指定年轻代、老年代都使用串行收集器。
    • 等价于 新生代用 Serial GC,且老年代用 Serial Old GC。

总结:

这种垃圾收集器现在已经不太使用了。而且在单核CPU才会使用。

对于交互性较强的应用而言,这种垃圾收集器是不能接受的。一般在JavaWeb应用程序中是不会采用串行垃圾收集器的。

4. ParNew 回收器:并行回收

  • 如果说 Serial GC 是年轻代的单线程垃圾收集器,那么ParNew收集器则是Serial收集器的多线程版本。
    • Par 是 Parallel 的缩写,New:只能处理新生代。
  • ParNew 收集器除了采用 并行回收 的方式执行内存回收外,与 Serial GC相比:两款垃圾收集器间几乎没有任何区别。ParNew收集器在年轻代中同样也是 采用复制算法、“Stop-the-World” 机制。
  • ParNew 是很多 JVM 运行在 Server模式下新生代的默认垃圾收集器。

ParNew收集器

  • 对于新生代,回收次数频繁,使用并行方式高效。
  • 对于老年代,回收次数少,使用串行方式节省资源。(CPU 并行需要切换线程,串行可以省去切换线程的资源)

  • 由于ParNew收集器是基于并行回收的,那么是否可以断定ParNew收集器的回收效率在任何场景下都会比Serial收集器更高效?

    • ParNew 收集器运行在多CPU的环境下,由于可以充分利用多CPU、多核心等物理硬件资源优势,可以更快速地完成垃圾收集,提升程序的吞吐量。
    • 但是 在单个CPU的环境下,ParNew收集器不比Serial 收集器更高效。虽然Serial收集器是基于串行回收的,但是由于CPU无需频繁做任务切换,因此可以有效避免多线程交互过程中产生的一些额外开销。
  • 除Serial外,目前只有 ParNew GC 能与 CMS 收集器配合工作。

  • 在程序中,开发人员可以通过选项 -XX:+UseParNewGC 手动指定使用ParNew收集器执行内存回收任务。

    • 它表示年轻代使用并行收集器,不影响老年代。
  • -XX:ParallelGCThread:限制线程数量,默认开启和CPU数据相同的线程数。

5. Parallel 回收器:吞吐量优先

5.1 Parallel 概述

  • HotSpot的年轻代除了拥有ParNew收集器是基于并行回收以外,Parallel Scavenge收集器同样也采用了 复制算法、并行回收、“Stop-the-World” 机制。
  • 那么Parallel收集器的出现是否多此一举?
    • 与ParNew收集器不同,Parallel Scavenge 收集器的目标则是达到一个 可控制的吞吐量(Throughput),它也被称为吞吐量优先的垃圾收集器。
    • 自适应调节策略也是 Parallel Scavenge 与 ParNew 一个重要区别。
  • 高吞吐量则可以高效率地利用 CPU 时间,尽快完成程序的运算任务,主要 适合在后台运算而不需要太多交互的任务。因此,常见在服务器环境中使用。例如,那些执行批量处理、订单处理、工资支付、科学计算的应用程序
  • Parallel 收集器在 JDK 1.6 时提供了用于执行老年代垃圾收集的 Parallel Old 收集器,用以替代老年代的 Serial Old 收集器(服务端 → 性能较高)。
  • Parallrl Old 收集器采用了 标记—压缩算法,但同样也是基于 并行回收、 “Stop-the-World” 机制。

Parallel收集器

  • 在程序吞吐量优先的应用场景中,Parallel收集器 和 Parallel Old 收集器的组合,在Server模式下的内存回收性能很不错。
  • 在 Java 8 中,默认是此垃圾收集器。

5.2 Parallel 参数配置

  • -XX:+UseParallelGC:手动指定年轻代使用 Parallel 并行收集器执行内存回收任务。
  • -XX:+UseParallelOldGC:手动指定老年代使用 Parallel Old 并行回收收集器。
    • 分别适用于新生代、老年代。JDK 8 默认开启
    • 上面两个参数,默认开启一个,另一个也会被开启(互相激活)
  • -XX:ParallelGCThread:设置年轻代并行收集器的线程数 。一般地,最好与CPU数量相等,以避免过多的线程数影响垃圾收集性能。
    • 在默认情况下,当 CPU 数量小于 8个,ParallelThreads 的值等于 CPU 数量。
    • 当 CPU 数量大于 8个,ParallelGCThread 的值等于 3 + ⌊5 * CPU_COUNT / 8⌋
  • -XX:MaxGCPauseMillis:设置垃圾收集器最大停顿时间(即 STW时间, 单位: 毫秒)。
    • 为了尽可能地把停顿时间控制在MaxGCPauseMills以内,收集器在工作时会调整Java堆大小或其他一些参数。
    • 对于用户来讲,停顿的时间越短体验越好。但是在服务器端,我们注重高并发,整体的吞吐量。所以服务器端适合 Parallel,进行控制。
    • 该参数使用需谨慎。
  • -XX:GCTimeRatio:垃圾收集时间占总时间的比例(= 1 / (N + 1) ),用于衡量吞吐量的大小。
    • N:取值范围 (0, 100)。默认值99,也就是垃圾回收时间不超过1%。
    • 与前一个 -XX:MaxGCPauseMillis 参数有一定矛盾性。暂停时间越长,Ratio参数就越容易超过设定的比例。
  • -XX:+UseAdaptiveSizePolicy:设置 Parallel Scavenge 收集器具有 自适应调节策略
    • 在这种模式下,年轻代的大小、Eden、Survivor 的比例、晋升老年代的对象年龄等参数会被自动调整,以达到在堆大小、吞吐量、停顿时间之间的平衡点。
    • 在手动调优比较困难的场合,可以直接使用这种自适应的方式,仅指定虚拟机的最大堆、目标的吞吐量(GCTimeRatio)和 停顿时间(MaxGCPauseMills),让虚拟机自动完成调优工作。

6. CMS 回收器:低延迟

6.1 CMS 概述

  • 在 JDK 1.5 时期,HotSpot 推出了一款在 强交互应用 中几乎可认为有划时代意义的垃圾收集器:CMS(Concurrent-Mark-Sweep)收集器,这款收集器是 HotSpot 虚拟机中第一款真正意义上的并发收集器,它第一次实现了让垃圾收集线程与用户线程同时工作。
  • CMS 收集器的关注点是尽可能缩短垃圾收集时用户线程的停顿时间。停顿时间越低(低延迟)就越适合与用户交互的程序,良好的响应速度能提升用户体验。
    • 目前很大一部分的Java应用集中在互联网站或B/S系统的服务端上,这类应用尤其重视服务的响应速度,希望系统停顿时间最短,以给用户带来较好的体验。CMS收集器就非常符合这类应用的需求。
  • CMS垃圾收集算法采用 标记—清除 算法,并且也会 “Stop-the-World”。

不过,CMS 作为老年代的收集器,却无法与 JDK 1.4.0 中已经存在的新生代收集器 Parallel Scavenge 配合工作,所以在 JDK 1.5 中使用 CMS 来收集老年代的时候,新生代只能选择 ParNew / Serial 收集器其中之一。

在 G1 出现之前,CMS 使用还是非常广泛的。时至今日,仍然有很多系统使用 CMS GC。

CMS收集器

6.2 CMS 工作原理

CMS 整个过程比之前的收集器要复杂,整个过程分为4个主要阶段,即:初始标记阶段、并发标记阶段、重新标记阶段、并发清除阶段。

  • 初始标记(Initial-Mark)阶段:在这个阶段中,程序中所有的工作线程都会因为 “Stop-the-World” 机制而出现短暂的暂停,这个阶段的主要任务 仅仅只是标记出 GC Roots 能直接关联到的对象。一旦标记完成之后,就会恢复之前被暂停的所有应用线程。由于直接关联对象比较小,所以这里的 速度非常快
  • 并发标记(Concurrent-Mark)阶段:从 GC Roots 的 直接关联对象开始遍历整个对象图的过程,这个过程 耗时较长 但是 不需要停顿用户线程,可以与垃圾收集线程一起并发运行。
  • 重新标记(Remark)阶段:由于在并发标记阶段中,程序的工作线程会和垃圾收集线程同时运行或者交叉运行,因此为了 修正并发标记期间,因用户程序继续运作而导致标记产生变动的那一部分对象的标记记录,这个阶段的停顿时间通常会比初始标记阶段稍长一些,但也远比并发标记阶段的时间短。
  • 并发清理(Concurrent-Sweep)阶段:此阶段 清理删除掉标记阶段判断的已经死亡的对象,释放内存空间。由于不需要移动存活对象,所以这个阶段也是可以与用户线程同时并发的。

6.3 CMS 特点

尽管CMS 收集采用的是并发回收(非独占式),但是在其 初始化标记和再次标记这两个阶段中仍然需要执行 “Stop-the-World” 机制 暂停程序中的工作线程,不过暂停时间并不会太长,因此可以说明目前所有的垃圾收集器都做不到完全不需要 “Stop-the-World”,只是尽可能地缩短暂停时间。

由于最耗费时间的 并发标记并发清除 阶段都不需要暂停工作,所以整体的回收是低停顿的。

此外,由于在垃圾收集阶段用户线程没有中断,所以 在CMS回收过程中,还应该确保应用程序用户线程有足够的内存可用。因此,CMS 收集器不能像其他收集器那样等待老年代几乎完全被填满了再进行收集,而是 当堆内存使用率达到某一阈值时,便开始进行回收,以确保应用程序在CMS工作过程中依然有足够的空间支持应用程序运行。要是CMS运行期间预留的内存无法满足程序需要(或垃圾的产生速度远超清理速度),就会出现一次 “Concurrent Mode Failure” 失败,此时虚拟机使用后备方案:临时启用 Serial Old 收集器来重新进行老年代的垃圾回收,这样停顿时间就很长了。

CMS收集器的垃圾收集算法采用的是 标记—清除算法,这意味着每次执行完内存回收后,由于被执行内存回收的无用对象所占用的内存空间极有可能是不连续的一些内存块,不可避免地将会 产生一些内存碎片。那么 CMS 在为新对象分配内存空间时,将无法使用 指针碰撞(Bump the Pointer)技术,而只能选择 空闲列表(Free List)执行内存分配。

CMS特点

既然 Mark Sweep 会造成内存碎片,那么为什么不把算法换成 Mark Compact 呢?

  • 因为当并发清除时,用 Compact 整理内存,原来的用户线程 使用的内存将无法使用。要保证用户线程能继续执行,前提是它运行的资源不受影响(对象地址不能更改)。Mark Compact 更适合 “Stop the World” 这种场景使用。

6.3.1 CMS 优点

  • 并发收集
  • 低延迟

6.3.2 CMS 弊端

  1. 会产生内存碎片。导致并发清除后,用户线程可用空间不足。在无法分配大对象的情况下,不得不提前触发 Full GC。
  2. CMS 收集器对 CPU 资源非常敏感。在并发阶段,它虽然不会导致用户停顿,但是会因为占用了一部分线程而导致用户应用程序变慢,总吞吐量会降低。
  3. CMS 收集器无法处理浮动垃圾。可能出现 “Concurrent Mode Failure” 失败而导致另一次 Full GC 的产生。在并发标记阶段由于程序的工作线程和垃圾收集线程是 同时运行/交叉运行的,那么 在并发标记阶段如果产生新的垃圾对象,CMS将无法对这些垃圾对象进行标记,最终会导致这些新产生的垃圾对象(浮动垃圾)没有被及时回收,从而只能在下一次执行GC时释放这些之前未被回收的你内存空间。

6.4 CMS 参数配置

  • -XX:+UseConcMarkSweepGC:手动指定使用 CMS 收集器执行内存回收任务。

    • 开启该参数会自动将 -XX:+UseParNewGC 打开。即:ParNew (Young区) + CMS/SerialOld (Old区) 组合。
  • -XX:CMSInitiatingOccupanyFraction:设置堆内存使用率阈值,一旦达到此阈值,便开始进行回收。

    • JDK 5 及以前版本的默认值为68,即当老年代的使用率达到68%时,会执行一次 CMS 回收。JDK 6 及以上版本默认值为92%
    • 如果内存增长缓慢,则可以设置一个稍大的值,大的阈值可以有效降低 CMS 的触发频率,减少老年代回收的次数可以较为明显地改善应用程序性能。反之,如果应用程序内存使用率增长很快,则应该降低这个阈值,以避免频繁触发老年代串行收集器。因此,通过该选项便可以有效降低 Full GC 的执行次数。
  • -XX:+UseCompactAtFullCollection:用于指定在执行完 Full GC 后对内存空间进行压缩整理,以此避免内存碎片的产生。不过由于内存压缩整理过程无法并发执行,所带来的问题就是停顿时间变得更长了。

  • -XX:CMSFullGCsBeforeCompaction:设置在执行多少次 Full GC 后对内存空间进行压缩整理。

  • -XX:ParallelCMSThread:设置 CMS 的线程数量。

    • CMS 默认启动的线程数是 ⌊(ParallelGCThread + 3) / 4⌋,Parallel GCThread 是年轻代并行收集器的线程数。当CPU资源比较紧张时,受到CMS收集器线程的影响,应用程序的性能在垃圾回收阶段可能会非常糟糕。

6.5 JDK 后续版本中 CMS 变化

  • JDK 9 新特性:CMS被标记为Deprecate(JEP291)
    • 如果对 JDK 9 及以上版本的 HotSpot 虚拟机使用参数 -XX:+UseConcMarkSweepGC 来开启 CMS 收集器,用户会收到一个警告信息,提示 CMS 未来将会被废弃。
  • JDK 14 新特性:删除 CMS 垃圾回收器(JEP363)
    • 移除了 CMS 垃圾收集器,若在 JDK 14 中使用 -XX:UseConcMarkSweepGC,JVM不会报错,只是给出一个 warning 信息,但是不会 exit。JVM会自动回退以默认 GC 方式启动 JVM。
OpenJDK 64-Bit Server VM warning: Ignoring option UseConcMarkSweepGC;
support was removed in 14.0
and the VM will continue execution using the default collector.

6.6 小结

最小化 使用内存 & 并行开销:Serial GC

最大化 应用程序吞吐量:Parallel GC

最小化 GC中断 / 停顿时间:CMS GC

7. G1 回收器:区域化分代式

既然已经有了前面几个强大的GC,为什么还要发布 Garbage First(G1)GC 呢?

应用程序所面对的 业务越来越庞大、复杂,用户越来越多,没有GC就不能保证应用程序正常进行,而经常造成STW的GC又跟不上实际的需求,所以才会不断地尝试对GC进行优化。G1(Garbage-First)垃圾回收器是在 Java7 Update 4 之后引入的一个新的垃圾回收器,是当今收集器技术发展的最前沿成果之一。

与此同时,为了适应现在 不断扩大的内存 和 不断增加的处理器数量,进一步降低暂停时间(pause time),同时兼顾良好的吞吐量。

官方给G1设定的目标是在延迟可控的情况下,获得尽可能高的吞吐量,所以才担当起 “全功能收集器” 的重任与期望。


为什么名字叫做 Garbage First(G1)GC 呢?

  • 因为 G1 是并行回收器,它把堆内存分割为很多不相关的区域(Region)(物理上不连续的)。使用不同的Region来表示Eden、幸存者0区/1区、老年代等。
  • G1 GC 有计划地避免在整个Java堆中进行全区域的垃圾收集。G1跟踪各个 Region 里面的垃圾堆积的价值大小(回收所获得的空间大小以及回收所需时间的经验值),在后台维护一个优先列表,每次根据时间允许的收集时间,优先回收价值最大的 Region
  • 由于这种方式的侧重点在于回收垃圾最大量的区间(Region),所以我们给G1一个名字:垃圾优先(Garbage First)。

7.1 G1 概述

G1(Garbage-First)是一款面向服务端的垃圾收集器,主要针对配备多核CPU及大容量内存的机器,以极高概率满足GC停顿时间的同时, 还兼具高吞吐量的性能特征。

在 JDK 1.7 版本正式启用,移除了 Experimental 标识,JDK 9 以后的默认垃圾回收器,取代了CMS 回收器以及 Parallel + Parallel Old的组合。被Oracle官方称为 “全功能垃圾收集器”。

与此同时,CMS已经在 JDK 9 中被标识为废弃(deprecated)。G1 在 JDK 8 中还不是默认的垃圾回收器,需要使用 -XX:+UseG1GC 来启用。

7.2 G1 特点

与其他 GC 收集器相比,G1使用了全新的分区算法。

7.2.1 G1 优势

  • 并行 & 并发
    • 并行性:G1 在回收期间,可以有多个GC线程同时工作,有效利用多核计算能力。此时用户线程STW。
    • 并发性:G1 拥有与应用程序交替执行的能力,部分工作可以和引用程序同时执行,因此,一般来说,不会在整个回收阶段发生完全阻塞应用程序的情况。
  • 分代收集
    • 从分代上看,G1仍然属于分代性垃圾回收器,它会区分年轻代和老年代,年轻代依然有Eden区、Survivor区。但从堆的结构上看,它不要求整个年轻代、老年代都是连续的,也不再坚持固定大小、固定数量。
    • 堆空间分为若干个区域(Region),这些区域中包含了逻辑上的年轻代、老年代。
    • 与之前的各类回收器不同,他同时 兼顾年轻代、老年代。对比其他回收器,要么工作在年轻代,要么工作在老年代。

G1概念更改

G1

  • 空间整合

    • CMS:“标记—清除”算法、内存碎片、若干次GC后进行一次碎片整理。
    • G1将内存划分为一个个的region。内存的回收以region作为基本单位。Region之间是复制算法,但整体上实际可看作是 标记—压缩(Mark-Compact)算法,两种算法都可以避免内存碎片。这种特性有利于程序长时间运行,分配大对象时不会因为无法找到连续内存空间而提前触发下一次 GC。尤其是当 Java堆 非常大的时候,G1的优势更加明显。
  • 可预测的停顿时间模型(软实时:soft real-time: 尽可能在指定时间内完成GC)

    这是 G1 相对于 CMS 的另一大优势,G1除了追求低停顿外,还能建立可预测的停顿时间模型,能让使用者明确执行在一个长度为 M 毫秒的时间片段内,消耗在垃圾收集上的时间不得超过 N 毫秒。(吞吐量:(M - N) / M)

    • 由于分区的原因,G1可以只选取部分区域进行内存回收,这样缩小了回收的范围,因此对于全局停顿情况的发生也能得到较好的控制。
    • G1 跟踪各个 Region 里面的垃圾堆积的价值大小(回收所获得的空间大小以及回收所需时间的经验值),在后台维护了一个优先列表,每次根据允许的收集时间,优先回收价值最大的Region。保证了 G1 收集器在有限时间内可以 获取尽可能高的收集效率
    • 相比于 CMS GC,G1 未必能做到 CMS 在最好情况下的延时停顿,但是最差情况要好很多。

7.2.2 G1 缺点

相较于CMS,G1 还不具备全方位、压倒性优势。比如,在用户程序运行过程中,G1无论是为了垃圾收集产生的内存占用(Footprint)还是程序运行时的额外执行负载(Overload)都比 CMS 高。

从经验上来说,在小内存应用上 CMS 的表现大概率会优于 G1,而 G1 在大内存应用上则发挥其优势。平衡点在 6~8GB 之间。

7.3 G1 参数设置

  • -XX:+UseG1GC:手动指定使用 G1 收集器执行内存回收任务。
  • -XX:G1HeapRegionSize:设置每个Region的大小。值是2的幂,范围是1MB ~ 32 MB 之间,目标是根据最小的 Java堆 大小划分出约 2048 个区域。默认是堆内存的 1/2000。
  • -xx:MaxGCPauseMillis:设置期望达到的最大 GC 停顿时间指标(JVM会尽力实现,但不保证达到)。默认值200ms。(时间越短 → 可选取的region数量就越小)
  • -XX:ParallelGCThread:设置 STW 时GC线程数的值。最多设置为8。
  • -XX:ConcGCThread:设置并发标记的线程数。将n设置为并行垃圾回收线程数(ParallelGCThread)的 1/4 左右。
  • -XX:InitiatingHeapOccupancyParen:设置触发并GC周期的Java堆占用率阈值,超过此值,就触发GC。默认值45。

G1的设计原则:简化JVM性能调优,开发人员只需要简单的3步,即可完成调优:

  1. 开启 G1 垃圾收集器
  2. 设置堆的最大内存
  3. 设置最大的停顿时间

G1 中提供了3种垃圾回收模式:Young GC、Mixed GC、Full GC,在不同的条件下被触发。

7.4 G1 适用场景

  • 面向服务端应用,针对具有大容量、多处理器的机器。(在普通大小的堆里表现并不惊喜)
  • 最主要的应用是需要低 GC 延迟,并且具有大堆的应用程序提供解决方案。
  • 如:在堆大小约 6GB 或更大时,可预测的暂停时间可以低于0.5 秒;(G1 通过每次只清理一部分而不是全部的Region的增量式清理来保证每次 GC 停顿时间不会过长)。

  • 用以替换掉 JDK 1.5 中的 CMS 收集器,在这些情况时,使用 G1 可能比 CMS 好:
    1. 超过 50% 的Java堆被活动数据占用。
    2. 对象分配频率或年代提升频率变化很大。
    3. GC停顿时间过长(长于 0.5 ~ 1 s)

  • HotSpot 垃圾收集器中,除了G1以外,其他的垃圾收集器使用内置的JVM线程执行GC的多线程操作,而 G1 GC 可以采用应用线程承担后台运行的GC工作,即当 JVM 的 GC 线程处理速度慢时,系统会调用应用程序线程帮助加速垃圾回收过程。

7.5 分区Region:化零为整

使用 G1 收集器时,它将整个Java堆划分成约2048个大小相同的独立Region块,每个Region块大小根据堆空间的实际大小而定,整体被控制在 1MB ~ 32MB 之间,且为2的N次幂,即1MB, 2MB, 4MB, 8MB, 16MB, 32MB。可以通过 -XX:G1HeapRegionSize设定。所有的Resion大小相同,且在JVM生命周期内不会被改变。

虽然还保留有新生代、老年代的概念,但新生代和老年代不再是物理隔离的了,它们都是一部分Region(不需要连续)的集合。通过Region的动态分配实现逻辑上的连续。

G1

  • 一个 region 有可能属于 Eden/Servivor 或者 Old/Tenured 内存区域。但是一个region只可能属于一个角色。图中的 E 表示该region属于Eden内存区域,S 表示属于 Survivor 内存区域,O 表示属于 Old 内存区域。途中空白的表示未使用的内存空间。
  • G1 垃圾收集器还增加了一种新的内存区域,叫做 Humongous 内存区域,如图中的 H 块。主要用于存储大对象,如果超过 1.5 个 region,就放到 H。

设置 H 的原因:

对于堆中的大对象,默认直接会被分配到老年代,但是如果它是一个短期存在的大对象,就会对垃圾收集器造成负面影响。为了解决这个问题,G1划分了一个 Humongous 区,它用来专门存放大对象。如果一个 H 区装不下一个大对象,那么 G1 会寻找连续的 H 区来存储。为了能找到连续的 H 区,有时候不得不启动 Full GC。G1的大多数行为都把 H 区作为老年代的一部分来看待。

指针碰撞(Bump-the-Pointer)

指针碰撞

7.6 G1 主要回收环节

G1 GC 的垃圾回收过程主要包括如下三个环节:

  • 年轻代 GC(Young GC)
  • 老年代并发标记过程(Concurrent Marking)
  • 混合回收(Mixed GC)
  • (如果需要,单线程、独占式、高强度的 Full GC 还是继续存在的。它针对 GC 的评估失败提供了一种失败保护机制,即强力回收)

主要回收环节

顺时针:Young GC → Young GC + Concurrent Mark → Mixed GC 顺序 进行垃圾回收。

应用程序分配内存,当年轻代的Eden区用尽时开始年轻代回收过程:G1的年轻代收集阶段是一个 并行的独占式 收集器。在年轻代回收期,G1 GC 暂停所有应用程序线程,启动多线程执行年轻代回收。然后 从年轻代区间移动存活对象至 Survivor区间 / 老年代区间,也有可能两个区间都涉及

当堆内存使用达到一定值(默认%)时,开始老年代并发标记过程。

标记完成马上开始混合回收过程。对于一个混合回收期,G1 GC 从老年区间移动存活对象到空闲区间,这些空闲区间也就成为了老年代的一部分。与年轻代不同,老年代的G1回收期和其他GC不同,G1的老年代回收期不需要整个老年代被回收,一次只需要扫描/回收一小部分老年代的Region就可以了。同时,老年代 Region 和年轻代一起被回收。

举例:一个Web服务器,Java进程最大堆内存为 4G,每分钟响应1500个请求,每 45s 会新分配约 2G 内存。G1会每 45s 进行一次年轻代回收,每 31h 整个堆的使用率会达到 45% ,会开始老年代并发标记过程。标记完成后,开始 4~ 5次 混合回收。

7.7 记忆集 & 写屏障

Remembered Set - 记忆集

  • 一个对象被不同区域引用的问题。

  • 一个Region不可能是孤立的,一个Region中的对象可能被其他任意Region中对象引用,判断对象存活时,是否需要扫描整个Java堆才能保证准确?在其他分代收集器,也存在这样的问题(而G1更突出)

  • 回收新生代也不得不同时扫描老年代,这样会降低 Minor GC 的效率。


解决方法:

  • 无论G1 还是其他分代收集器,JVM都是使用Remembered Set 来避免全局扫描。
  • 每个Region 都有一个对应的Remembered Set。
  • 每次Reference类型数据写操作时,都会产生一个 Write Barrier (写屏障) 暂时中断操作。
  • 然后检查将要写入的引用指向的对象是否和该Reference类型数据在不同的Region(其他收集器:检查老年代对象是否引用了新生代对象)
  • 如果不同,通过 CardTable 把相关引用信息记录到引用指向对象的所在 Region 对应的 Remembered Set 中。
  • 当进行垃圾收集时在,GC根节点的枚举范围加入 Remembered Set,就可以保证不进行全局扫描,也不会有遗漏。

RSet

7.8 G1 垃圾回收过程

7.8.1 回收过程Ⅰ:年轻代GC

JVM启动时,G1先准备好Eden区,程序在运行过程中不断创建对象到Eden区,当Eden空间耗尽时,G1会启动一次年轻代垃圾回收过程。

年轻代垃圾回收只会回收Eden区和Survivor区。

YGC时,首先G1停止应用程序的执行(Stop-the-World),G1创建回收集(Collection Set),会收集是指需要被回收的内存分段的集合,年轻代回收过程的回收集包含年轻代 Eden区 和 Servivor区 所有的内存分段。

YGC


  1. 第一阶段:扫描根
    • 根指static变量指向的对象,正在执行的方法调用链条上的局部变量等。根引用连同RSet记录的外部引用作为扫描存活对象的入口。
  2. 第二阶段:更新RSet
    • 处理 dirty card queue 中的 card,更新RSet。此阶段完成后,RSet可以准确的反映老年代对所在的内存分段中对象的引用。
      • 对于应用程序的引用赋值语句 object1.field = object2;,JVM会在之前和之后执行特殊的操作,以在 dirty card queue 中入队一个保存了对象引用信息的card。在年轻代回收的时候,G1会对Dirty Card Queue中所有的Card进行处理,以更新RSet,保证RSet实时准确的反映引用关系。
      • 为何不在引用赋值语句处直接更新RSet呢?这是为了性能的需要,RSet 的处理需要线程同步,开销会很大,使用队列性能会好很多。
  3. 第三阶段:处理RSet
    • 识别被老年代对象指向的Eden中的对象,这些被指向的Eden中的对象被认为是存活的对象。
  4. 第四阶段:复制对象
    • 此阶段,对象树被遍历,Eden区内存段中存活的对象会被复制到 Survivor 区中空的内存分段,Survivor 区内存段中存活的对象如果年龄未达到阈值,年龄+1;达到阈值,会被复制到Old区中空的内存分段。如果Survivor空间不够,Eden空间的部分数据会直接晋升到老年代空间。
  5. 第五阶段:处理引用
    • 处理 Soft、Weak、Phantom、Final、JNI Weak 等引用。最终Eden空间的数据为空,GC停止工作,而目标内存中的对象都是连续存储的,没有碎片,所以复制过程可以达到内存整理的效果,减少碎片。

7.8.2 回收过程Ⅱ:并发标记过程

  1. 初始标记阶段(Initial Marking, STW):标记从根节点直接可达的对象。这个阶段是STW的,并且会触发一次年轻代GC。
  2. 根区域扫描(Root Region Scanning):G1 GC 扫描 Servivor 区直接可达的老年代区域对象,并标记被引用的对象。这一过程必须在 Young GC 之前完成。
  3. 并发标记(Concurrent Marking):在整个堆中进行并发标记(和应用程序并发执行),此过程可能会被 Young GC 中断。在并发标记阶段,若发现区域对象中的所有对象都是垃圾,那这个区域会被立即回收。同时,并发标记过程中,会计算每个区域的对象活性(区域中存活对象的比例)。
  4. 再次标记(Remark, STW):由于应用程序持续进行,需要修正上一次的标记结果(STW)。G1中采用了比CM更快的初始快照算法 : snapshot-at-the-beginning(SATB)。
  5. 独占清理(Cleanup, STW):计算各个区域的存活对象和GC回收比例,并进行排序,识别可以混合回收的区域。为下阶段做铺垫。
    • 这个阶段并不会实际上去做垃圾的收集。
  6. 并发清理阶段:识别并清理完全空闲的区域。

7.8.3 回收过程Ⅲ:混合回收

当越来越多的对象晋升到老年代 Old Region 时,为了避免堆空间被耗尽,虚拟机会触发一个混合的垃圾收集器,即 Mixed GC,该算法并不是一个Old GC,除了回收整个 Young Region,还会回收部分 Old Region。

这里需要注意:回收部分老年代,并非全部老年代。可以选择哪些 Old Region 进行收集,从而可以对垃圾回收的耗时进行控制。Mixed GC 并不是 Full GC。

混合回收

  • 并发标记结束以后,老年代中100%为垃圾的内存分段被回收了,部分为垃圾的内存分段被计算出来。默认情况下,这些老年代的内存分段会分8次(可以通过 -XX:G1MixedGCCountTarget 设置)被回收。
  • 混合回收的回收集(Collection Set)包括:1/8 的老年代内存分段、Eden区内存分段、Survivor区内存分段。混合回收的算法和年轻代回收的算法完全一样,只是回收集多了老年代的内存分段。
  • 由于老年代中的内存分段默认分8次回收,G1会优先回收垃圾多的内存分段。垃圾占内存分段比例越高的,越会被优先回收。并且有一个阈值会决定内存分段是否被回收,-XX:G1MixedGCLiveThresholdPercent,默认为65%,即垃圾占内存分段比例要达到65%才会被回收。如果垃圾占比太低,意味着存活的对象占比高,在复制时会花费更多时间。
  • 混合回收并不一定要进行8次。有一个阈值 -XX:G1HeapWastePercent,默认值为10%,即允许整个堆内存中有10%的空间被浪费,意味着如果发现可以回收的垃圾占堆内存的比例低于10%,则不再进行混合回收。因为GC会花费很多的时间但是回收到的内存却很少。

7.8.4 回收过程Ⅳ (可选):Full GC

G1 的初衷就是要避免Full GC 的出现。但是如果上述方式不能正常工作,G1会 停止应用程序的执行(Stop-the-World),使用 单线程 的内存回收算法进行垃圾回收,性能会非常差,应用程序停顿时间很长。

要避免 Full GC 的发生,一旦发生需要进行调整。何时会发生 Full GC 呢?比如 堆内存太小,当 G1 在复制存活对象时,没有空的内存分段可以使用,则会回退到 Full GC,这种情况可以通过增大内存解决。

导致 G1 Full GC 的原因可能有两个:

  1. Evacuation时,没有足够的 to-space 来存放晋升的对象;
  2. 并发处理过程完成之前空间耗尽。

7.8.5 回收过程:补充

从Oracle官方透露出来的信息可获知,回收阶段(Evacuation)其实本也有想过设计成与用户程序一起并发执行,但这件事情做起来比较复杂,考虑到G1只是回收一部分Region,停顿时间是用户可控的,素以并不迫切去实现,而 选择把这个特性放在G1之后出现的低延迟垃圾收集器(ZGC)中。另外,还考虑到G1不仅仅面向低延迟,停顿用户线程能够最大幅度提高垃圾收集频率,为了保证吞吐量所以才选择了完全暂停用户线程的实现方案。

7.9 G1 优化建议

  • 年轻代大小
    • 避免使用-Xmn-XX:NewRatio等相关选项显式设置年轻代大小
    • 固定年轻代的大小会覆盖暂停时间目标
  • 暂停时间目标不要太过苛刻
    • G1 GC 的吞吐量目标是 90% 的应用程序时间 和 10% 的垃圾回收时间
    • 评估 G1 GC 的吞吐量时,暂停时间目标不要太严苛。目标太过严苛表示你愿意承受更多的垃圾回收开销,而这些会直接影响到吞吐量。

8. 垃圾回收器总结

8.1 概述

截至 JDK 1.8,一共有7款不同的垃圾收集器。每一款不同的垃圾收集器都有不同的特点,在具体使用的时候,需要根据具体的情况选用不同的垃圾收集器。

垃圾收集器分类作用位置使用算法特点使用场景
Serial串行新生代复制算法响应速度优先适用于单CPU环境下的Client模式
ParNew并行新生代复制算法响应速度优先多CPU环境Server模式下与CMS配合使用
Parallel并行新生代复制算法吞吐量优先适用于后台运算而不需太多交互的场景
Serial Old串行老年代标记 - 压缩算法响应速度优先适用于单CPU环境下的Client模式
Parallel Old并行老年代标记 - 压缩算法吞吐量优先适用于后台运算而不需太多交互的场景
CMS并发老年代标记 - 清除算法响应速度 优先适用于互联网或B/S业务
G1并发 + 并行新生代 + 老年代标记 - 压缩算法、复制算法相应速度优先面向服务端应用

GC发展阶段:

  • Serial → Parallel(并行)→ CMS(并发)→ G1 → ZGC

不同厂商、不同版本的虚拟机实现差别很大。HotSpot 虚拟机在 JDK 7/8 后(JDK 14)所有收集器、组合 (连线) :

垃圾收集器组合

(实线代表 JDK 14 允许的组合,虚线代表 JDK 8及以前允许的组合)

  1. 两个收集器间有连线,表明它们可以搭配使用:
    • Serial/Serial Old、Serial/CMS、ParNew/Serial Old、ParNew/CMS、Parallel Scavenge/Serial Old、Parallel Scavenge/Parallel Old、G1
  2. 其中 Serial Old 作为 CMS 出现 “Concurrent Mode Failure” 失败的后备预案。
  3. (红色虚线)由于维护和兼容性测试的成本,在 JDK 8 时将Serial + CMS、ParNew + Serial Old 这两个组合声明为废弃(JEP 173),并在 JDK 9 中完全取消了这些组合的支持(JEP 214),即:移除。
  4. (绿色虚线)JDK 14 中:弃用 Parallel Scavenge 和 Serial Old GC 组合(JEP 366)。
  5. (青色虚线)JDK 14 中:删除CMS垃圾回收器(JEP 363)。

默认垃圾收集器:JDK 9 默认为G1 GC 单体;JDK 8 默认为Parallel Scavenge GC + Parallel Old GC 组合。

8.2 如何选择垃圾回收器?

  • Java 垃圾收集器的配置对于 JVM 优化来说是一个很重要的选择,选择合适的垃圾收集器可以让 JVM 的性能有一个很大的提升。
  • 如何选择垃圾收集器?
    1. 优先调整堆的大小让JVM自适应完成
    2. 如果内存小于100M,使用串行收集器
    3. 如果是单核、单机程序,并且没有停顿时间的要求,使用串行收集器
    4. 如果是多CPU、需要高吞吐量、允许停顿时间超过1秒,选择并行或JVM自己选择
    5. 如果是多CPU、追求停顿时间、需快速响应(比如延迟不能超过1秒 (互联网应用)),使用并发收集器
  • 官方推荐G1 ( 性能高 ) :现在互联网的项目,基本都是使用G1。

9. GC日志分析

通过阅读GC日志,我们可以了解Java虚拟机内存分配、回收策略。

9.1 常见的显示GC日志的参数

内存分配与垃圾回收参数列表:

  • -XX:+PrintGC:输出GC日志(类似:-verbose:gc
  • -XX:+PrintGCDetails:输出GC的详细日志
  • -XX:+PrintGCTimeStamps:输出GC的时间戳(以基准时间的形式)
  • -XX:+PrintGCDateStamps:输出GC的时间戳(以日期形式:2013-05-04T21:53:59.234+0800)
  • -XX:+PrintHeapAtGC:在进行GC的前后打印出堆信息
  • -Xloggc:../log/gc.log:日志文件的输出路径

9.2 GC日志垃圾回收数据分析

9.2.1 简略GC信息

打开GC日志:

-verbose:gc

这个只会显示总的GC堆的变化,如下:

[GC (Allocation Failure)  42117K->41764K(58880K), 0.0022732 secs]
[Full GC (Ergonomics)  56534K->55933K(58880K), 0.0046232 secs]
[Full GC (Allocation Failure)  55933K->55915K(58880K), 0.0098058 secs]

参数解析:

  • GC、Full GC:GC的类型,GC只在新生代上进行,Full GC 包括新生代、老年代、方法区。

  • Allocation Failure:GC发生的原因。

  • 808325K -> 19298K:堆在GC前的大小和GC后的大小。

  • (17920K):现在堆的总大小

  • 0.0084018 secs:GC持续的时间

9.2.2 详细GC信息

打开GC日志:

-XX:+PrintGCDetails

输出的信息如下:

[GC (Allocation Failure) [PSYoungGen: 17156K->2528K(17920K)] 42069K->41792K(58880K), 0.0022919 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
[Full GC (Ergonomics) [PSYoungGen: 2528K->1103K(17920K)] [ParOldGen: 39264K->40493K(40960K)] 41792K->41597K(58880K), [Metaspace: 3225K->3225K(1056768K)], 0.0113069 secs] [Times: user=0.01 sys=0.00, real=0.01 secs] 
[Full GC (Allocation Failure) [PSYoungGen: 15439K->15439K(17920K)] [ParOldGen: 40493K->40475K(40960K)] 55933K->55915K(58880K), [Metaspace: 3225K->3225K(1056768K)], 0.0084116 secs] [Times: user=0.00 sys=0.00, real=0.01 secs] 

参数解析:

  • GC、Full GC:GC的类型,GC只在新生代上进行,Full GC 包括新生代、老年代、永久代。

  • Allocation Failure:GC发生的原因。

  • PSYoungGen:使用了Parallel Scavenge 并行垃圾收集器的新生代GC前后大小的变化

  • ParOldGen:使用了Parallel Old 并行垃圾收集器的老年代GC前后大小的变化

  • MetaSpace:元数据区GC前后大小的变化,JDK 1.8 中引入了元数据区替代永久代

  • xxx secs:GC花费的时间

  • Times

    • user:垃圾收集器花费所有CPU的时间
    • sys:花费在等待系统调用或系统事件的时间
    • real:GC从开始到结束的时间,包括其他进程占用时间片的实际时间

9.2.3 输出日期

输出GC日期:

-XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps 

输出信息如下:

2022-01-27T22:22:44.949+0800: 0.133: [GC (Allocation Failure) [PSYoungGen: 17156K->2544K(17920K)] 42032K->41804K(58880K), 0.0021751 secs] [Times: user=0.11 sys=0.05, real=0.00 secs] 
2022-01-27T22:22:44.951+0800: 0.135: [Full GC (Ergonomics) [PSYoungGen: 2544K->1055K(17920K)] [ParOldGen: 39260K->40541K(40960K)] 41804K->41597K(58880K), [Metaspace: 3225K->3225K(1056768K)], 0.0118842 secs] [Times: user=0.00 sys=0.00, real=0.01 secs] 
2022-01-27T22:22:44.969+0800: 0.153: [Full GC (Allocation Failure) [PSYoungGen: 15392K->15392K(17920K)] [ParOldGen: 40540K->40522K(40960K)] 55933K->55915K(58880K), [Metaspace: 3225K->3225K(1056768K)], 0.0097747 secs] [Times: user=0.00 sys=0.00, real=0.01 secs] 

9.2.4 保存日志文件

-Xloggc:/path/to/gc.log

9.3 日志补充说明

  • [GC[Full GC说明了这次垃圾收集的停顿类型,如果有 “Full” 则说明 GC 发生了 “Stop-The-World”
  • 使用Serial收集器在新生代的名字是Default New Generation,因此显示的是"[DefNew"
  • 使用ParNew收集器在新生代的名字会变成"[ParNew",意思是 “Paralle New Generation”
  • 使用Parallel Scavenge收集器在新生代的名字是 “[PSYoungGen”
  • 老年代的收集器类比新生代,名字由收集器决定
  • 使用G1收集器,会显示为 “garbage-first heap”

  • Allocation Failure
    • 表明本次引起GC的原因是因为在年轻代中没有足够的空间能够存储新的数据了。
  • [PSYoungGen: 5986K->696K(8740K)] 5896K->704K(9216K)
    • 方括号内:GC回收前年轻代大小、回收后年轻代大小大小、(年轻代总大小)
    • 方括号外:GC回收前年轻代 + 老年代大小,回收后年轻代 + 老年代大小,(年轻代 + 老年代总大小)
  • user用户态回收耗时、sys内核态回收耗时、real实际GC耗时。
    • 由于多核原因,时间总和可能会超过real时间。

JDK 13 使用 -Xlog:gc* 代替 -XX:+PrintGCDetails

[0.004s][warning][gc] -XX:+PrintGCDetails is deprecated. Will use -Xlog:gc* instead.

9.4 解读日志中堆空间数据

Minor GC

Minor GC

Full GC(JDK 7)

Full GC

举例代码:

/**
 * -verbose:gc -Xms20M -Xmx20M -Xmn10M -XX:+PrintGCDetails -XX:SurvivorRatio=8 -XX:+UseSerialGC
 */
public class MyGCLogTest {
    private static final int _1MB = 1024 * 1024;

    public static void testAllocation() {
        byte[] allocation1, allocation2, allocation3, allocation4;
        allocation1 = new byte[2 * _1MB];
        allocation2 = new byte[2 * _1MB];
        allocation3 = new byte[2 * _1MB];
        allocation4 = new byte[4 * _1MB];
    }

    public static void main(String[] args) {
        testAllocation();
    }
}

JDK 7

JDK 7

尝试分配

4MB数组对象无法在新生代任何区域分配空间,则将所有已分配2MB数组对象放入老年代。

2MB对象移动_4MB对象分配

JDK 8

2MB数组对象(小对象)留在新生代,4MB数组对象(大对象)无法在新生代任何区域分配空间,直接在老年代分配空间。

JDK 8

9.5 日志分析工具

可以使用工具分析GC日志,常用的日志分析工具:

  • GCViewer(本地)
  • GCEasy(线上)
  • GCHisto
  • GCLogViewer
  • Hpjmeter
  • garbagecat

GCViewer:

GC Viewer

GC Easy:

GC Easy 01

GC Easy 02

GC Easy 03

GC Easy 04

GC Easy 05

GC Easy 06

GC Easy 07

GC Easy 08

GC Easy 09

GC Easy 10

10. 垃圾回收器的新发展

GC 仍然处于飞速发展中,目前默认的 G1 GC不断进行改进,很多哦我们原来认为的缺点,例如串行的Full GC、Card Table扫描的低效等,都已经被大幅改进。

  • 例如:JDK 10 以后,Full GC 已经是并行运行,很多场景下,其表现还略优于Parallel GC 的并行 Full GC。

Serial GC虽然比较古老,但是简单的设计、实现未必过时。它本身的开销(GC相关数据结构、线程开销)都非常小。随着云计算的兴起,在Serverless等新的应用场景下,Serial GC找到了新的舞台。

而 CMS GC 因为其算法的理论缺陷等原因,虽然现在还有非常大的用户群体,但在 JDK 9 中被标记为废弃,并在 JDK 14 中移除。


JDK 17 (LTS) 默认GC 仍为 G1:
JDK 17

10.1 Epsilon GC

JDK 11 新特性

Epsilon GC:仅作内存分配

ZGC:可伸缩的低延迟垃圾回收器(实验性阶段)

JDK 11 新特性

10.2 Shenandoah GC

OpenJDK 12

  • 现在G1回收期已成为默认回收器很长时间
  • 我们还看到了引入两个新的收集器:
    • ZGC(JDK 11)
    • Shenandoah GC(Open JDK 12)
      • 两者主要特点:低停顿时间

OpenJDK 12 的 Shenandoah GC:低停顿时间 GC(实验性)

Shenandoah,第一款不由Oracle公司团队领导开发的HotSpot垃圾收集器。号称OpenJDK和OracleJDK没有区别的Oracle公司仍然拒绝在Oracle JDK12中支持Shenandoah。

Shenandoah 垃圾回收期最初由 RedHat 进行的一项垃圾收集器研究项目Pauseless GC 的实现,旨在针对JVM上的内存回收实现低停顿的需求。在2014年贡献给OpenJDK。

Red Hat 研发 Shenandoah 团队对外宣称,Shenandoah 垃圾回收器的暂停时间与堆大小无关,这意味着无论将堆设置为200 MB 还是 200GB,99.9% 的目标都可以把垃圾收集的停顿时间限制在10MS以内。不过实际使用性能取决于实际工作堆的大小、工作负载。


OpenJDK 12 的 Shenandoah GC

  • 这是RedHat在2016年发表的论文数据,测试内容是使用ES堆200GB的维基百科数据进行索引。
    • 停顿时间比其他几款收集器确实有了质的飞跃,但也未实现最大停顿时间控制在10ms以内的目标。
    • 而吞吐量方面出现了明显的下降,总运行时间是所有测试收集器里最长的。

总结:

  • Shenandoah GC 弱项:高运行负担下的吞吐量下降。
  • Shenandoah GC 强项:低延迟时间

Shenandoah GC

  • Shenandoah GC 工作分为9个阶段
    1. Init Mark 启动并发标记 阶段
    2. 并发标记遍历 阶段
    3. 并发标记完成 阶段
    4. 并发整理回收无活动区域 阶段
    5. 并发 Evacuation 整理内存区域 阶段
    6. Init Update Refs 更新引用初始化 阶段
    7. 并发更新引用阶段
    8. Final Update Refs 完成引用更新 阶段
    9. 并发回收无引用区域 阶段

10.3 ZGC

官方地址 - JDK 12:

https://docs.oracle.com/en/java/javase/12/gctuning

官方地址 - ZGC:

https://docs.oracle.com/en/java/javase/12/gctuning/z-garbage-collector1.html

相关参数:

-XX:+UnlockExperimentalVMOptions -XX:+UseZGC

ZGC 与 Shenandoah 目标高度相似,在尽可能对吞吐量影响不大的前提下,实现在任意堆内存大小下都可以把垃圾收集的停顿时间限制在10ms以内的低延迟。

ZGC是一款基于Region内存布局的,(暂时) 不设分代的,使用了 读屏障染色指针内存多重映射 技术来实现 可并发的标记—压缩算法 的,以 低延迟为首要目标 的一款垃圾收集器。

ZGC的工作过程分为4个阶段:并发标记 - 并发准备重分配 - 并发重分配 - 并发重映射

ZGC几乎在所有地方并发执行,除了初始标记是STW的。所以停顿时间几乎耗费在初始标记上,这部分的实际时间是非常少的。


测试数据:

测试数据

测试数据

虽然ZGC还处于试验阶段,没有完成所有特性,但此时性能已经相当亮眼,用 “令人震惊、革命性” 来形容不为过。

未来将在服务端、大内存、低延迟应用的首选垃圾收集器。

  • JDK 14 之前,ZGC仅Linux才支持

  • 尽管许多使用ZGC的用户都是用类Linux的环境,但在Windows和macOS上,人们也需要ZGC进行开发部署和测试。许多桌面一个用也可以从ZGC中受益。因此,ZGC特性被移植到了Windows和macOS上。

  • 现在mac或Windows上也能使用ZGC,示例:

    -XX:+UnlockExperimentalVMOptions -XX:+UseZGC
    

10.4 非官方垃圾收集器

10.4.1 AliGC

AliGC是阿里巴巴JVM团队基于G1算法,面向大堆(LargeHeap)应用场景。

指定场景下的对比:

指定场景对比

10.4.2 Zing GC

Zing GC——低延迟GC

https://www.infoq.com/articles/azul_gc_detail

举报

相关推荐

0 条评论