GC日志时间分析

摘要:
因为在记录GC日志的时候,你的程序进行了磁盘读写,如果同一时间其他IO操作较重,则此时GC事件会延迟,进而影响了最终的real的值。可以使用top命令观察一下进程的CPU利用率,同时辅以Profiler工具统计一段时间内进程的状态分布。

在GC日志里,一条完整的GC日志记录最后,会带有本次GC所花费的时间,如下面这一条新生代GC:

[GC [DefNew: 3298K->149K(5504K), 0.0053498 secs] 3298K->3221K(9600K), .0053750 secs] [Times: user=0.00 sys=0.00, real=0.01 secs]

注意到日志中时间分为了三块:usersys,和real,三者的区别和含义如下:

  •   real:指的是在此次GC事件中所花费的总时间;
  •   user:指的是CPU工作在用户态所花费的时间;
  •   sys:指的是CPU工作在内核态所花费的时间。

user+sys就是CPU花费的实际时间,注意这个值统计了所有CPU上的时间,如果进程工作在多线程的环境下,这个值是会超出 real 所记录的值的,即user+sys>=real

对于GC事件来说,无论是 Minor GC 还是 Full GC 的过程,都存在并发的GC算法,如新生代的ParNew,老年代的ParallelOld,GC过程中工作负载是由多个线程共同完成的,这也就意味着使用这些GC算法时,GC日志中我们应该观察到:user+sys>real。譬如说:配置了ParNew且并发数为5的GC活动(-XX:+UseParNewGC -XX:ParallelGCThreads=5)中,如果user+sys的值为2 seconds,那么real的时间 就近似为400ms(2 seconds / 5)

场景1

[Times: user=11.53 sys=1.38, real=1.03 secs]

垃圾回收过程是通过并发执行,因此user+sys远大于real

场景2

[Times: user=0.09 sys=0.00, real=0.09 secs]

因为使用了串行的垃圾回收期,所以时间应该是userreal相等。

场景3

[Times: user=0.20 sys=0.01, real=18.45 secs]

这是一个异常的示例,可以看到real所显示的时间 远 大于user+sys。一般来说,如果观察到GC日志里多次出现了场景3所示的日志,这表明JVM的GC 过程存在某些问题(等待计算资源),原因可能是下面这两种:

  •   频繁的IO操作
  •   缺乏CPU资源

繁忙的I/O操作

当程序存在繁忙的I/O操作(网络IO或磁盘IO)时,会让real时间大幅上升。因为在记录GC日志的时候,你的程序进行了磁盘读写,如果同一时间其他IO操作较重,则此时GC事件会延迟,进而影响了最终的real的值。注意,如果程序本身不存在的频繁的IO操作,同一机器上其他进程的频繁IO也会影响real的最终结果。Linux环境下可以使用sar监视机器上的I/O,eg.sar -d -p 1,如果频繁的IO操作的确存在,可以通过下面两种方式改进:

  •   优化程序本身的IO操作逻辑;
  •   消除其他进程带来的IO影响。

缺乏CPU资源

当程序本身是CPU密集型应用,或机器上其他进程占用了大量的CPU计算资源,则有可能会出现分配不到 CPU cycles的情况,这会让程序挂起,GC所花费的实际时间也将远大于user+sys的值。

可以使用top命令观察一下 进程的CPU利用率,同时辅以Profiler工具统计一段时间内进程的状态分布。如果的确是CPU资源不足,解决方法无法下面几种:

  •   优化程序内部的线程使用,确保无冗余的线程配置;
  •   增加虚拟机或容器的CPU配置,提升机器总的计算能力。

免责声明:文章转载自《GC日志时间分析》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇多级nginx代理,获取客户端真实iplinux系统挂掉问题的分析下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

linux top命令查看内存及多核CPU的使用讲述

查看多核CPU命令 mpstat -P ALL  和  sar -P ALL 说明:sar -P ALL > aaa.txt   重定向输出内容到文件 aaa.txt top命令 经常用来监控linux的系统状况,比如cpu、内存的使用,程序员基本都知道这个命令,但比较奇怪的是能用好它的人却很少,例如top监控视图中内存数值的含义就有不少的曲解。本文...

java进程占用CPU高的问题

一. 上节回顾怎么查看CPU使用率? top:显示了系统总体的CPU和内存使用情况,以及各个进程的资源使用情况。默认每隔3s刷新一次 ps:只显示每个进程的资源使用情况 top并没有细分进程的用户态CPU和内核态CPU pidstat:可以分析每个进程的CPU使用情况 通过top,ps,pidstat这些工具,能够很快找到CPU使用率较高的进程。要知道CP...

NodeManager介绍

原文链接: http://blog.csdn.net/zhangzhebjut/article/details/37730013 参考文档: https://blog.csdn.net/u013384984/article/details/80738128          https://hortonworks.com/blog/how-to-plan...

性能调优攻略

摘要:关于性能优化这是一个比较大的话题,在《由12306.cn谈谈网站性能技术》中我从业务和设计上说过一些可用的技术以及那些技术的优缺点,今天,想从一些技术细节上谈谈性能优化,主要是一些代码级别的技术和方法。 关于性能优化这是一个比较大的话题,在《由12306.cn谈谈网站性能技术》中我从业务和设计上说过一些可用的技术以及那些技术的优缺点,今天,想从一些...

Linux性能优化实战学习笔记:第四十六讲

一、上节回顾 不知不觉,我们已经学完了整个专栏的四大基础模块,即 CPU、内存、文件系统和磁盘 I/O、以及网络的性能分析和优化。相信你已经掌握了这些基础模块的基本分析、定位思路,并熟悉了相关的优化方法。 接下来,我们将进入最后一个重要模块—— 综合实战篇。这部分实战内容,也将是我们对前面所学知识的复习和深化。 我们都知道,随着 Kubernetes、Do...

多线程和CPU的关系

什么是CPU (1)         Central  Progressing  Unit 中央处理器,是一块超大规模的集成电路,是一台计算机的运算核心和控制核心。 (2)         CPU包括 运算器,高速缓冲存储器,总线。 (3)         它的工作,主要是解释计算机中的指令,和处理计算机软件中的数据。它在计算机中起着最重要的作用,构成了系...