通过 Javacore 了解线程运行状况

摘要:
Javacore是一个当前JVM运行状态的快照。通过对Javacore的分析,可以了解在JVM中运行的应用程序的当前状态,比如是否“卡”在某一点上,或在某些代码上运行时间太长。而为了性能问题诊断的需要,我们也会主动触发生成Javacore。通常一个Javacore里面会有上百个线程,这些线程的地位并不一样。所以Javacore分析过程中一定要抓住这些主要线程。

Javacore 是一个当前 JVM 运行状态的快照。通过对Javacore 的分析,可以了解在 JVM 中运行的应用程序的当前状态,比如是否“卡”在某一点上,或在某些代码上运行时间太长。

Javacore 的基本内容

Javacore,也可以称为“threaddump”或是“javadump”,它是 Java 提供的一种诊断特性,能够提供一份可读的当前运行的 JVM 中线程使用情况的快照。即在某个特定时刻,JVM 中有哪些线程在运行,每个线程执行到哪一个类,哪一个方法。

应用程序如果出现不可恢复的错误或是内存泄露,就会自动触发 Javacore 的生成。而为了性能问题诊断的需要,我们也会主动触发生成 Javacore。在 AIX、Linux、Solaris 环境中,我们通常使用 kill -3 <PID> 产生该进程的 Javacore。

对于IBM JVM,AIX 平台上的 Javacore 会被写到 javacore.<date>.<time>.<PID>.<sequence>.txt 中。对于Oracle JVM,Javacore 被附加到native_stdout.txt。

虽然不同版本的 JVM 所产生的 Javacore 的格式会稍有不同,但基本都包含下面几个内容:

TITLE 信息块:描述 Javacore 产生的原因,时间以及文件的路径。最常见的有下面三种:

  1. user:SIGQUIT 信号
  2. gpf:程序一般保护性错误导致系统崩溃
  3. systhrow:JVM 内部抛出的异常

GPINFO 信息块:GPF(一般保护性错误)信息

ENVINFO 信息块:系统运行时的环境和 JVM 参数

MEMINFO 信息块:内存使用情况和垃圾回收情况

LOCKS 信息块:用户监视器(monitor)和系统监视器(monitor)情况

THREADS 信息块:所有 java 线程的状态信息和执行堆栈

CLASSES 信息块:类加载信息

Javacore 中的线程可分为以下几种状态:

  • 死锁(Deadlock)【重点关注】:一般指多个线程调用间,进入相互资源占用,导致一直等待无法释放的情况。
  • 执行中(Runnable)【重点关注】:一般指该线程正在执行状态中,该线程占用了资源,正在处理某个请求,有可能在对某个文件操作,有可能进行数据类型等转换等。
  • 等待资源(Waiting on condition)【重点关注】:等待资源,如果堆栈信息明确是应用代码,则证明该线程正在等待资源,一般是大量读取某资源、且该资源采用了资源锁的情况下,线程进入等待状态。又或者,正在等待其他线程的执行等。
  • 等待监控器检查资源(Waiting on monitor)
  • 暂停(Suspended)
  • 对象等待中(Object.wait())
  • 阻塞(Blocked)【重点关注】:指当前线程执行过程中,所需要的资源长时间等待却一直未能获取到,被容器的线程管理器标识为阻塞状态,可以理解为等待资源超时的线程。这种情况在应用的日志中,一般可以看到 CPU 饥渴,或者某线程已执行了较长时间的信息。
  • 停止(Parked)

通过对 Javacore 数据的分析经验,结合对具体应用代码逻辑的理解,有经验的工程师可以直接通过文本编辑器查看原始 Javacore 文件来分析当前应用程序的运行状态。一般初学者则需要通过一些工具进行更直观的分析。图形化分析工具 TMDA

WC 线程执行堆栈分析

不论是否利用 TMDA 工具进行分析,对 Javacore 的分析最终都会落实在具体线程的执行堆栈上。如果对具体应用的代码不熟悉,那么看着一个个长长的执行堆栈,可能会觉得无从下手。本部分介绍 WC 线程执行堆栈的常见代码和对应的功能模块。初学者可以根据这些示例推测某个线程的当前运行状态。需要注意的是,WC 的不同版本,同样的功能模块的具体代码可能会发生变化,经过用户定制的代码就更是千差万别。本部分提供的只是依据 WC FEP7 版本代码的一些示例,读者需要根据自己所处理的系统的实际代码情况灵活掌握,不可拘泥。

通常一个 Javacore 里面会有上百个线程,这些线程的地位并不一样。有些线程是系统运行的“入口线程”,而其他一些线程只是由这些线程派生出来的辅助线程。所以 Javacore 分析过程中一定要抓住这些主要线程。

WC 的核心是一个 Web 应用,所以大部分 WC 的 Javacore 以应用服务器的 Web 容器为入口。用来处理前台商店或后台管理端的 JVM 基本类似,但专门运行定时任务的 JVM 会有所区别。下图 2 所示为以 Web 容器为入口线程的一般调用结构:

通过 Javacore 了解线程运行状况第1张

从 Web 容器入口开始,一般会进入 Servlet 执行。如果有缓存而且命中的话,则会进入 DynaCache 的相关代码。如果无缓存或缓存不命中,如果是 JSP 页面,则会执行 JSP 的相关代码,否则会执行相应的逻辑。代码逻辑处理过程中,经常会访问到数据库(通过 DSL 或 EJB)或 Solr 搜索(通过 BOD 或 REST),还有可能访问到外部系统集成接口(通过 HTTP 同步调用或消息队列)。如果数据库服务器 / 搜索服务器 / 系统集成服务器分布在其他节点上,那么这些调用最终都会转化为网络访问。

以下为一个正在处理 JSP 页面中的数据库请求的执行堆栈示例,如图 3、4、5:

图 3. 堆栈实例(1)

通过 Javacore 了解线程运行状况第2张

图 4. 堆栈实例(2)

通过 Javacore 了解线程运行状况第3张

自下而上的关键代码

  1. Web 容器处理请求:Package 名 / 类名 . 方法名:com.ibm.ws.webcontainer/WebContainer.handleRequest
  2. RuntimeFilter:Package 名 / 类名 . 方法名:com.ibm.commerce.webcontroller/RuntimeServletFilter.doFilterAction
  3. Servlet 处理:Package 名 / 类名 . 方法名:com.ibm.commerce.struts/ECActionServlet.doGet 或者 Package 名 / 类名 . 方法名:com.ibm.commerce.struts/ECActionServlet.doPost
  4. JSP 处理Package 名 / 类名 . 方法名:com.ibm._jsp/_(JSP 文件名 )._jspService
  5. Command 执行(图例为 BOD command):Package 名 / 类名 . 方法名:com.ibm.commerce.*/Abstract(*)CmdImpl.performExecute
  6. DSL:Package 名 / 类名 . 方法名:com.ibm.commerce.foundation.server.services.dataaccess/AbstractDataServiceFacade.*
  7. JDBC:
    查询 :Package 名 / 类名 . 方法名:com.ibm.ws.rsadapter.jdbc/WSJdbcPreparedStatement.executeQuery 或 Package 名 / 类名 . 方法名:com.ibm.ws.rsadapter.cci/WSResourceAdapterBase.executeQuery 
    更新:Package 名 / 类名 . 方法名:com.ibm.ws.rsadapter.jdbc/WSJdbcPreparedStatement.executeUpdate 或 Package 名 / 类名 . 方法名:com.ibm.ws.rsadapter.cci/WSResourceAdapterBase.executeUpdate
  8. 数据库驱动代码:DB2 Package 名:com.ibm.db2.* 或 Oracle Package 名 / 类名 . 方法名:oracle.jdbc.driver/OraclePreparedStatement.executeInternal
  9. 外部网络访问
    (网络读)Package 名 / 类名 . 方法名:java.net/SocketInputStream.socketRead0
    (网络写)Package 名 / 类名 . 方法名:java.net/SocketOutputStream.socketWrite0

其他常见的执行堆栈举例:

  • 空闲(Idle
    这样的堆栈表示当前线程处于空闲状态(对于 Web 容器而言,即当前线程没有接收到 Web 请求)。其调用栈为:
    Package 名 / 类名 . 方法名:java.lang/Object/wait
    …
    Package 名 / 类名 . 方法名:com.ibm.ws.util/ThreadPool$Worker. run
    或者
    Package 名 / 类名 . 方法名:com.ibm.io.async/AsyncLibrary. aio_getioev*
    …
    Package 名 / 类名 . 方法名:com.ibm.ws.util/ThreadPool$Worker. run
  • 事务(Transaction)处理
    提交(Commit)
    Package 名 / 类名 . 方法名:com.ibm.commerce.server/TransactionManager.commit
    回滚(Rollback)
    Package 名 / 类名 . 方法名:com.ibm.commerce.server/TransactionManager.rollback
  • 缓存(DynaCache)读取
    Package 名 / 类名 . 方法名:com.ibm.ws.cache/Cache.getEntry(或 getCacheEntry)
    基于 WXS 的缓存则为
    Package 名 / 类名 . 方法名:com.ibm.ws.objectgrid.dynacache/RemoteCoreCacheImpl.get
  • MultiClick 处理:Package 名 / 类名 . 方法名:com.ibm.commerce.webcontroller.doubleclick/MultiClickRequestHandler. waitForResponse
  • 消息处理(MQ):Package 名 / 类名 . 方法名:com.ibm.mq.jmqi.remote.internal/RemoteRcvThread.run
  • 搜索(Solr)处理:Package 名 / 类名 . 方法名:org.apache.solr.client.solrj/SolrServer.query
  • REST 处理:Package 名 / 类名 . 方法名:com.ibm.commerce.foundation.internal.client.util/RESTHandler.execute

-----整理自:http://www.kankanews.com/ICkengine/archives/156577.shtml

免责声明:文章转载自《通过 Javacore 了解线程运行状况》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇EASYUI 表单(FORM)用法java的(SXSSF)EasyExcel阿里开源excel导出和XSSF导出简单示例下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

解决关闭窗口,C#报错"在创建窗口句柄之前,不能在控件上调用 Invoke 或 BeginInvoke"

情况:在C#开发的过程中多线程委托是经常用的,今天在测试以前写的软件的时候发现有个问题,报 在创建窗口句柄之前,不能在控件上调用 Invoke 或 BeginInvoke。 这样的错误。 解决方法:加上 if (this.IsHandleCreated) 1、首先分析问题,句柄:是对象的引用名,存于栈区(可以理解为对象的指针),对象是存于堆区,通过操控栈区...

Android文件下载(实现断点续传)

本文将介绍在android平台下如何实现多线程下载,大家都知道,android平台使用java做为开发语言,所以java中支持的多线程下载方式在android平台下都支持,其中主要有两种方式可以实现多线程下载。 一种方式是使用很多个线程分别下载文件的不同部分,最后把所有下载完的文件合并成一个文件。另一种方式是使用java为我们提供的RandomAcces...

【SpringBoot WEB系列】异步请求知识点与使用姿势小结

【SpringBoot WEB系列】异步请求知识点与使用姿势小结 在 Servlet3.0 就引入了异步请求的支持,但是在实际的业务开发中,可能用过这个特性的童鞋并不多? 本篇博文作为异步请求的扫盲和使用教程,将包含以下知识点 什么是异步请求,有什么特点,适用场景 四种使用姿势: AsyncContext 方式 Callable WebAsyncTa...

SQL Server 阻塞原因分析

这里通过连接在sysprocesses里字段值的组合来分析阻塞源头,可以把阻塞分为以下5种常见的类型(见表)。waittype,open_tran,status,都是sysprocesses里的值,“自我修复?”列的意思,就是指阻塞能不能自动消失。  5种常见的阻塞类型 类型 waittype open_tran status 自我修复 原因/其他特征...

ThreadLocal工具类 隔离思想

ThreadLocal不是用来解决共享对象的多线程访问问题的, 通过ThreadLocal的set()方法设置到线程的ThreadLocal.ThreadLocalMap里的是是线程自己要存储的对象,其他线程不需要去访问,也是访问不到的。各个线程中的ThreadLocal.ThreadLocalMap以及ThreadLocal.ThreadLocal中的值...

简单的多线程通信实例(用委托事件实现)

 1using System; 2using System.Threading; 3 4namespace ifan 5{ 6    //自定义委托声明 7    public delegate void childExitDelegate(object sender, ChildExitEventArgs e); 8 9    public class...