jvm内存溢出性能调优

摘要:
线程快照是当前Java虚拟机中每个线程正在执行的方法堆栈的集合。线程快照的主要目的是查找线程中长时间暂停的原因,例如线程之间的死锁、循环以及外部资源请求导致的长时间等待。线程的几个状态:新:未启动。不显示在转储中。在运行状态下,您可能还会看到单词locked,表示它已获得锁定。BLOCKED(阻塞):阻塞并等待监视器锁定。WAITING和WAITING的区别在于wait()和其他语句添加了一个时间限制等待。

常用工具及命令

jps jstat Top jstack jmap mat工具

 top -Hp pid可以查看某个进程的线程信息

-H 显示线程信息,-p指定pid

jps:可以列出正在运行的虚拟机进程,并显示虚拟机执行主类名称及进程pid 如:jps -l pid

Jstack命令

jstack是java虚拟机自带的一种堆栈跟踪工具。用于生成java虚拟机当前时刻的线程快照。线程快照是当前java虚拟机内每一条线程正在执行的方法堆栈的集合,生成线程快照的主要目的是定位线程出现长时间停顿的原因,如线程间死锁、死循环、请求外部资源导致的长时间等待等。

线程的几种状态:

NEW:未启动的。不会出现在Dump中。

RUNNABLE:在虚拟机内执行的。运行中状态,可能里面还能看到locked字样,表明它获得了某把锁。

BLOCKED:受阻塞并等待监视器锁。被某个锁(synchronizers)給block住了。

WATING:无限期等待另一个线程执行特定操作。等待某个condition或monitor发生,一般停留在park(), wait(), sleep(),join() 等语句里。

TIMED_WATING:有时限的等待另一个线程的特定操作。和WAITING的区别是wait() 等语句加上了时间限制 wait(timeout)。

TERMINATED:已退出的。

jvm内存溢出性能调优第1张

例一:

public class MyThread implements Runnable{

    public void run() {

        synchronized(this) {

            for (int i = 0; i < 1; i--) {

                System.out.println(Thread.currentThread().getName() +Thread.currentThread().getId()+ " do loop " + i);

            }

        }

    }

    public static void main(String[] args) {

        MyThread t1 = new MyThread();

        Thread ta = new Thread(t1, "A");

        Thread tb = new Thread(t1, "B");

        ta.start();

        tb.start();

    }

}

jstack -l 6212 > d:11.jstack.txt

2019-06-25 23:00:05

Full thread dump Java HotSpot(TM) 64-Bit Server VM (25.201-b09 mixed mode):

"DestroyJavaVM" #13 prio=5 os_prio=0 tid=0x0000000002b7e800 nid=0xb80 waiting on condition [0x0000000000000000]

   java.lang.Thread.State: RUNNABLE

"B" #12 prio=5 os_prio=0 tid=0x000000001b4b1800 nid=0x1d0 waiting for monitor entry [0x000000001c12f000]

   java.lang.Thread.State: BLOCKED (on object monitor)

        at MyThread.run(MyThread.java:12)

        - waiting to lock <0x0000000702c02720> (a MyThread)

        at java.lang.Thread.run(Thread.java:748)

"A" #11 prio=5 os_prio=0 tid=0x000000001b4b1000 nid=0x1cec runnable [0x000000001c02f000]

   java.lang.Thread.State: RUNNABLE

        at java.io.FileOutputStream.writeBytes(Native Method)

        at java.io.FileOutputStream.write(FileOutputStream.java:326)

        at java.io.BufferedOutputStream.flushBuffer(BufferedOutputStream.java:82)

        at java.io.BufferedOutputStream.flush(BufferedOutputStream.java:140)

        - locked <0x0000000702c407f8> (a java.io.BufferedOutputStream)

        at java.io.PrintStream.write(PrintStream.java:482)

        - locked <0x0000000702c04820> (a java.io.PrintStream)

        ...

        at MyThread.run(MyThread.java:13)

        - locked <0x0000000702c02720> (a MyThread)

        at java.lang.Thread.run(Thread.java:748)

dump时间,虚拟机的信息 在top命令中,已经获取到了占用cpu资源较高的线程pid,将该pid转成16进制的值,在thread dump中每个线程都有一个nid,找到对应的nid即可;

此处是我们最为关心的地方,也是通过stack trace查找问题的地方,每个item的具体含义是

-Thread name: "A"

-线程优先级: prio=10

-java线程的identifier:tid=0x09b7b400

-native线程的identifier: nid=0x12f2

-线程的状态: in Object.wait()  java.lang.Thread.State: TIMED_WAITING (on object monitor) 

-线程栈起始地址:[0xb30f9000]

例二:

public void run() {

        synchronized(this) {

            for (int i = 0; i < 1; i--) {

                //System.out.println(Thread.currentThread().getName() +Thread.currentThread().getId()+ " do loop " + i);

                try {

                    this.wait();

                } catch (InterruptedException e) {

                    e.printStackTrace();

                }

            }

        }

    }

2019-06-25 22:52:25

Full thread dump Java HotSpot(TM) 64-Bit Server VM (25.201-b09 mixed mode):

"DestroyJavaVM" #13 prio=5 os_prio=0 tid=0x000000000252e800 nid=0x3e5c waiting on condition [0x0000000000000000]

   java.lang.Thread.State: RUNNABLE

"B" #12 prio=5 os_prio=0 tid=0x000000001b19b000 nid=0x4d38 in Object.wait() [0x000000001bdee000]

   java.lang.Thread.State: WAITING (on object monitor)

        at java.lang.Object.wait(Native Method)

        - waiting on <0x000000078105ba78> (a MyThread)

        at java.lang.Object.wait(Object.java:502)

        at MyThread.run(MyThread.java:15)

        - locked <0x000000078105ba78> (a MyThread)

        at java.lang.Thread.run(Thread.java:748)

 "A" #11 prio=5 os_prio=0 tid=0x000000001b198000 nid=0x2b18 in Object.wait() [0x000000001bcef000]

   java.lang.Thread.State: WAITING (on object monitor)

        at java.lang.Object.wait(Native Method)

        - waiting on <0x000000078105ba78> (a MyThread)

        at java.lang.Object.wait(Object.java:502)

        at MyThread.run(MyThread.java:15)

        - locked <0x000000078105ba78> (a MyThread)

        at java.lang.Thread.run(Thread.java:748)

 使用MAT工具进行内存泄露分析

jmap命令

既然要分析内存,首先需要获取可供分析的原始内存文件,这就需要用到jmap命令。jmap是JDK自带的一种用于生成内存镜像文件的工具,通过该工具,开发人员可以快速生成dump文件。开发人员可以使用命令“jmap -help”查看jmap的常用命令

获取dump文件有两种方法:

其一,通过上面介绍的 jmap工具生成,可以生成任意一个java进程的dump文件;

其二,通过配置JVM参数生成,选项“-XX:+HeapDumpOnOutOfMemoryError ”和-“XX:HeapDumpPath”所代表的含义就是当程序出现OutofMemory时,将会在相应的目录下生成一份dump文件,而如果不指定选项“XX:HeapDumpPath”则在当前目录下生成dump文件。

虽然有两种方式获取dump文件,但是考虑到生产环境中几乎不可能在线对其进行分析,大都是采用离线分析,因此使用jmap+MAT工具是最常见的组合。

模拟堆溢出场景:设置如:-Xms10m -Xmx10m -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=E:dump

@Test

    public void testOOM() {

        List<Person> users = new ArrayList<Person>();

        while (true) {

            users.add(new Person("", 1));

        }

    }

Overview选项:

当成功启动MAT后,通过菜单选项“File->Open heap dump...”打开指定的dump文件后,将会生成Overview选项,如下所示:

 jvm内存溢出性能调优第2张

 在Overview选项中,以饼状图的形式列举出了程序内存消耗的一些基本信息,其中每一种不同颜色的饼块都代表了不同比例的内存消耗情况。

Dominator Tree选项:

如果说需要定位内存泄露的代码点,我们可以通过Dominator Tree菜单选项来进行排查。Dominator Tree提供了一个列表。Dominator Tree:对象之间dominator关系树。如果从GC Root到达Y的的所有path都经过X,那么我们称X dominates Y,或者X是Y的Dominator 。Dominator Tree由系统中复杂的对象图计算而来。从MAT的dominator tree中可以看到占用内存最大的对象以及每个对象的dominator,如下所示:

 jvm内存溢出性能调优第3张

 可以进一步查看内层应用情况,同时还可以看到对应类对象的属性值,如下所示:

 jvm内存溢出性能调优第4张

Histogram选项:

可以通过Histogram分析,Histogram列出了每个类的实例数量,点击Action下的Histogram,得到以下结果:

 jvm内存溢出性能调优第5张

如果需要查询特性的某个类,我们可以在第一行输入类名或者关键词进行正则匹配查找,如查找“erson”:

 jvm内存溢出性能调优第6张

Path to GC Root:

    查看一个对象到RC Roots的引用链

    通常在排查内存泄漏的时候,我们会选择exclude all phantom/weak/soft etc.references,意思是查看排除虚引用/弱引用/软引用等的引用链,因为被虚引用/弱引用/软引用的对象可以直接被GC给回收,我们要看的就是某个对象否还存在Strong 引用链(在导出HeapDump之前要手动出发GC来保证),如果有,则说明存在内存泄漏,然后再去排查具体引用

 jvm内存溢出性能调优第7张

总结:遇到线上问题,首先确认排查问题的思路:

查看日志

    查看CPU情况 top

    查看TCP情况 netstat

    查看java线程,jstack

    查看java堆,jmap

通过MAT分析堆文件,寻找无法被回收的对象

问题排查

1.检查对数据库查询中,是否有一次获得全部数据的查询。一般来说,如果一次取比较多条记录到内存,就可能引起内存溢出。这个问题比较隐蔽,在上线前,数据库中数据较少,不容易出问题,上线后,数据库中数据多了,一次查询就有可能引起内存溢出。因此对于数据库查询尽量采用分页的方式查询。
2.检查代码中是否有死循环或递归调用。 

3.检查是否有大循环重复产生新对象实体。 

4.检查List、MAP等集合对象是否有使用完后,未清除的问题。List、MAP等集合对象会始终存有对对象的引用,使得这些对象不能被GC回收。

5.结合内存查看工具动态查看内存使用情况

问题解决

1.检查错误日志,查看“OutOfMemory”错误前是否有其它异常或错误。对代码进行走查和分析,找出可能发生内存溢出的位置。修正。

2.修改JVM启动参数,直接增加内存。

第一个异常:设置堆的方法是通过-Xms(堆的最小值),-Xmx(堆的最大值)

第一个异常:设置栈大小的方法是设置-Xss参数-Xss100k

第三个异常:设置元空间-XX:PermSize和-XX:MaxPermSize参数(java8中去掉了PermGen(1.8前称永久代,主要用来 存放Class的静态信息,Main方法信息,常量信息,静态方法和变量信息,共享变量等信息 参数设置示例: -XX:PermSize=5M -XX:MaxPermSize=7M) 改为 Metaspace 默认情况下,类元数据只受可用的本地内存限制(容量取决于是32位或是64位操作系统的可用虚拟内存大小) 新参数(MaxMetaspaceSize)用于限制本地内存分配给类元数据的大小。如果没有指定这个参数,元空间会在运行时根据需要动态调整)

总结

内存查看工具有许多,比较有名的有:mt、Optimizeit Profiler、JProbe Profiler、JinSight和Java1.5的Jconsole、visualVM(BTrace动态日志,不用修改服务可以加日志)等。它们的基本工作原理大同小异,都是监测Java程序运行时所有对象的申请、释放等动作,将内存管理的所有信息进行统计、分析、可视化。开发人员可以根据这些信息判断程序是否有内存泄漏问题。一般来说,一个正常的系统在其启动完成后其内存的占用量是基本稳定的,而不应该是无限制的增长的。持续地观察系统运行时使用的内存的大小,可以看到在内存使用监控窗口中是基本规则的锯齿形的图线,如果内存的大小持续地增长,则说明系统存在内存泄漏问题。通过间隔一段时间取一次内存快照,然后对内存快照中对象的使用与引用等信息进行比对与分析,可以找出是哪个类的对象在泄漏。

免责声明:文章转载自《jvm内存溢出性能调优》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇mac下的readelf和objdumpMYSQL 批量删除以特定前缀开头的表下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

Linux线程属性总结

线程属性标识符:pthread_attr_t 包含在 pthread.h 头文件中。 [c] view plaincopy  //线程属性结构如下:   typedef struct   {       int                   etachstate;      //线程的分离状态       int              ...

synchronized实现原理及锁优化

1.引言 并发编程中synchronized是重量级锁,但随着JVM1.6对synchronized进行优化后,有些情况下它并不那么重,本文介绍了Java SE1.6中为了减少获得锁和释放锁带来的性能消耗而引入的偏向锁和轻量级锁,以及锁的存储结构和升级过程。 2.术语定义 CAS(Compare and Swap):比较并交换。用于在硬件层面上提供原子性操...

MySQL连接池

一. 什么是数据库连接池 官方:数据库连接池(Connection pooling)是程序启动时建立足够的数据库连接,并将这些连接组成一个连接池,由程序动态地对连接池中的连接进行申请,使用,释放。 理解:创建数据库连接池是一个很耗时的操作,也容易对数据库造成安全隐患。所以,在程序初始化的时候,集中创建多个数据库连接池,并把他们集中管理,供程序使用,可以保证...

C#线程锁(上)

本篇从Monitor,Mutex,ManualResetEvent,AutoResetEvent,WaitHandler的类关系图开始,希 望通过本篇的介绍能对常见的线程同步方法有一个整体的认识,而对每种方式的使用细节,适用场合不会过多解释。让我们来看看这几个类的关系图:         1.lock关键字       lock是C#关键词,它将语句块标记...

Android FrameWork——Touch事件派发过程详解

对于android的窗口window管理,一直感觉很混乱,总想找个时间好好研究,却不知如何入手,现在写的Touch事件派发过程详解,其实跟 android的窗口window管理服务WindowManagerService存在紧密联系,所以从这里入手切入到 WindowManagerService的研究,本blog主要讲述一个touch事件如何从用户消息的...

内存溢出分析定位

内存溢出: 堆内存溢出 堆内存中存在大量对象,这些对象都有被引用,当所有对象占用空间达到堆内存的最大值,就会出现内存溢出OutOfMemory:Java heap space 永久代溢出 -- (解决方案:加大永久代内存) 类的一些信息,如类名、访问修饰符、字段描述、方法描述等,所占空间大于永久代最大值,就会出现OutOfMemoryError:PermG...