Sun JDK监控和故障处理命令有 jps、jstat、jmap、jhat、jstack、jinfo。
JVM Process Status Tool,显示指定系统内所有的 HotSpot 虚拟机进程。
jstat(JVM statistics Monitoring)是用于监视虚拟机运行时状态信息的命令,它可以显示出虚拟机进程中的类装载、内存、垃圾收集、JIT 编译等运行数据。
dump 堆到文件,可用于对文件的分析。
jhat(JVM Heap Analysis Tool)命令是与 jmap 搭配使用,用来分析 jmap 生成的 dump,jhat 内置了一个微型的 HTTP/HTML 服务器,生成 dump 的分析结果后,可以在浏览器中查看。
在此要注意,一般不会直接在服务器上进行分析,因为 jhat 是一个耗时并且耗费硬件资源的过程,一般把服务器生成的 dump 文件复制到本地或其他机器上进行分析。
jstack 用于生成 java 虚拟机当前时刻的线程快照。
线程快照是当前 java 虚拟机内每一条线程正在执行的方法堆栈的集合,生成线程快照的主要目的是定位线程出现长时间停顿的原因,如线程间死锁、死循环、请求外部资源导致的长时间等待等。
线程出现停顿的时候通过 jstack 来查看各个线程的调用堆栈,就可以知道没有响应的线程到底在后台做什么事情,或者等待什么资源。
(1)Jconsole(Java Monitoring and Management Console)是从 java5 开始,在 JD K中自带的 java 监控和管理控制台,
(2)用于对 JVM 中内存,线程和类等的监控,
(3)是一个基于 JMX(java management extensions)的 GUI 性能监测工具。
(4)jconsole 使用 jvm 的扩展机制获取,并展示虚拟机中运行的应用程序的性能和资源消耗等信息。
包括堆内存使用情况、线程、类、CPU 使用情况四项信息的曲线图。

相当于可视化的 jstack 命令,同时也可以点击 “检测死锁” 来检查线程之间是否有死锁的情况。

(1)VisualVM(All-in-One Java Troubleshooting Tool)是功能最强大的运行监视和故障处理程序之一,曾经在很长一段时间内是 Oracle 官方主力发展的虚拟机故障处理工具。
(2)相比一些第三方工具,VisualVM 有一个很大的优点:不需要被监视的程序基于特殊 Agent 去运行,因此它的通用性很强,对应用程序实际性能的影响也较小,使得它可以直接应用在生产环境中。
(3)Visual GC 是常常使用的一个功能,需要通过插件,可以明显的看到年轻代、老年代的内存变化,以及 gc 频率、gc 的时间等。

cpu、内存、类、线程的图表,这里面可以执行堆 dump。


CPU 单核:那么毫无疑问 Serial 垃圾收集器是你唯一的选择;
CPU 多核:关注吞吐量 ,那么选择 PS+PO 组合;
CPU 多核:关注用户停顿时间,JDK 版本 1.6 或者 1.7,那么选择 CMS;
CPU 多核:关注用户停顿时间,JDK1.8 及以上,JVM 可用内存 6G 以上,那么选择 G1。
//设置Serial垃圾收集器(新生代)
开启:-XX:+UseSerialGC
//设置PS+PO,新生代使用功能Parallel Scavenge 老年代将会使用Parallel Old收集器
开启 -XX:+UseParallelOldGC
//CMS垃圾收集器(老年代)
开启 -XX:+UseConcMarkSweepGC
//设置G1垃圾收集器
开启 -XX:+UseG1GC
垃圾收集频率非常频繁。
如果内存太小,就会导致频繁的需要进行垃圾收集才能释放出足够的空间来创建新的对象,所以增加堆内存大小的效果是非常显而易见的。
如果垃圾收集次数非常频繁,但是每次能回收的对象非常少,那么这个时候并非内存太小,而可能是内存泄露导致对象无法回收,从而造成频繁 GC。
//设置堆初始值
指令1:-Xms2g
指令2:-XX:InitialHeapSize=2048m
//设置堆区最大值
指令1:`-Xmx2g`
指令2: -XX:MaxHeapSize=2048m
//新生代内存配置
指令1:-Xmn512m
指令2:-XX:MaxNewSize=512m
如果没有确切的停顿时间设定,垃圾收集器以吞吐量为主,那么垃圾收集时间就会不稳定。
不要设置不切实际的停顿时间,单次时间越短也意味着需要更多的 GC 次数才能回收完原有数量的垃圾.
//GC停顿时间,垃圾收集器会尝试用各种手段达到这个时间
-XX:MaxGCPauseMillis
某一个区域的GC频繁,其他都正常。
如果对应区域空间不足,导致需要频繁GC来释放空间,在JVM堆内存无法增加的情况下,可以调整对应区域的大小比率。
也许并非空间不足,而是因为内存泄露造成内存无法回收,从而导致 GC 频繁。
//survivor区和Eden区大小比率
指令:-XX:SurvivorRatio=6 //S区和Eden区占新生代比率为1:6,两个S区2:6
//新生代和老年代的占比
-XX:NewRatio=4 //表示新生代:老年代 = 1:4 即老年代占整个堆的4/5;默认值=2
老年代频繁 GC,每次回收的对象很多。
如果升代年龄小,新生代的对象很快就进入老年代了,导致老年代对象变多,
而这些对象其实在随后的很短时间内就可以回收,这时候可以调整对象的升级代年龄,
让对象不那么容易进入老年代解决老年代空间不足频繁 GC 问题。
增加了年龄之后,这些对象在新生代的时间会变长可能导致新生代的 GC 频率增加,并且频繁复制这些对象新生的 GC 时间也可能变长。
//进入老年代最小的GC年龄,年轻代对象转换为老年代对象最小年龄值,默认值7
-XX:InitialTenuringThreshol=7
老年代频繁 GC,每次回收的对象很多,而且单个对象的体积都比较大。
如果大量的大对象直接分配到老年代,导致老年代容易被填满而造成频繁 GC,可设置对象直接进入老年代的标准。
这些大对象进入新生代后可能会使新生代的 GC 频率和时间增加。
//新生代可容纳的最大对象,大于则直接会分配到老年代,0代表没有限制。
-XX:PretenureSizeThreshold=1000000
G1 和 CMS 部分 GC 阶段是并发进行的,业务线程和垃圾收集线程一起工作,也就说明垃圾收集的过程中业务线程会生成新的对象,
所以在 GC 的时候需要预留一部分内存空间来容纳新产生的对象,
如果这个时候内存空间不足以容纳新产生的对象,那么JVM就会停止并发收集暂停所有业务线程(STW)来保证垃圾收集的正常运行。
这个时候可以调整GC触发的时机(比如在老年代占用 60% 就触发 GC),这样就可以预留足够的空间来让业务线程创建的对象有足够的空间分配。
提早触发 GC 会增加老年代 GC 的频率。
//使用多少比例的老年代后开始CMS收集,默认是68%,如果频繁发生SerialOld卡顿,应该调小
-XX:CMSInitiatingOccupancyFraction
//G1混合垃圾回收周期中要包括的旧区域设置占用率阈值。默认占用率为 65%
-XX:G1MixedGCLiveThresholdPercent=65
GC 的次数、时间和回收的对象都正常,堆内存空间充足,但是报 OOM
JVM 除了堆内存之外还有一块堆外内存,这片内存也叫本地内存,
可是这块内存区域不足了并不会主动触发 GC,只有在堆内存区域触发的时候顺带会把本地内存回收了,
而一旦本地内存分配不足就会直接报 OOM 异常。
本地内存异常的时候除了上面的现象之外,异常信息可能是 OutOfMemoryError:Direct buffer memory。
解决方式除了调整本地内存大小之外,也可以在出现此异常时进行捕获,手动触发 GC(System.gc())。
XX:MaxDirectMemorySize
在测试环境测速度比较快,但是一到生产就变慢,所以推测可能是因为垃圾收集导致的业务线程停顿。
为了确认推测的正确性,在线上通过 jstat -gc 指令 看到 JVM 进行 GC 次数频率非常高,GC 所占用的时间非常长,
所以基本推断就是因为 GC 频率非常高,所以导致业务线程经常停顿,从而造成网页反应很慢。
因为网页访问量很高,所以对象创建速度非常快,导致堆内存容易填满从而频繁 GC,
所以这里问题在于新生代内存太小,
所以这里可以增加 JVM 内存就行了,
所以初步从原来的 2G 内存增加到 16G 内存。
增加内存后的确平常的请求比较快了,
但是又出现了另外一个问题,就是不定期的会间断性的卡顿,而且单次卡顿的时间要比之前要长很多。
之前的优化加大了内存,所以推测可能是因为内存加大了,从而导致单次 GC 的时间变长从而导致间接性的卡顿。
还是通过 jstat -gc 指令 查看到 的确 FGC 次数并不是很高,
但是花费在 FGC 上的时间是非常高的,根据 GC 日志 查看到单次 FGC 的时间有达到几十秒的。
因为 JVM 默认使用的是 PS+PO 的组合,PS+PO 垃圾标记和收集阶段都是 STW,
所以内存加大了之后,需要进行垃圾回收的时间就变长了,
所以这里要想避免单次 GC 时间过长,
所以需要更换并发类的收集器,
因为当前的 JDK 版本为 1.7,所以最后选择 CMS 垃圾收集器,
根据之前垃圾收集情况设置了一个预期的停顿的时间,上线后网站再也没有了卡顿问题。
问题描述:公司的后台系统,偶发性的引发 OOM 异常,堆内存溢出。
因为是偶发性的,可能是堆内存不足导致,于是把堆内存从 4G 调整到 8G。
(1)问题依然没有解决,再从堆内存信息下手。
(2)开启 -XX:+HeapDumpOnOutOfMemoryError 参数,获得堆内存的 dump 文件。
(1)通过 VisualVM 查看到占用内存最大的对象是 String 对象。
(2)本来想跟踪着 String 对象找到其引用的地方,但 dump 文件太大,跟踪进去的时候总是卡死,
(3)而 String 对象占用比较多也比较正常,于是就先从线程信息里面找突破点。
(1)线程分析先找到了几个正在运行的业务线程,然后逐一跟进业务线程看了下代码,发现有个引起我注意的方法,导出订单信息。
备注: 如何通过进程找到线程,再找到代码,请看 下一篇跳转—Java基础之jvm4 中的 17.cpu使用率飙升,怎么排查?
因为订单信息导出这个方法可能会有几万的数据量,首先要从数据库里面查询出来订单信息,然后把订单信息生成 excel,这个过程会产生大量的 String 对象。
上一篇跳转—Java基础之jvm2 下一篇跳转—Java基础之jvm4
随心所往,看见未来。Follow your heart,see night!
*欢迎点赞、关注、留言,收藏及转发,一起学习、交流!