阿里巴巴 Java性能诊断工具Arthas

Arthas 是一款线上监控诊断产品，通过全局视角实时查看应用 load、内存、gc、线程的状态信息，并能在不修改应用代码的情况下，对业务问题进行诊断，包括查看方法调用的出入参、异常，监测方法执行耗时，类加载信息等，大大提升线上问题排查效率。

Arthas 支持 JDK 6+，支持 Linux/Mac/Windows，采用命令行交互模式，同时提供丰富的 Tab 自动补全功能，进一步方便进行问题的定位和诊断。

1、下载

进入官网，直接下载jar包，或者在线安装。https://github.com/alibaba/arthas/releases

2、arthas attach

启动被检测的项目java -jar math-game.jar
启动arthas,java -jar arthas-boot.jar pid

Arthas 目前支持 Web Console，用户在 attach 成功之后，可以直接访问：http://127.0.0.1:8563/在新窗口打开。可以填入 IP，远程连接其它机器上的 arthas。

PS D:\arthas\arthas-packaging-3.6.4-bin> java -jar .\arthas-boot.jar 8928
[INFO] arthas-boot version: 3.6.4
[INFO] Process 8928 already using port 3658
[INFO] Process 8928 already using port 8563
[INFO] arthas home: D:\arthas\arthas-packaging-3.6.4-bin
[INFO] The target process already listen port 3658, skip attach.
[INFO] arthas-client connect 127.0.0.1 3658
  ,---.  ,------. ,--------.,--.  ,--.  ,---.   ,---.
 /  O  \ |  .--. ''--.  .--'|  '--'  | /  O  \ '   .-'
|  .-.  ||  '--'.'   |  |   |  .--.  ||  .-.  |`.  `-.
|  | |  ||  |\  \    |  |   |  |  |  ||  | |  |.-'    |
`--' `--'`--' '--'   `--'   `--'  `--'`--' `--'`-----'

wiki       https://arthas.aliyun.com/doc
tutorials  https://arthas.aliyun.com/doc/arthas-tutorials.html
version    3.6.4
main_class
pid        8928
time       2022-08-26 09:09:05
[arthas@8928]$
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

3、常用命令

3.1 dashboard当前系统的实时数据面板

3.2 thread查看当前线程信息，查看线程的堆栈。

3.3 jad反编译指定已加载类的源码

3.4 watch 函数执行数据观测

3.5 stop停止会话

4、基础命令

4.1 help查看命令帮助信息，可以查看当前 arthas 版本支持的指令，或者查看具体指令的使用说明。

4.2 cat 打印文件内容，和 linux 里的 cat 命令类似。

4.3 grep 类似传统的`grep`命令，匹配查找。

4.4 pwd 返回当前的工作目录，print work directory。

4.5 cls清除屏幕

4.6 session会话信息

4.7 reset 重置增强类，将被 Arthas 增强过的类全部还原，Arthas 服务端`stop`时会重置所有增强过的类。

4.8 version 查看arthas版本

4.9 history 查看命令历史

4.10 quit 只是退出当前 Arthas 客户端，Arthas 的服务器端并没有关闭，所做的修改也不会被重置。

4.11 `keymap`命令输出当前的快捷键映射表

5、JVM相关命令

5.1 dashboard

ID: Java 级别的线程 ID，注意这个 ID 不能跟 jstack 中的 nativeID 一一对应。
NAME: 线程名
GROUP: 线程组名
PRIORITY: 线程优先级, 1~10 之间的数字，越大表示优先级越高
STATE: 线程的状态
CPU%: 线程的 cpu 使用率。比如采样间隔 1000ms，某个线程的增量 cpu 时间为 100ms，则 cpu 使用率=100/1000=10%
DELTA_TIME: 上次采样之后线程运行增量 CPU 时间，数据格式为秒
TIME: 线程运行总 CPU 时间，数据格式为分:秒
INTERRUPTED: 线程当前的中断位状态
DAEMON: 是否是 daemon 线程

5.2 thread

参数名称	参数说明
id	线程 id
[n:]	指定最忙的前 N 个线程并打印堆栈
[b]	找出当前阻塞其他线程的线程
[i ]	指定 cpu 使用率统计的采样间隔，单位为毫秒，默认值为 200
[–all]	显示所有匹配的线程
thread --state WAITING	查看指定状态的线程

5.3 jvmTHREAD 相关

COUNT: JVM 当前活跃的线程数
DAEMON-COUNT: JVM 当前活跃的守护线程数
PEAK-COUNT: 从 JVM 启动开始曾经活着的最大线程数
STARTED-COUNT: 从 JVM 启动开始总共启动过的线程次数
DEADLOCK-COUNT: JVM 当前死锁的线程数

5.4 sysprop查看当前 JVM 的系统属性(`System Property`)

5.5 sysenv 查看当前 JVM 的环境属性(`System Environment Variables`)

5.6 vmoption查看，更新 VM 诊断相关的参数

5.7 getstatic查看类的静态属性

5.8 ognl 执行 ognl 表达式

参数名称	参数说明
express	执行的表达式
`[c:]`	执行表达式的 ClassLoader 的 hashcode，默认值是 SystemClassLoader
`[classLoaderClass:]`	指定执行表达式的 ClassLoader 的 class name
[x]	结果对象的展开层次，默认值 1

4、class/classloader相关命令

4.1 sc查看 JVM 已加载的类信息

4.2 sm查看已加载类的方法信息

4.3 jad反编译指定已加载类的源码

4.4 mc内存编译器/Memory Compiler，编译`.java`文件生成`.class`.

4.5 redefine加载外部的`.class`文件

4.6 dump 已加载类的 bytecode 到特定目录

4.7 classloader 查看 classloader 的继承树，urls，类加载信息。

5 monitor 方法执行监视

对匹配 class-pattern／method-pattern／condition-express的类、方法的调用进行监控。

monitor 命令是一个非实时返回命令.

实时返回命令是输入之后立即返回，而非实时返回的命令，则是不断的等待目标 Java 进程返回信息，直到用户输入 Ctrl+C 为止。

服务端是以任务的形式在后台跑任务，植入的代码随着任务的中止而不会被执行，所以任务关闭后，不会对原有性能产生太大影响，而且原则上，任何 Arthas 命令不会引起原有业务逻辑的改变。

方法拥有一个命名参数 [c:]，意思是统计周期（cycle of output），拥有一个整型的参数值

参数名称	参数说明
class-pattern	类名表达式匹配
method-pattern	方法名表达式匹配
condition-express	条件表达式
[E]	开启正则表达式匹配，默认为通配符匹配
`[c:]`	统计周期，默认值为 120 秒
[b]	在方法调用之前计算 condition-express

6、watch函数执行数据观测

让你能方便的观察到指定函数的调用情况。能观察到的范围为：返回值、抛出异常、入参，通过编写 OGNL 表达式进行对应变量的查看。

watch 的参数比较多，主要是因为它能在 4 个不同的场景观察对象

参数名称	参数说明
class-pattern	类名表达式匹配
method-pattern	函数名表达式匹配
express	观察表达式，默认值：`{params, target, returnObj}`
condition-express	条件表达式
[b]	在函数调用之前观察
[e]	在函数异常之后观察
[s]	在函数返回之后观察
[f]	在函数结束之后(正常返回和异常返回)观察
[E]	开启正则表达式匹配，默认为通配符匹配
[x:]	指定输出结果的属性遍历深度，默认为 1，最大值是 4

7、trace 方法内部调用路径，并输出方法路径上的每个节点上耗时

trace 命令能主动搜索 class-pattern／method-pattern 对应的方法调用路径，渲染和统计整个调用链路上的所有性能开销和追踪调用链路。

参数名称	参数说明
class-pattern	类名表达式匹配
method-pattern	方法名表达式匹配
condition-express	条件表达式
[E]	开启正则表达式匹配，默认为通配符匹配
`[n:]`	命令执行次数
`#cost`	方法执行耗时

8、stack 输出当前方法被调用的调用路径

很多时候我们都知道一个方法被执行，但这个方法被执行的路径非常多，或者你根本就不知道这个方法是从那里被执行了，此时你需要的是 stack 命令。

参数名称	参数说明
class-pattern	类名表达式匹配
method-pattern	方法名表达式匹配
condition-express	条件表达式
[E]	开启正则表达式匹配，默认为通配符匹配
`[n:]`	执行次数限制

9、tt 方法执行数据的时空隧道，记录下指定方法每次调用的入参和返回信息，并能对这些不同的时间下调用进行观测

watch 虽然很方便和灵活，但需要提前想清楚观察表达式的拼写，这对排查问题而言要求太高，因为很多时候我们并不清楚问题出自于何方，只能靠蛛丝马迹进行猜测。

这个时候如果能记录下当时方法调用的所有入参和返回值、抛出的异常会对整个问题的思考与判断非常有帮助。

tt -h //查看所有参数

10、options 全局开关

名称	默认值	描述
unsafe	false	是否支持对系统级别的类进行增强，打开该开关可能导致把 JVM 搞挂，请慎重选择！
dump	false	是否支持被增强了的类 dump 到外部文件中，如果打开开关，class 文件会被 dump 到`/${application working dir}/arthas-class-dump/`目录下，具体位置详见控制台输出
batch-re-transform	true	是否支持批量对匹配到的类执行 retransform 操作
json-format	false	是否支持 json 化的输出
disable-sub-class	false	是否禁用子类匹配，默认在匹配目标类的时候会默认匹配到其子类，如果想精确匹配，可以关闭此开关
support-default-method	true	是否支持匹配到 default method，默认会查找 interface，匹配里面的 default method。参考 #1105在新窗口打开
save-result	false	是否打开执行结果存日志功能，打开之后所有命令的运行结果都将保存到`~/logs/arthas-cache/result.log`中
job-timeout	1d	异步后台任务的默认超时时间，超过这个时间，任务自动停止；比如设置 1d, 2h, 3m, 25s，分别代表天、小时、分、秒
print-parent-fields	true	是否打印在 parent class 里的 filed
verbose	false	是否打印更多详细信息
strict	true	是否启用 strict 模式

11、profile 生成火焰图

profiler 命令支持生成应用热点的火焰图。本质上是通过不断的采样，然后把收集到的采样结果生成火焰图。

Profiler list//事件列表

参数名称	参数说明
action	要执行的操作
actionArg	属性名模式
[i:]	采样间隔（单位：ns）（默认值：10’000’000，即 10 ms）
[f:]	将输出转储到指定路径
[d:]	运行评测指定秒
[e:]	要跟踪哪个事件（cpu, alloc, lock, cache-misses 等），默认是 cpu

相关阅读:
模拟一个火车站售票小例子
 DC/DC开关电源学习笔记（十一）Boost升压电路原理
 05_2D3D转换
 迪杰斯特拉算法（Java）
QT+Python人脸表情特征识别
 如何基于智能识别技术构建工地智能化管理体系？
SpringCloud微服务之重要术语详解
 通讯网关软件028——利用CommGate X2Modbus实现Modbus RTU访问PI服务器
 C++之常用的排序算法
 VUE环境搭建
原文地址：https://blog.csdn.net/weixin_43117449/article/details/126622846