atop 是一款用于监控 Linux 系统资源与进程的工具,以一定的频率记录系统的运行状态,采集系统资源(CPU、内存、磁盘和网络)使用情况及进程运行情况数据,并以日志文件的方式保存在磁盘中。当实例出现问题时,可获取对应的 atop 日志文件用于分析。
本文以操作系统为 CentOS 7.9 的云服务器为例,介绍如何使用 atop 监控工具。
~]# yum install atop -y
参考以下步骤,配置 atop 监控周期及日志保留时间。
将 LOGINTERVAL=600 修改为 LOGINTERVAL=30,表示将默认的600s监控周期修改为30s。建议修改为30s,您可结合实际情况进行修改。
将 LOGGENERATIONS=28 修改为 LOGGENERATIONS=7,表示将默认的日志保留时间28天修改为7天。为避免 atop 长时间运行占用太多磁盘空间,建议修改为7天,您可结合实际情况进行修改。
修改完成后如下所示:
~]# cat /etc/sysconfig/atop
LOGOPTS=""
LOGINTERVAL=30
LOGGENERATIONS=2
LOGPATH=/var/log/atop
~]# systemctl restart atop
atop 启动后,会将采集的数据记录在 /var/log/atop 目录的日志文件中。请获取实际的日志文件名,执行以下命令,查看日志文件并参考 atop 常用命令 及 系统资源监控字段说明 进行分析。
~]# atop -r /var/log/atop/atop_20220722
atop 常用命令
您可在打开日志文件后,使用以下命令筛选所需数据:
c:按照进程的 CPU 使用率降序筛选。
m:按照进程的内存使用率降序筛选。
d:按照进程的磁盘使用率降序筛选。
a:按照进程资源综合使用率进行降序筛选。
n:按照进程的网络使用率进行降序筛选(使用此命令需安装额外的内核模块,默认不支持)。
t:跳转到下一个监控采集点。
T:跳转到上一个监控采集点。
b:指定时间点,格式为 YYYYMMDDhhmm。
系统资源监控字段说明
下图为部分监控字段以及数值,数值根据采样周期获取,仅作为参考。
主要参数说明如下:
不建议在业务环境下长期运行 atop,您可在问题排查完成后停止 atop。在 CentOS 7 及以上版本可执行以下命令,停止 atop。
systemctl stop atop