软件介绍
atop 是一款用于监控 Linux 系统资源和进程的工具,以一定的频率记录系统的运行状态,采集系统资源(CPU、内存、磁盘和网络)使用情况及进程运行情况数据,并以日志文件的方式保存在磁盘中。当实例出现问题时,可获取对应的 atop 日志文件用于分析,特别是针对一些突然宕机的服务器,通过这种方式获取历史资源使用情况,非常有利于查找到服务器异常崩溃的原因。本文以操作系统为 CentOS 7.9 及 Ubuntu 20的云服务器为例,介绍如何使用 atop 监控工具。
软件安装
#centos7.9 yum install atop #ubuntu apt-get install atop
配置并重启 atop
1、vi编辑器打开atop配置文件
# centos7.9 vi /etc/sysconfig/atop # ubuntu20 vi /usr/share/atop/atop.daily
2、按i进入编辑模式,修改以下配置:
* 将 LOGINTERVAL=600 修改为 LOGINTERVAL=30,表示将默认的600s监控周期修改为30s。建议修改为30s,您可结合实际情况进行修改。
* 将 LOGGENERATIONS=28 修改为 LOGGENERATIONS=7,表示将默认的日志保留时间28天修改为7天。为避免 atop 长时间运行占用太多磁盘空间,建议修改为7天,您可结合实际情况进行修改。
修改完成后如下图所示:
3、按Esc后输入:wq ,保存并退出编辑器
4、重启atop
#centos7,9 && ubuntu20 systemctl restart atop
atop 启动后,会将采集的数据记录在 /var/log/atop 目录的日志文件中。请获取实际的日志文件名,执行以下命令,查看日志文件并参见 atop 常用命令 及 系统资源监控字段说明 进行分析。
atop -r /var/log/atop/atop_2021xxxx
可以在打开日志文件后,使用以下命令筛选所需数据:
系统资源监控字段说明
下图为部分监控字段以及数值,数值根据采样周期获取,仅作为参考。
主要参数说明如下:
进入 atop 信息界面,我们看到的就是进程信息的默认视图 (上图下半部分),按 g 键可以从其他视图跳到默认视图。
内存视图展示了进程使用内存情况,按 m 键可进入内存视图。
上图下半部分展示了每个进程占用的虚拟内存空间 (VSIZE)、内存空间 (RSIZE) 大小,以及在上一个采样周期中虚拟内存和物理内存增长大小 (VGROW、RGROW),MEM 列指示进程所占物理内存大小。
按 c 键我们可以进入命令视图,该视图展示了与每个进程相对应的命令。