这里只简单介绍Linux进程管理的几个简单指令,不涉及原理。
who 命令显示关于当前在本地系统上的所有用户的信息。

这里的 who 主要显示用户名、TTY、登录日期和时间,如果用户是从一个远程机器登录的,那么该机器的主机名也会被显示出来。
语法
who -[abdHlst..] [user]
常用参数
-a 等同于 -bdprtTu-b 系统最近启动时间和日期-d 打印一个僵死的进程(显示没有被 init 重新生成的所有到期的进程)-h 打印一个标题-l 列出登录进程-p 列出活动进程-r 显示当前的运行级别-s 仅列出名字、线路和时间字段。这个标志是缺省值;因此,who 和 who -s 命令是等效的。-t 显示 root 用户上一次用 date 命令对系统时钟做的更改。如果 date 命令自从系统安装以来未被运行过,who -t 命令不产生输出。示例
who -a

Linux ps(英文全拼process status) 命令用于显示当前进程的状态,类似于 windows 的任务管理器。
语法
ps [options] [--help]
常用参数
-A 列出所有的进程-w 显示加宽可以显示较多的咨询au 显示较详细的信息aux 显示显示所有包含其他使用者的进程(包含没有终端的程序)au(x) 输出格式:
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
USER:进程所有者PID:进程的ID%CPU:进程占用的CPU使用率%MEM:进程占用的虚拟内存大小VSZ(Virtual Memory Size):进程占用的虚拟内存大小(这是Linux给进程的内存大小,并不代表进程已经使用了这些内存)。RSS(Resident Set Size):驻留集大小,这是进程当前加载所有页面的大小,由于共享库的存在,可能并不是实际占用内存大小。VSZ 和 RSS 的具体说明可以参考这篇文章。
TTY:终端的次要装置号码(minor device number of tty)
TTY 的详细说明可以参考这篇文章。
STAT:该进程的状态:D 无法中断的休眠状态(通常 IO 的进程);R 正在运行可中在队列中可过行的;S 处于休眠状态;T 停止或被追踪;W 进入内存交换(从内核2.6开始无效);X 死掉的进程(从来没见过);Z 僵尸进程;< 优先级高的进程;N 优先级较低的进程;L 有些页被锁进内存;s 进程的领导者(在它之下有子进程);l 多进程的(使用 CLONE_THREAD, 类似 NPTL pthreads);+ 位于后台的进程组;START:进程开始时间TIME:进程执行的时间COMMAND:所执行的指令。示例
我们可以利用管道来寻找包含指定信息的进程:

Linux kill 命令用于删除执行中的程序或工作。kill 可将指定的信息送至程序,预设的信息为 SIGTERM(15),可将指定程序终止。若仍无法终止该程序,可使用 SIGKILL(9) 信息尝试强制删除程序。程序或工作的编号可利用 ps 指令或 jobs 指令查看。
语法
kill [-s <信息名称或编号>][程序] 或 kill [-l <信息编号>]
常用参数
-l <信息编号> 若不加<信息编号>选项,则-l参数会列出全部的信息名称。-s <信息名称或编号> 指定要送出的信息。[程序] [程序] 可以是程序的 PID 或是 PGID,也可以是工作编号。使用 kill -l 命令列出所有可用信号。
最常用的信号是:
示例
杀死一个进程,可以使用 kill -9 PID 或者 kill -SIGKILL PID 即可。

可以使用 env 命令查看当前用进程的环境变量。
Linux下的环境变量格式为:key=value:value:value...

如果想查找指定 key 的环境变量,可以使用 env | grep key 或者 echo $key。

Linux 的 top 指令类似于 Windows 下的任务管理器,能够动态显示每个进程的状态。
语法
top [选项]
选项:
-d 秒数 指定 top 命令每隔几秒更新。默认是 3 秒;-b 使用批处理模式输出。一般和 -n 选项合用,用于 top 命令重定向到文件中;-n 次数 指定 top 命令执行的次数;-p 进程PID 仅查看指定 ID 的进程;-s 使 top 命令在安全模式中运行,避免在交互模式中出现错误;-u 用户名 只监听某个用户的进程。在 top 命令的显示窗口中,还可以使用如下按键,进行一下交互操作:
?/h 显示交互模式的帮助;P 按照CPU的使用率排序,默认选项;M:按照内存的使用率排序;N:按照 PID 排序;T:按照 CPU 的累积运算时间排序,也就是按照 TIME+ 项排序;k:按照 PID 给予某个进程一个信号。一般用于中止某个进程,信号 9 是强制中止的信号;r:按照 PID 给某个进程重设优先级(Nice)值;q:退出 top 命令;示例

下面解释一下命令的输出。top 命令的输出内容是动态的,默认每隔 3 秒刷新一次。命令的输出主要分为两部分:
下面先来说明第一部分的作用:
| 内容 | 说明 |
|---|---|
| 02:04:47 | 系统当前时间 |
| up 2:23 | 系统的运行时间,本机已经运行2小时23分钟 |
| 2 users | 当前登录了两个用户 |
| load average: 0.20,0.19,0.13 | 系统在之前 1 分钟、5 分钟、15 分钟的平均负载。如果 CPU 是单核的,则这个数值超过 1 就是高负载:如果 CPU 是四核的,则这个数值超过 4 就是高负载 (这个平均负载完全是依据个人经验来进行判断的,一般认为不应该超过服务器 CPU 的核数) |
| 内容 | 说明 |
|---|---|
| Tasks: 310 total | 系统中的进程总数 |
| 1 running | 正在运行的进程数 |
| 309 sleeping | 睡眠的进程数 |
| 0 stopped | 正在停止的进程数 |
| 0 zombie | 僵尸进程数。如果不是 0,则需要手工检查僵尸进程 |
| 内容 | 说明 |
|---|---|
| 4.7 us | 用户模式占用的CPU百分比 |
| 1.0 sy | 系统模式占用的CPU百分比 |
| 0.0 ni | 改变过优先级的用户进程占用的 CPU 百分比 |
| 94.0 id | 空闲 CPU 占用的 CPU 百分比 |
| 0.3 wa | 等待输入/输出的进程占用的 CPU 百分比 |
| 0.0 hi | 硬中断请求服务占用的 CPU 百分比 |
| 0.0 si | 软中断请求服务占用的 CPU 百分比 |
| 0.0 st | st(steal time)意为虚拟时间百分比,就是当有虚拟机时,虚拟 CPU 等待实际 CPU 的时间百分比 |
| 内容 | 说明 |
|---|---|
| 7933.9 total | 物理内存的总量,单位为MB |
| 5133.9 free | 空闲的物理内存数量 |
| 1292.9 used | 己经使用的物理内存数量 |
| 1507.0 buff/cache | 作为缓冲的内存数量 |
我们通过 top 命令的第一部分就可以判断服务器的健康状态。如果 1 分钟、5 分钟、15 分钟的平均负载高于 1,则证明系统压力较大。如果 CPU 的使用率过高或空闲率过低,则证明系统压力较大。如果物理内存的空闲内存过小,则也证明系统压力较大。
这时,我们就应该判断是什么进程占用了系统资源。如果是不必要的进程,就应该结束这些进程;如果是必需进程,那么我们该増加服务器资源(比如増加虚拟机内存),或者建立集群服务器。
我们还要解释一下缓冲(buffer)和缓存(cache)的区别:
简单来说,缓存(cache)是用来加速数据从硬盘中"读取"的,而缓冲(buffer)是用来加速数据"写入"硬盘的。
再来看 top 命令的第二部分输出,主要是系统进程信息,各个字段的含义如下:
更具体的信息可以查看这篇文章。