Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照,就是执行ps命令的那个时刻的那些进程,如果想要动态的显示进程信息,就可以使用top命令。
要对进程进行监测和控制,首先必须要了解当前进程的情况,也就是需要查看当前进程,而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行和运行的状态、进程是否结束、进程有没有僵死、哪些进程占用了过多的资源等等。总之大部分信息都是可以通过执行该命令得到的。
ps 为我们提供了进程的一次性的查看,它所提供的查看结果并不动态连续的;如果想对进程时间监控,应该用 top 工具。
kill 命令用于杀死进程。
linux上进程有5种状态:
1. 运行(正在运行或在运行队列中等待)
2. 中断(休眠中, 受阻, 在等待某个条件的形成或接受到信号)
3. 不可中断(收到信号不唤醒和不可运行, 进程必须等待直到有中断发生)
4. 僵死(进程已终止, 但进程描述符存在, 直到父进程调用wait4()系统调用后释放)
5. 停止(进程收到SIGSTOP, SIGSTP, SIGTIN, SIGTOU信号后停止运行运行)
ps工具标识进程的5种状态码:
D 不可中断 uninterruptible sleep (usually IO)
R 运行 runnable (on run queue)
S 中断 sleeping
T 停止 traced or stopped
Z 僵死 a defunct (”zombie”) process
其他状态码:
- P 等待交换页
- W 无驻留页 has no resident pages 没有足够的记忆体分页可分配。
- X 死掉的进程
- < 高优先级进程 高优先序的进程
- N 低优先 级进程 低优先序的进程
- L 内存锁页 Lock 有记忆体分页分配并缩在记忆体内
- s 进程的领导者(在它之下有子进程);
- l 多进程的(使用 CLONE_THREAD, 类似 NPTL pthreads)
- 。位于后台的进程组
1.命令格式:
ps[参数]
2.命令功能:
用来显示当前进程的状态
3.命令参数:
具体命令解释如下:
-a 显示所有进程 -c 显示进程的真实名称 -N 反向选择 -e 等于“-a” -f 显示程序间的关系 -H 显示树状结构 -r 显示当前终端的进程 -T 显示当前终端的所有程序 -u 以用户为主的格式来显示程序状况 -x 显示所有程序,不以终端机来区分 -C<命令> 列出指定命令的状况 --lines<行数> 每页显示的行数 --width<字符数> 每页显示的字符数 --sort <keywords> 指定排序方式
最常用的方法是ps -aux,然后再利用一个管道符号导向到grep去查找特定的进程,然后再对特定的进程进行操作。
4.使用场景
ps 可用参数非常多,下面列举几个常用的。
场景1:不加参数运行
[ciadmin@2-103test_app ~]$ ps PID TTY TIME CMD 6208 pts/11 00:00:00 ps 16464 pts/11 00:00:00 bash [ciadmin@2-103test_app ~]$
如上所示,如果不加参数运行,只会显示本控制台启动的程序,显示信息很少,所以基本不会这么用。
场景2:显示所有进程
命令如下:
$ ps -aux 或 ps -ef
以上命令也是最常用的命令,ps aux 和 ps -ef 都是用来显示当前运行的进程,但是,
ps aux 是用BSD的格式来显示进程,显示的项目有:
USER , PID , %CPU , %MEM , VSZ , RSS , TTY , STAT , START , TIME , COMMAND
ps -ef 是用标准的格式显示进程,显示的项目有:
UID , PID , PPID , C , STIME , TTY , TIME , CMD
两者的输出结果差别不大,但展示风格不同。aux是BSD风格,-ef是System V风格。这是次要的区别,一个影响使用的区别是aux会截断command列,而-ef不会。当结合grep时这种区别会影响到结果。
以上命令输出结果很多,为了便于查看一般会结合分页命令(less、more、pg等)和管道一同使用,如下:
$ ps -aux | less USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND root 1 0.0 0.0 193624 5480 ? Ss 2017 0:09 /usr/lib/systemd/systemd --switched-root --system --deserialize 21 root 2 0.0 0.0 0 0 ? S 2017 0:00 [kthreadd] root 3 0.0 0.0 0 0 ? S 2017 0:01 [ksoftirqd/0] root 5 0.0 0.0 0 0 ? S< 2017 0:00 [kworker/0:0H] root 7 0.0 0.0 0 0 ? S 2017 0:00 [migration/0]
上文命令头的释义如下:
USER:该 process 属于那个使用者账号的
PID :该 process 的号码
%CPU:该 process 使用掉的 CPU 资源百分比
%MEM:该 process 所占用的物理内存百分比
VSZ :该 process 使用掉的虚拟内存量 (Kbytes)
RSS :该 process 占用的固定的内存量 (Kbytes)
TTY :该 process 是在那个终端机上面运作,若与终端机无关,则显示 ?,另外, tty1-tty6 是本机上面的登入者程序,若为 pts/0 等等的,则表示为由网络连接进主机的程序。
STAT:该程序目前的状态,主要的状态有
START:该 process 被触发启动的时间
TIME :该 process 实际使用 CPU 运作的时间
COMMAND:该程序的实际指令
状态码的含义可以参考文首部分。
场景3:查找特定进程
上文场景2中已经可以获取所有进程信息,那么查找特定进程只要参考我们前面的文章《每天一个Linux命令:grep》即可找到方法。
使用方法如下:
$ ps -aux | grep service root 9206 2.8 0.3 5626060 52112 ? Ssl 2017 494:10 python rest_api_service.py restart root 12846 0.0 0.0 112648 968 pts/11 R+ 11:13 0:00 grep --color=auto service
场景4:通过cpu和内存使用来过滤进程
默认的结果集是未排好序的。可以通过 –sort命令来排序。
内存增序
ps aux --sort rss
内存减序
ps aux --sort -rss
cpu增序
ps auxw --sort=%cpu
cpu减序
ps auxw --sort=-%cpu
排序键值很多,常用如下:
KEY LONG DESCRIPTION
c cmd simple name of executable
C pcpu cpu utilization
g pgrp process group ID
j cutime cumulative user time
J cstime cumulative system time
k utime user time
p pid process ID
P ppid parent process ID
u user user name
扩展
前期已经讲过通过 top 命令动态监控进程信息,本文不再重复。
(1)pstree
pstree命令将所有行程以树状图显示,树状图将会以 pid (如果有指定) 或是以 init 这个基本行程为根 (root),如果有指定使用者 id,则树状图会只显示该使用者所拥有的行程。
主要选项如下:
-a 显示每个程序的完整指令,包含路径,参数或是常驻服务的标示。
-c 不使用精简标示法。
-G 使用VT100终端机的列绘图字符。
-h 列出树状图时,特别标明现在执行的程序。
-H <程序识别码> 此参数的效果和指定”-h”参数类似,但特别标明指定的程序。
-l 采用长列格式显示树状图。
-n 用程序识别码排序。预设是以程序名称来排序。
-p 显示程序识别码。
-u 显示用户名称。
-U 使用UTF-8列绘图字符。
-V 显示版本信息。
示例:
$ pstree
systemd─┬─NetworkManager───2*[{NetworkManager}]
├─agetty
├─auditd───{auditd}
├─crond
├─dbus-daemon───{dbus-daemon}
├─ipmievd
├─irqbalance
├─master─┬─pickup
│ └─qmgr
├─mysqld───27*[{mysqld}]
├─polkitd───5*[{polkitd}]
├─python───1080*[{python}]
├─python───151*[{python}]
├─python───11*[{python}]
├─rsyslogd───2*[{rsyslogd}]
├─2*[screen───bash───python───{python}]
├─screen───bash───python
├─screen─┬─2*[bash]
│ └─bash───python───8*[{python}]
├─sshd─┬─2*[sshd───bash───tmux]
│ └─2*[sshd───sftp-server]
├─systemd-journal
├─systemd-logind
├─systemd-udevd
├─tmux─┬─3*[bash]
│ ├─bash───tail
│ ├─6*[bash───ssh]
│ ├─bash───python───python
│ └─bash───pstree
└─tuned───4*[{tuned}]
(2)pstack
pstack命令可显示每个进程的栈跟踪。pstack 命令必须由相应进程的属主或 root 运行。可以使用 pstack 来确定进程挂起的位置。此命令允许使用的唯一选项是要检查的进程的 PID。
这个命令很多系统软件仓库并没有,需要自己搜索相关源下载安装,所以这里只提示一下,感兴趣的同学可以自己研究。
我更常用的命令是:strace。当一个程序运行出错,而我们又没有程序源码时,strace 是调试利器。
strace命令是一个集诊断、调试、统计与一体的工具,我们可以使用strace对应用的系统调用和信号传递的跟踪结果来对应用进行分析,以达到解决问题或者是了解应用工作过程的目的。
strace常用来跟踪进程执行时的系统调用和所接收的信号。 在Linux世界,进程不能直接访问硬件设备,当进程需要访问硬件设备(比如读取磁盘文件,接收网络数据等等)时,必须由用户态模式切换至内核态模式,通 过系统调用访问硬件设备。strace可以跟踪到一个进程产生的系统调用,包括参数,返回值,执行消耗的时间。
grep相关参考《linux grep命令》
实例5:将目前属于您自己这次登入的 PID 与相关信息列示出来
命令:
ps -l
输出:
[root@localhost test6]# ps -l
F S UID PID PPID C PRI NI ADDR SZ WCHAN TTY TIME CMD
4 S 0 17398 17394 0 75 0 - 16543 wait pts/0 00:00:00 bash
4 R 0 17469 17398 0 77 0 - 15877 - pts/0 00:00:00 ps
说明:
各相关信息的意义:
F 代表这个程序的旗标 (flag), 4 代表使用者为 super user S 代表这个程序的状态 (STAT),关于各 STAT 的意义将在内文介绍 UID 程序被该 UID 所拥有 PID 就是这个程序的 ID ! PPID 则是其上级父程序的ID C CPU 使用的资源百分比 PRI 这个是 Priority (优先执行序) 的缩写,详细后面介绍 NI 这个是 Nice 值,在下一小节我们会持续介绍 ADDR 这个是 kernel function,指出该程序在内存的那个部分。如果是个 running的程序,一般就是 "-" SZ 使用掉的内存大小 WCHAN 目前这个程序是否正在运作当中,若为 - 表示正在运作 TTY 登入者的终端机位置 TIME 使用掉的 CPU 时间。 CMD 所下达的指令为何
在预设的情况下, ps 仅会列出与目前所在的 bash shell 有关的 PID 而已,所以, 当我使用 ps -l 的时候,只有三个 PID。
实例8:找出与 cron 与 syslog 这两个服务有关的 PID 号码
[root@localhost test6]# ps aux | egrep '(cron|syslog)'
root 2682 0.0 0.0 83384 2000 ? Sl Nov02 0:00 /sbin/rsyslogd -i /var/run/syslogd.pid -c 5
root 2735 0.0 0.0 74812 1140 ? Ss Nov02 0:00 crond
root 17475 0.0 0.0 61180 832 pts/0 S+ 16:27 0:00 egrep (cron|syslog)
[root@localhost test6]#
说明:
其他实例:
1. 可以用 | 管道和 more 连接起来分页查看
命令:
ps -aux |more
2. 把所有进程显示出来,并输出到ps001.txt文件
命令:
ps -aux > ps001.txt
3. 输出指定的字段
命令:
ps -o pid,ppid,pgrp,session,tpgid,comm
输出:
[root@localhost test6]# ps -o pid,ppid,pgrp,session,tpgid,comm
PID PPID PGRP SESS TPGID COMMAND
17398 17394 17398 17398 17478 bash
17478 17398 17478 17398 17478 ps
[root@localhost test6]#
ps -eo pid pcpu pmem rss
参数说明:
- pcpu是CPU利用率
- pmem是内存利用率,这两个都是用百分比表示
- rss是实际驻留内存的大小,单位是K
==================================
[appdeploy@CNSZ22PL0088:/home/appdeploy]$ps -eo user,sz,rss,minflt,majflt,pcpu,args
USER SZ RSS MINFLT MAJFLT %CPU COMMAND
root 4839 1540 3033 9 0.0 /sbin/init
root 0 0 0 0 0.0 [kthreadd]
607 8591051 52956 22218 0 0.0 ./redis-server *:6378
607 58068 12596 6232981 0 0.0 redis-server *:6381
607 2165451 100220 10186165 0 0.0 ./src/redis-server *:6376
607 3319991 3267160 2085851 0 0.2 /home/appdeploy/jdk1.8.0_25/bin/java -Dcom.sun.management.jmxremote -Dcom.sun.management.jmxremote.ssl=false -Xms5g -Xmx5g -Djetty.logs=/ho
ntp 9263 1696 445 0 0.0 ntpd -x -u ntp:ntp -p /var/run/ntpd.pid
root 26582 1556 3579 0 0.0 /bin/sh /usr/bin/mysqld_safe --datadir=/var/lib/mysql --socket=/var/lib/mysql/mysql.sock --pid-file=/var/run/mysqld/mysqld.pid --basedir=/u
mysql 1305553 1647064 922044 0 0.7 /usr/sbin/mysqld --basedir=/usr --datadir=/var/lib/mysql --plugin-dir=/usr/lib64/mysql/plugin --user=mysql --log-error=/var/log/mysqld.log
607 5270984 2242012 891644 0 10.1 /home/appdeploy/jdk1.8.0_25/bin/java -Dcom.sun.management.jmxremote -Dcom.sun.management.jmxremote.ssl=false -Xms1g -Xmx2g -Djetty.logs=/ho
607 2492475 1434756 3075748 0 0.1 /home/appdeploy/jdk1.8.0_25/bin/java -Dcom.sun.management.jmxremote -Dcom.sun.management.jmxremote.ssl=false -Xms1g -Xmx2g -Djetty.logs=/ho
607 41675 38684 33886 0 0.6 ./redis-sentinel *:28888 [sentinel]
root 24924 3756 1299 0 0.0 sshd: appdeploy [priv]
607 24924 1812 302 0 0.0 sshd: appdeploy@pts/2
607 28720 2108 1401 0 0.0 -bash
607 34516 8788 2185554 0 0.4 redis-server *:6379
607 29163 1252 416 0 5.0 ps -eo user,sz,rss,minflt,majflt,pcpu,args
root 409597 19860 45771920 1 0.3 /opt/exagent/exagent/bin/python/bin/python /opt/exagent/exagent/bin/Agent.py 6861
[appdeploy@CNSZ22PL0088:/home/appdeploy]$
==============================