(1).服务器io占满,服务无响应,
sar -q -f /var/log/sa/sa28
上图显示plist-sz 增加了一倍
plist-sz 说明:进程列表中的进程(processes)和线程数(threads)的数量
这个参数的算法:所有进程数+线程数
所有进程数:ps axu | wc -l
线程数: pstree -p | wc -l
扩展:
Linux最大线程数限制及当前线程数查询
1、总结系统限制有:
/proc/sys/kernel/pid_max #查系统支持的最大线程数,一般会很大,相当于理论值
/proc/sys/kernel/threads-max
max_user_process #系统限制某用户下最多可以运行多少进程或线程,使用命令:ulimit -u
注:修改max_user_process的数值,只需要修改/etc/security/limits.conf即可,但是这个参数需要修改/etc/security/limits.d/90-nproc.conf
附录:
附录1:centos 6.*可以修改/etc/security/limits.d/90-nproc.conf
我这边是通过修改/etc/security/limits.conf,在最后添加
* soft nproc 65535
* hard nproc 65535
查看默认的线程栈大小,单位是字节(Bytes),使用命令:ulimit -s
/proc/sys/vm/max_map_count #硬件内存大小
2、Java虚拟机本身限制:
-Xms #intial java heap size
-Xmx #maximum java heap size
-Xss #the stack size for each thread
3、查询当前某程序的线程或进程数
# pstree -p `ps -e | grep java | awk '{print $1}'` | wc -l
上面用的是命令替换,关于命令替换,就是说用``括起来的命令会优先执行,然后以其输出作为其他命令的参数
或
# pstree -p 进程号 | wc -l
# top -H 进程号 | wc -l
上面用的是管道,关于管道:管道符号"|"左边命令的输出作为右边命令的输入
4、查询当前整个系统已用的线程或进程数
pstree -p | wc -l
(2)线程数多导致磁盘io 读写高,导致服务无响应,处于等待状态
sar -d -f /var/log/sa/sa28
wr_sec/s 每秒写多少扇区数
说明:
#tps:每秒I/O的传输总数
#rd_sec/s 每秒读取的扇区的总数
#wr_sec/s 每秒写入的扇区的 总数
#avgrq-sz 平均每次次磁盘I/O操作的数据大小(扇区)
#avgqu-sz 磁盘请求队列的平均长度
#await 从请求磁盘操作到系统完成处理,每次请求的平均消耗时间,包括请求队列等待时间,单位是毫秒(1秒等于1000毫秒),等于寻道时间+队列时间+服务时间
#svctm I/O的服务处理时间,即不包括请求队列中的时间
#%util I/O请求占用的CPU百分比,值越高,说明I/O越慢