high_swapspace_useage
Table of Contents
1 简介
Swap分区在系统的物理内存不够用的时候,把物理内存中的一部分空间释放出来,以供当前运行的程序使用。而这些被释放出来的内存,会先放到swap中,等到那些程序要运行时,再从Swap分区中恢复保存的数据到内存中。 以下是几种引发swap被占用的可能因素。
2 分析
2.1 相关参数
在Linux内核参数中有一个vm.swappiness ,它决定了系统在物理内存使用达到什么值(百分比)时开始使用swap.系统默认此参数的值为60. 对应的系统文件是 /proc/sys/vm/swappiness.
cat /proc/sys/vm/swappiness 1
2.2 设置参数
临时调整
echo 10 > /proc/sys/vm/swappiness 或者 sysctl vm.swappiness=10
开机启动即调整
将此参数值配置到内核参数文件 /etc/sysctl.conf 中即可
cat /etc/sysctl.conf|grep swappiness vm.swappiness = 1
2.3 NUMA机制
2.3.1 numa作用
现在的机器上都是有多个CPU和多个内存块的。以前我们都是将内存块看成是一大块内存,所有CPU到这个共享内存的访问消息是一样的。这就是之前普遍使用的SMP模型。但是随着处理器的增加,共享内存可能会导致内存访问冲突越来越厉害,且如果内存访问达到瓶颈的时候,性能就不能随之增加。NUMA(Non-Uniform Memory Access)就是这样的环境下引入的一个模型。比如一台机器是有2个处理器,有4个内存块。我们将1个处理器和两个内存块合起来,称为一个NUMA node,这样这个机器就会有两个NUMA node。在物理分布上,NUMA node的处理器和内存块的物理距离更小,因此访问也更快。比如这台机器会分左右两个处理器(cpu1, cpu2),在每个处理器两边放两个内存块(memory1.1, memory1.2, memory2.1,memory2.2),这样NUMA node1的cpu1访问memory1.1和memory1.2就比访问memory2.1和memory2.2更快。所以使用NUMA的模式如果能尽量保证本node内的CPU只访问本node内的内存块,那这样的效率就是最高的。
但是numa也是有限制的,如果一个进程限制它只能使用自己的numa节点的内存,那么当自身numa node内存使用光之后,就不会去使用其他numa node的内存了,会开始使用swap,甚至更糟的情况,机器没有设置swap的时候,可能会直接死机!所以你可以使用numactl –interleave=all来取消numa node的限制。
如果你的程序是会占用大规模内存的,你大多应该选择关闭numa node的限制(或从硬件关闭numa)。因为这个时候你的程序很有几率会碰到numa陷阱。
另外,如果你的程序并不占用大内存,而是要求更快的程序运行时间。你大多应该选择限制只访问本numa node的方法来进行处理。
2.3.2 numa与性能
在os层numa关闭时,打开bios层的numa会影响性能,QPS会下降15-30%;
在bios层面numa关闭时,无论os层面的numa是否打开,都不会影响性能。
安装numactl yum install numactl -y. 另外两个常用命令:
- numastat 等同于 cat /sys/devices/system/node/node0/numastat ,在/sys/devices/system/node/文件夹中记录系统中的所有内存节点的相关详细信息。
- numactl –hardware 列举系统上的NUMA节点
- numactl –show 查看绑定信息
2.3.3 判断是否启用NUMA
Redhat或者Centos系统中可以通过命令判断bios层是否开启numa, grep -i numa /var/log/dmesg.
或者直接执行numastat 查看结果。
如果输出结果为: No NUMA configuration found
说明numa为disable,如果不是上面内容说明numa为enable,例如显示:NUMA: Using 30 for the hash shift.
2.4 进程异常
有时候,并不是内存不够用。而是由于程序或者进程异常,过多的占用了swap空间。如果有个脚本可以查看所有进程占用的swap空间就可以快速排查异常进程了。 下面是脚本内容:
printf "%-20s %10s %-s " "PID" "Swap" "Proc_Name" echo -e '------------------ ------------ ---------------------------' for pid in `ls -l /proc | grep ^d | awk '{ print $9 }'| grep -v [^0-9]|grep -v 1$` do if [ -f /proc/"$pid"/smaps ]; then swap=$(grep Swap /proc/$pid/smaps | gawk '{ sum+=$2;} END{ print sum }') swap=${swap:=0} # if swap's values is null then set swap=0 fi proc_name=$(ps aux | grep -w "$pid" | grep -v grep | awk '{ for(i=11;i<=NF;i++){ printf("%s ",$i); }}') if [ "$swap" -gt 0 ];then echo -e "$pid ${swap} $proc_name" fi done | sort -k2 -n | gawk -F' ' '{ pid[NR]=$1; size[NR]=$2; name[NR]=$3; } END{ for(id=1;id<=length(pid);id++) { if(size[id]<1024) printf("%-10s %15sKB %s ",pid[id],size[id],name[id]); else if(size[id]<1048576) printf("%-10s %15.2fMB %s ",pid[id],size[id]/1024,name[id]); else printf("%-10s %15.2fGB %s ",pid[id],size[id]/1048576,name[id]); } }'
当找到异常进程后,可以kill 掉进程,或者重启进程,以释放swap空间。
3 解决方法
综上,当你遇到swap空间占用异常的情况,首先查看物理内存是否真的不够用了。如果物理内存用光,占用swap空间是很正常的。
如果物理内存仍有较多的空间未利用,而占用了过多的swap,那么很有可能是Numa 机制引起的。需要重启进程,指定进程使用全局内存。
如果以上两种原因都不是。就很有可能是进程异常。通过脚本查出占用进程过多的进程,然后重启进程或者kill掉。
Created: 2020-05-18 Mon 15:41