high_swapspace_useage

1. 简介
2. 分析
3. 解决方法

1 简介

Swap分区在系统的物理内存不够用的时候，把物理内存中的一部分空间释放出来，以供当前运行的程序使用。而这些被释放出来的内存，会先放到swap中，等到那些程序要运行时，再从Swap分区中恢复保存的数据到内存中。以下是几种引发swap被占用的可能因素。

2 分析

2.1 相关参数

在Linux内核参数中有一个vm.swappiness ，它决定了系统在物理内存使用达到什么值（百分比）时开始使用swap.系统默认此参数的值为60. 对应的系统文件是 /proc/sys/vm/swappiness.

cat /proc/sys/vm/swappiness
1

2.2 设置参数

临时调整

echo 10 > /proc/sys/vm/swappiness
或者
sysctl vm.swappiness=10

开机启动即调整

将此参数值配置到内核参数文件 /etc/sysctl.conf 中即可
```
cat /etc/sysctl.conf|grep swappiness
vm.swappiness = 1
```

2.3 NUMA机制

2.3.1 numa作用

现在的机器上都是有多个CPU和多个内存块的。以前我们都是将内存块看成是一大块内存，所有CPU到这个共享内存的访问消息是一样的。这就是之前普遍使用的SMP模型。但是随着处理器的增加，共享内存可能会导致内存访问冲突越来越厉害，且如果内存访问达到瓶颈的时候，性能就不能随之增加。NUMA（Non-Uniform Memory Access）就是这样的环境下引入的一个模型。比如一台机器是有2个处理器，有4个内存块。我们将1个处理器和两个内存块合起来，称为一个NUMA node，这样这个机器就会有两个NUMA node。在物理分布上，NUMA node的处理器和内存块的物理距离更小，因此访问也更快。比如这台机器会分左右两个处理器（cpu1, cpu2），在每个处理器两边放两个内存块(memory1.1, memory1.2, memory2.1,memory2.2)，这样NUMA node1的cpu1访问memory1.1和memory1.2就比访问memory2.1和memory2.2更快。所以使用NUMA的模式如果能尽量保证本node内的CPU只访问本node内的内存块，那这样的效率就是最高的。

但是numa也是有限制的，如果一个进程限制它只能使用自己的numa节点的内存，那么当自身numa node内存使用光之后，就不会去使用其他numa node的内存了，会开始使用swap，甚至更糟的情况，机器没有设置swap的时候，可能会直接死机！所以你可以使用numactl –interleave=all来取消numa node的限制。

如果你的程序是会占用大规模内存的，你大多应该选择关闭numa node的限制（或从硬件关闭numa）。因为这个时候你的程序很有几率会碰到numa陷阱。

另外，如果你的程序并不占用大内存，而是要求更快的程序运行时间。你大多应该选择限制只访问本numa node的方法来进行处理。

2.3.2 numa与性能

在os层numa关闭时,打开bios层的numa会影响性能，QPS会下降15-30%;

在bios层面numa关闭时，无论os层面的numa是否打开，都不会影响性能。

安装numactl yum install numactl -y. 另外两个常用命令:

numastat 等同于 cat /sys/devices/system/node/node0/numastat ，在/sys/devices/system/node/文件夹中记录系统中的所有内存节点的相关详细信息。
numactl –hardware 列举系统上的NUMA节点
numactl –show 查看绑定信息

2.3.3 判断是否启用NUMA

Redhat或者Centos系统中可以通过命令判断bios层是否开启numa, grep -i numa /var/log/dmesg.

或者直接执行numastat 查看结果。

如果输出结果为： No NUMA configuration found

说明numa为disable，如果不是上面内容说明numa为enable,例如显示：NUMA: Using 30 for the hash shift.

2.4 进程异常

有时候，并不是内存不够用。而是由于程序或者进程异常，过多的占用了swap空间。如果有个脚本可以查看所有进程占用的swap空间就可以快速排查异常进程了。下面是脚本内容：

printf "%-20s	%10s	%-s
" "PID" "Swap" "Proc_Name"
echo -e '------------------	------------	---------------------------'

for pid in `ls -l /proc | grep ^d | awk '{ print $9 }'| grep -v [^0-9]|grep -v 1$`
do
    if [ -f /proc/"$pid"/smaps ]; then
	 swap=$(grep Swap /proc/$pid/smaps | gawk '{ sum+=$2;} END{ print sum }')
	 swap=${swap:=0}  # if swap's values is null then set swap=0
    fi
    proc_name=$(ps aux | grep -w "$pid" | grep -v grep | awk '{ for(i=11;i<=NF;i++){ printf("%s ",$i); }}')
    if [ "$swap" -gt 0 ];then
	echo -e "$pid	${swap}	$proc_name"
    fi

done | sort -k2 -n | gawk -F'	' '{
 pid[NR]=$1;
 size[NR]=$2;
 name[NR]=$3;
}
END{
 for(id=1;id<=length(pid);id++)
 {
     if(size[id]<1024)
         printf("%-10s	%15sKB	%s
",pid[id],size[id],name[id]);
     else if(size[id]<1048576)
         printf("%-10s	%15.2fMB	%s
",pid[id],size[id]/1024,name[id]);
     else
         printf("%-10s	%15.2fGB	%s
",pid[id],size[id]/1048576,name[id]);
 }
}'

当找到异常进程后，可以kill 掉进程，或者重启进程，以释放swap空间。

3 解决方法

综上，当你遇到swap空间占用异常的情况，首先查看物理内存是否真的不够用了。如果物理内存用光，占用swap空间是很正常的。

如果物理内存仍有较多的空间未利用，而占用了过多的swap,那么很有可能是Numa 机制引起的。需要重启进程，指定进程使用全局内存。

如果以上两种原因都不是。就很有可能是进程异常。通过脚本查出占用进程过多的进程，然后重启进程或者kill掉。

high_swapspace_useage

high_swapspace_useage

Table of Contents

1 简介

2 分析

2.1 相关参数

2.2 设置参数

2.3 NUMA机制

2.3.1 numa作用

2.3.2 numa与性能

2.3.3 判断是否启用NUMA

2.4 进程异常

3 解决方法