问题
postgresql故障节点rewind过程,主备节点间存在大量的数据传输,此时主机节点ssh备机节点可能会出现心跳超时断开问题:
类似问题:
ssh 远程执行命令慢(debug2: channel 0: open confirm rwindow 0 rmax 32768)
出现的服务器:dell R740 :KYLIN V10
分析
网卡bufferfloat满载,小包可能会发不出去
解决
方法一(当前生效):
tc qdisk replace dev em1 root fq_codel
注:此方法重启系统后会失效
方法二(永久生效):
1、echo 'net.core.default_qdisk=fq_codel' >>/etc/sysctl.conf
2、重启服务器
查询是否生效
tc qdisc show dev eth0
结果如下表示生效:
qdisc fq_codel 0: root refcnt 2 limit 10240p flows 1024 quantum 1514 target 5ms interval 100ms memory_limit 32Mb ecn drop_batch 64