在状态图中可以看到,一端主动发送FIN,也就是主动关闭时,经历FIN_WAIT_1和FIN_WAIT_2状态后会进入TIME_WAIT状态,等待2MSL后才会彻底释放连接四元组。
当一个高并发系统处理大量短连接服务时,每次处理短链接服务结束后主动关闭连接,会产生大量socket处于TIME_WAIT状态导致客户端无法连接。
解决方法:
修改/etc/sysctl.conf
net.ipv4.tcp_syncookies = 1 表示开启SYN Cookies。当出现SYN等待队列溢出时,启用cookies来处理,可防范少量SYN攻击,默认为0,表示关闭; net.ipv4.tcp_tw_reuse = 1 表示开启重用。允许将TIME-WAIT sockets重新用于新的TCP连接,默认为0,表示关闭; net.ipv4.tcp_tw_recycle = 1 表示开启TCP连接中TIME-WAIT sockets的快速回收,默认为0,表示关闭。 net.ipv4.tcp_fin_timeout 修改系默认的 TIMEOUT 时间 net.ipv4.tcp_keepalive_time = 1200 #表示当keepalive起用的时候,TCP发送keepalive消息的频度。缺省是2小时,改为20分钟。 net.ipv4.ip_local_port_range = 1024 65000 #表示用于向外连接的端口范围。缺省情况下很小:32768到61000,改为1024到65000。 net.ipv4.tcp_max_syn_backlog = 8192 #表示SYN队列的长度,默认为1024,加大队列长度为8192,可以容纳更多等待连接的网络连接数。 net.ipv4.tcp_max_tw_buckets = 5000 #表示系统同时保持TIME_WAIT套接字的最大数量,如果超过这个数字,TIME_WAIT套接字将立刻被清除并打印警告信息。 默认为180000,改为5000。对于Apache、Nginx等服务器,上几行的参数可以很好地减少TIME_WAIT套接字数量,但是对于 Squid,效果却不大。此项参数可以控制TIME_WAIT套接字的最大数量,避免Squid服务器被大量的TIME_WAIT套接字拖死。
当服务器端收到FIN时,会回复ACK,此时处于半连接的状态,服务器端可以继续向客户端发送数据,但客户端无法向服务器端发送数据。如果不及时调用close()关闭套接字,会一直处于CLOSE_WAIT状态。
当出现大量CLOSE_WAIT状态时,应检查是否有套接字失效或错误后未被释放。