• netstat监控大量ESTABLISHED连接与Time_Wait连接问题


    问题描述:

    在不考虑系统负载、CPU、内存等情况下,netstat监控大量ESTABLISHED连接与Time_Wait连接。

    # netstat -n | awk '/^tcp/ {++y[$NF]} END {for(w in y) print w, y[w]}'
    CLOSE_WAIT         348
    ESTABLISHED        1240
    TIME_WAIT          5621

    监控Apache与tomcat之间的链接端口

    #netstat -n | grep 8009 | wc -l

    7198

    问题1:怎么解决大量Time_Wait

    通过调整内核参数:

    复制代码
    vim /etc/sysctl.conf
    #编辑文件,加入以下内容:
    net.ipv4.tcp_syncookies = 1
    net.ipv4.tcp_tw_reuse = 1
    net.ipv4.tcp_tw_recycle = 1
    net.ipv4.tcp_fin_timeout = 30
    #然后执行 /sbin/sysctl -p 让参数生效。
    复制代码

    配置说明:

    net.ipv4.tcp_syncookies = 1 表示开启SYN Cookies。当出现SYN等待队列溢出时,启用cookies来处理,可防范少量SYN攻击,默认为0,表示关闭;

    net.ipv4.tcp_tw_reuse = 1    表示开启重用。允许将TIME-WAIT sockets重新用于新的TCP连接,默认为0,表示关闭;

    net.ipv4.tcp_tw_recycle = 1  表示开启TCP连接中TIME-WAIT sockets的快速回收,默认为0,表示关闭;

    net.ipv4.tcp_fin_timeout=30修改系統默认的 TIMEOUT 时间。

    如果以上配置调优后性能还不理想,可继续修改一下配置:

    复制代码
    vi /etc/sysctl.conf
    net.ipv4.tcp_keepalive_time = 1200 
    #表示当keepalive起用的时候,TCP发送keepalive消息的频度。缺省是2小时,改为20分钟。
    net.ipv4.ip_local_port_range = 1024 65000 
    #表示用于向外连接的端口范围。缺省情况下很小:32768到61000,改为1024到65000。
    net.ipv4.tcp_max_syn_backlog = 8192 
    #表示SYN队列的长度,默认为1024,加大队列长度为8192,可以容纳更多等待连接的网络连接数。
    net.ipv4.tcp_max_tw_buckets = 5000 
    #表示系统同时保持TIME_WAIT套接字的最大数量,如果超过这个数字,TIME_WAIT套接字将立刻被清除并打印警告信息。
    默认为180000,改为5000。对于Apache、Nginx等服务器,上几行的参数可以很好地减少TIME_WAIT套接字数量,但是对于 Squid,效果却不大。此项参数可以控制TIME_WAIT套接字的最大数量,避免Squid服务器被大量的TIME_WAIT套接字拖死。
    复制代码

    调优完毕,再压一下看看效果吧。

    # netstat -n | awk '/^tcp/ {++y[$NF]} END {for(w in y) print w, y[w]}'
    
    ESTABLISHED        968

    问题1:怎么解决请求结束后依然存在大量ESTABLISHED没有被释放

    初步推断是tomcat服务器回收session时出了问题,这个一般都跟服务器的Timeout设置有联系。

    查看tomcat的配置文件 server.xml

    <Connector port="8080" protocol="HTTP/1.1"
                   connectionTimeout="20000"
                   redirectPort="8443" URIEncoding="UTF-8" />
    *****

    检查配置得出20000毫秒的时候acceptCount=”100” ,明显不合理,最大连接数也太小了吧。

    所以进一步优化:

    connectionTimeout="20000" 改为 connectionTimeout="100"
    
    acceptCount="100"改为acceptCount="5000"

    优化完毕,继续压测...

    系统响应能力节节攀升,之前LoadRunner报错问题直到压倒***并发也再也没有出现。

    Action.c(380): 错误 -26608: 对于“http://www.cnlogs.com/javame”,HTTP 状态代码=504 (Gateway Time-out)

    总结:

     待定,以后再写!

  • 相关阅读:
    Ubuntu系统下的实用软件推荐
    上传项目到GitHub
    eclipse+fileSyncPlugin+svn+jenkins+tomcat
    js,jq获取元素位置属性及兼容性写法
    清除浮动的几种方法
    sub,dl,dt,排版,横向滚动条,浮动元素居中,box-sizing
    a里面不能嵌套a
    随笔
    自适应屏幕轮播图详解
    tip
  • 原文地址:https://www.cnblogs.com/flish/p/4964277.html
Copyright © 2020-2023  润新知