• nginx常见内部参数,错误总结


    1、日志简介

    nginx日志主要有两种:访问日志和错误日志。访问日志主要记录客户端访问nginx的每一个请求,格式可以自定义;错误日志主要记录客户端访问nginx出错时的日志,格式不支持自定义。两种日志都可以选择性关闭。

    通过访问日志,你可以得到用户地域来源、跳转来源、使用终端、某个URL访问量等相关信息;通过错误日志,你可以得到系统某个服务或server的性能瓶颈等。因此,将日志好好利用,你可以得到很多有价值的信息。

    2、访问日志

    [Access.log]

    log_format  main  '$remote_addr $remote_user [$time_local] "$request" $http_host '

                      '$status $upstream_status $body_bytes_sent "$http_referer" '

                      '"$http_user_agent" $ssl_protocol $ssl_cipher $upstream_addr '

                      '$request_time $upstream_response_time'; 

    变量名称

    变量描述

    举例说明

    $remote_addr

    客户端地址

    113.140.15.90

    $remote_user

    客户端用户名称

    -

    $time_local

    访问时间和时区

    18/Jul/2012:17:00:01 +0800

    $request

    请求的URI和HTTP协议

    "GET /pa/img/home/logo-alipay-t.png HTTP/1.1"

    $http_host

    请求地址,即浏览器中你输入的地址(IP或域名)

    img.alipay.com

    10.253.70.103

    $status

    HTTP请求状态

    200

    $upstream_status

    upstream状态

    200

    $body_bytes_sent

    发送给客户端文件内容大小

    547

    $http_referer

    跳转来源

     "https://cashier.alipay.com.../"

    $http_user_agent

    用户终端代理

    "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; SV1; GTB7.0; .NET4.0C;

    $ssl_protocol

    SSL协议版本

    TLSv1

    $ssl_cipher

    交换数据中的算法

    RC4-SHA

    $upstream_addr

    后台upstream的地址,即真正提供服务的主机地址

    10.228.35.247:80

    $request_time

    整个请求的总时间

    0.205

    $upstream_response_time

    请求过程中,upstream响应时间

    0.002

    线上实例:

    116.9.137.90 - [02/Aug/2012:14:47:12 +0800] "GET /images/XX/20100324752729.png HTTP/1.1"img.alipay.com 200 200 2038 https://cashier.alipay.com/XX/PaymentResult.htm?payNo=XX&outBizNo=2012XX "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; Trident/4.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; Tablet PC 2.0; 360SE)" TLSv1 AES128-SHA 10.228.21.237:80 0.198 0.001

     

    线下测试$http_referer):

    10.14.21.197 - - [14/Aug/2012:17:28:22 +0800] "GET /spanner/watch/v1?--db=ztg-1&--mode=compare&--index=status&--option=&--cluster=whole&-F=2012%2F8%2F12-00%3A00%3A00&-T=%2B2880&-i=1&-n=0&_=1344936501292 HTTP/1.1" 200 94193 "http://spanner.alipay.NET/optionFrame/history.html" "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/21.0.1180.60 Safari/537.1"

    clip_image001

    备注:$http_referer和重定向有关。

     

    线下测试($http_host):

    clip_image002

    备注:$http_host的值和你在浏览器里输入的值有关。

    3、错误日志

    错误信息

    错误说明

    "upstream prematurely(过早的) closed connection"

    请求uri的时候出现的异常,是由于upstream还未返回应答给用户时用户断掉连接造成的,对系统没有影响,可以忽略

    "recv() failed (104: Connection reset by peer)"

    (1)服务器的并发连接数超过了其承载量,服务器会将其中一些连接Down掉; 

    (2)客户关掉了浏览器,而服务器还在给客户端发送数据; 

    (3)浏览器端按了Stop

    "(111: Connection refused) while connecting to upstream"

    用户在连接时,若遇到后端upstream挂掉或者不通,会收到该错误

    "(111: Connection refused) while reading response header from upstream"

    用户在连接成功后读取数据时,若遇到后端upstream挂掉或者不通,会收到该错误

    "(111: Connection refused) while sending request to upstream"

    Nginx和upstream连接成功后发送数据时,若遇到后端upstream挂掉或者不通,会收到该错误

    "(110: Connection timed out) while connecting to upstream"

    nginx连接后面的upstream时超时

    "(110: Connection timed out) while reading upstream"

    nginx读取来自upstream的响应时超时

    "(110: Connection timed out) while reading response header from upstream"

    nginx读取来自upstream的响应头时超时

    "(110: Connection timed out) while reading upstream"

    nginx读取来自upstream的响应时超时

    "(104: Connection reset by peer) while connecting to upstream"

    upstream发送了RST,将连接重置

    "upstream sent invalid header while reading response header from upstream"

    upstream发送的响应头无效

    "upstream sent no valid HTTP/1.0 header while reading response header from upstream"

    upstream发送的响应头无效

    "client intended to send too large body"

    用于设置允许接受的客户端请求内容的最大值,默认值是1M,client发送的body超过了设置值

    "reopening logs"

    用户发送kill  -USR1命令

    "gracefully shutting down",

    用户发送kill  -WINCH命令

    "no servers are inside upstream"

    upstream下未配置server

    "no live upstreams while connecting to upstream"

    upstream下的server全都挂了

    "SSL_do_handshake() failed"

    SSL握手失败

    "SSL_write() failed (SSL:) while sending to client"

    "(13: Permission denied) while reading upstream"

    "(98: Address already in use) while connecting to upstream"

    "(99: Cannot assign requested address) while connecting to upstream"

    "ngx_slab_alloc() failed: no memory in SSL session shared cache"

    ssl_session_cache大小不够等原因造成

    "could not add new SSL session to the session cache while SSL handshaking"

    ssl_session_cache大小不够等原因造成

    "send() failed (111: Connection refused)"

     
     
     
     
     
     

    1.[warn] conflicting server name "192.168.1.86" on 0.0.0.0:80, ignored

     [warn]: conflicting server name “abc.com” on 0.0.0.0:80, ignored

    出现这个错误一般是由于技术员的粗心造成的,原因是相同的域名abc.com出现两次甚至是多次。一般在把配置文件分离出来写时候会容易犯。技术员经常复制配置文件,然后忘记修改里面的内容。

    解决方法就是把所有配置文件查一遍看是否有重复出现的。或者查询哪个配置文件中有abc.com。
    WINDOW下用搜索
    Linux下用grep "abc.com"

    2.NGINX 启动时报错“[warn]: conflicting server name “xxx.com” on 0.0.0.0:80, ignored”

    include vhost/*.conf;

    一般是由于技术人员配置时使用Include 语句,使用了nginx.conf之外的配置文件,如果两个配置文件重复配置了xxx.com就会出现这个错误。 

    3.今天PHP的导出EXCEL里面突然出现超时


    虽然我在PHP脚本里面写了set_time_limit(0);但是它还是出现那种50x错误。查看日志文件后发现里面写着:
    upstream timed out (110: Connection timed out) while reading response header from upstream

    解决办法如下:
    编辑ngnix对应的虚拟主机配置文件

    [html] view plain copy
     
     在CODE上查看代码片派生到我的代码片
    1. fastcgi_read_timeout 后面的时间可以根据自己的情况设置,默认是60秒  
    2.         location ~ .+.php?$  
    3.         {  
    4.             fastcgi_pass          127.0.0.1:1025;  
    5.         #   fastcgi_pass          unix:/usr/local/webserver/fastcgi/sock/fastcgi.sock;  
    6.             fastcgi_index         index.php;  
    7.         #   For Time out                这句是注释,可以不写  
    8.             fastcgi_read_timeout 500;  
    9.             include               fastcgi_params;  
    10.         }  
    11.    

    4.nginx502 Bad Gateway 

    Nginx 502 Bad Gateway的含义是请求的PHP-CGI已经执行,但是由于某种原因(一般是读取资源的问题)没有执行完毕而导致PHP-CGI进程终止。

    Nginx 502错误的原因比较多,是因为在代理模式下后端服务器出现问题引起的。

    这些错误一般都不是nginx本身的问题,一定要从后端找原因!php-cgi进程数不够用、php执行时间长、或者是php-cgi进程死掉,都会出现502错误  。502错误最通常的出现情况就是后端主机宕机。


    vim /usr/local/webserver/php/etc/php-fpm.conf
    一般来说Nginx 502 Bad Gateway和php-fpm.conf的设置有关,php-fpm.conf有两个至关重要的参数,一个是”max_children”,另一个是”request_terminate_timeout” ,但是这个值不是通用的,而是需要自己计算的。

    计算的方式如下:

    如果你的服务器性能足够好,且宽带资源足够充足,PHP脚本没有系循环或BUG的话你可以直接将”request_terminate_timeout”设置成0s。0s的含义是让PHP-CGI一直执行下去而没有时间限制。而如果你做不到这一点,也就是说你的PHP-CGI可能出现某个BUG,或者你的宽带不够充足或者其它的原因导致你的PHP-CGI能够假死那么就建议你给”request_terminate_timeout”赋一个值,这个值可以根据你服务器的性能进行设定。一般来说性能越好你可以设置越高,20分钟 -30分钟都可以。由于我的服务器PHP脚本需要长时间运行,有的可能会超过10分钟因此我设置了900秒,这样不会导致PHP-CGI死掉而出现502 Bad gateway这个错误。

    而”max_children”这个值又是怎么计算出来的呢?这个值原则上是越大越好,php-cgi的进程多了就会处理的很快,排队的请求就会很少。设置”max_children”也需要根据服务器的性能进行设定,一般来说一台服务器正常情况下每一个php-cgi所耗费的内存在20M左右,因此我的”max_children”我设置成40个,20M*40=800M也就是说在峰值的时候所有PHP-CGI所耗内存在800M以内,低于我的有效内存1Gb。而如果我的”max_children”设置的较小,比如5-10个,那么 php-cgi就会“很累”,处理速度也很慢,等待的时间也较长。如果长时间没有得到处理的请求就会出现504 Gateway Time-out这个错误,而正在处理的很累的那几个php-cgi如果遇到了问题就会出现502 Bad gateway这个错误。

    5.一般解决办法

    遇到502问题,可以优先考虑按照以下两个步骤去解决。

    1、查看当前的PHP FastCGI进程数是否够用:

    netstat -anpo | grep "php-cgi" | wc -l

    如果实际使用的“FastCGI进程数”接近预设的“FastCGI进程数”,那么,说明“FastCGI进程数”不够用,需要增大。

    [html] view plain copy
     
     在CODE上查看代码片派生到我的代码片
    1. # ps aux | grep php-cgi |wc -l  
    2. 130  
    3.   
    4. # netstat -anpo | grep "php-cgi" | wc -l  
    5. 450  
    6.   
    7. # netstat -anpo | grep "php-cgi" |more  
    8. tcp        0      0 192.168.12.201:52719        192.168.12.203:13002        ESTABLISHED 27687/php-cgi       off (0.00/0/0)  
    9. tcp        0      0 192.168.12.201:52713        192.168.12.203:13002        ESTABLISHED 27685/php-cgi       off (0.00/0/0)  
    10. tcp        0      0 192.168.12.201:52694        192.168.12.203:13002        ESTABLISHED 27682/php-cgi       off (0.00/0/0)  
    11. tcp        0      0 192.168.12.201:52688        192.168.12.203:13002        ESTABLISHED 27681/php-cgi       off (0.00/0/0)  
    12. tcp        0      0 192.168.12.201:52701        192.168.12.203:13002        ESTABLISHED 27683/php-cgi       off (0.00/0/0)  
    13.   
    14. 重启后#   netstat -anpo | grep "php-cgi" | wc -l  
    15. 46  
    16.   
    17.   
    18. [root@jushanweb1 ~]#  netstat -anpo | grep "nginx" | wc -l  
    19. 17  
    20. [root@jushanweb1 ~]#  ps aux | grep nginx |wc -l  
    21. 10  

    2、部分PHP程序的执行时间超过了Nginx的等待时间,可以适当增加nginx.conf配置文件中FastCGI的timeout时间,例如:

    ...... http { ...... fastcgi_connect_timeout 300; fastcgi_send_timeout 300; fastcgi_read_timeout 300; ...... } ......



    php.ini中memory_limit设低了会出错,修改了php.ini的memory_limit为128M,重启nginx,发现好了,原来是PHP的内存不足了。


    临时解决办法:

    综上所述,Nginx提示502和504错误的临时解决办法是

    1、调整php-fpm.conf的相关设置:

    [html] view plain copy
     
     在CODE上查看代码片派生到我的代码片
    1. <value name=”max_children”>32</value>  
    2.   
    3. <value name=”request_terminate_timeout”>30s</value>  fast-cgi的执行脚本时间  
    终级解决方案:

    标题3中所示的解决方案只能临时解决问题,而如果网站的访问量确实非常非常大,而Nginx+FastCGI只能对处理瞬间或短时间内的高并发有很好的效果,所以目前唯一的终极解决方案是:定时平滑重启php-cgi。

    具体配置如下:

    [html] view plain copy
     
     在CODE上查看代码片派生到我的代码片
    1. 1、写一个非常简单的脚本:  
    2.   
    3. #vi /home/www/scripts/php-fpm.sh  
    4.   
    5. 内容如下:  
    6.   
    7. #!/bin/bash  
    8. #This script run at */1  
    9. /usr/local/php/sbin/php-fpm reload  
    10.   
    11. 2、将脚本添加至计划任务:  
    12.   
    13. #crontab -e  
    14.   
    15. 内容如下:  
    16.   
    17. */1 * * * * /home/www/scripts/php-fpm.sh  
    18.   
    19. 注:为了省事起见,也可以不写脚本,直接在crontab里写入php-fpm的平滑重启命令。  
    20.    

    Nginx 502错误情况1:
    网站的访问量大,而php-cgi的进程数偏少。
    针对这种情况的502错误,只需增加php-cgi的进程数。具体就是修改/usr/local/php/etc/php-fpm.conf 文件,将其中的max_children值适当增加。这个数据要依据你的VPS或独立服务器的配置进行设置。一般一个php-cgi进程占20M内存,你可以自己计算下,适量增多。
    /usr/local/php/sbin/php-fpm restart 然后重启一下.

    Nginx 502错误情况2:
    CPU占用率、内存占用率非常高,遭到CC攻击.
    解决方法请参考:LinuxVPS简单解决CC攻击

    Nginx 502错误情况3:
    CPU占用率不高,内存溢出。
    检查一下网站程序有没有问题?一般小偷站点常常会出现内存溢出。
    检查一下/var/log/目录下的日志,看看是不是有人爆破SSH和FTP端口?
    SSH、FTP遭到穷举也会占用大量内存。是的话改掉SSH端口和FTP端口即可。

    =======================nginx 504 time out

    Nginx 504 Gateway Time-out的含义是所请求的网关没有请求到,
    简单来说就是没有请求到可以执行的PHP-CGI。

    Nginx 504 Gateway Time-out则是与nginx.conf的设置有关。

    504 Gateway Time-out问题常见于使用nginx作为web server的服务器的网站


    一般看来, 这种情况可能是由于nginx默认的fastcgi进程响应的缓冲区太小造成的, 
    这将导致fastcgi进程被挂起, 如果你的fastcgi服务对这个挂起处理的不好, 
    那么最后就极有可能导致504 Gateway Time-out
    现在的网站, 尤其某些论坛有大量的回复和很多内容的, 一个页面甚至有几百K
    默认的fastcgi进程响应的缓冲区是8K, 我们可以设置大点
    在nginx.conf里, 加入:

    fastcgi_buffers 8 128k

    这表示设置fastcgi缓冲区为8×128k
    当然如果您在进行某一项即时的操作, 可能需要nginx的超时参数调大点, 例如设置成60秒:

    send_timeout 60;

    我只是调整了这两个参数, 结果就是没有再显示那个超时, 可以说效果不错, 但是也可能是由于其他的原因, 目前关于nginx的资料不是很多, 很多事情都需要长期的经验累计才有结果, 期待您的发现哈!


    ---------------解决办法:

    调整nginx.conf的相关设置:

    [html] view plain copy
     
     在CODE上查看代码片派生到我的代码片
    1. fastcgi_connect_timeout 600;  
    2. fastcgi_send_timeout 600;  
    3. fastcgi_read_timeout 600;  
    4. fastcgi_buffer_size 256k;  
    5. fastcgi_buffers 16 256k;  
    6. fastcgi_busy_buffers_size 512k;  
    7. fastcgi_temp_file_write_size 512k;  
  • 相关阅读:
    SQL Server 排序实现函数细说
    hibernate的11大优势
    JSP开发使用JSTL和EL表达式问题
    Java开源框架集
    Struts实现登陆
    如何取得ResultSet的行数
    SQL Server2005 ROW_NUMBER() OVER 使用
    Struts中perform方法1.2.4版本以后都不在使用
    家长会随笔
    几何画板图像复制
  • 原文地址:https://www.cnblogs.com/terryguan/p/6599122.html
Copyright © 2020-2023  润新知