• 快速掌握Nginx(四) —— Nginx日志切片和常用配置总结


    1.Nginx日志管理

    1.日志简单介绍

      Nginx提供了日志记录的功能,日志文件在对我们管理网站十分有用,通过访问日志(access_log)我们可以获取请求来源、客户端信息、请求的资源等信息;通过错误日志(error_log)可以获取错误发生时间、错误信息等,方便我们及时定位和修复错误。看一下Nginx中日志相关的指令。

    #设置访问日志:访问日志文件为nginx/logs/mysite.access.log,格式为main
      access_log  logs/mysite.access.log  main;
              位置 格式
    #设置错误日志:错误日志文件为nginx/logs/mysite.error.log,记录级别为error   error_log logs/mysite.error.log error;
                位置        级别
    #定义main格式的日志 log_format main '$remote_addr - $remote_user [$time_local] "$request" ' '$status $body_bytes_sent "$http_referer" ' '"$http_user_agent" "$http_x_forwarded_for"';

      在Nginx日志中严重程度:debug<info<notice<warn<error<crit,一般记录warn/error级别;定义日志格式中,$开头的是Nginx中的变量,在前面已经总结过了,为了方便查看本篇底部也放了一份。记录网站的访问/错误日志,十分简单,只需要把access_log/error_log指令放在需要记录的server主机内即可。也可以把access_log/error_log指令放在http中用来记录全局日志。

      看一个简单的Nginx配置文件,为了方便演示,这里只配置了默认主机,并删去了Nginx中一些和日志不相关的配置:

    worker_processes 2;
    events {
        worker_connections  1024;
    }
    
    http {
        include       mime.types;
        default_type  application/octet-stream;#定义main格式的日志
        log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '
                          '$status $body_bytes_sent "$http_referer" '
                          '"$http_user_agent" "$http_x_forwarded_for"';
      #默认主机
      server{
            listen 80;
            server_name localhost;
            location /{
                    root html;
                    index index.html;
             }
            #访问日志,名字问nginx/logs/mysite.access.log,格式为main格式
            access_log  logs/mysite.access.log  main;
            #错误日志,记录级别为error
            error_log logs/mysite.error.log error;
          }
    }

      当我们输入虚拟机IP会访问到默认主机,这时在nginx/logs目录下自动生成访问日志mysite.access.log和错误日志mysite.error.log。内容如下:

    mysite.access.log内容

     

      访问日志的内容为main格式中定义的信息,某些信息不存在没有显示。我们也可以自定义访问日志的格式。

    mysite.error.log内容

      可以看到错误原因是favicon.ico文件找不到,我们也可以知道错误发生的时间,请求,客户端和服务端IP等信息。

     2.日志切片

      上边我们已经知道怎么去设置访问日志和错误日志,但是这样设置有一个弊端:日志文件都放在同一个文件中,长时间运行后日志文件很大,可能达到几个G,甚至十几个G大小,查看起来很不方便。为了解决这个问题就需要进行日志切片,如每小时或者每天的日志放在一个单独的文件中。怎么实现呢?总体思路是:设置一个定时任务,每隔一段时间将日志文件剪切到一个特定的目录下。

      这里以访问日志切片为例,为了方便演示这里把每分钟的访问日志放在一个单独的文件中,首先,添加一个存放日志文件的目录,执行命令 mkdir /usr/local/nginx/logs/mysitelogs ,我们打算把mysite的所有访问日志都放在这个文件夹下。然后添加一个切割日志的脚本,执行命令 vim /usr/local/nginx/mysitelog.sh ,脚本内容如下:

    #mysite.com虚拟主机的日志存放路径
    LOGPATH=/usr/local/nginx/logs/mysite.access.log
    #日志备份文件目录,mysite虚拟主机的备份日志放在logs下的单独目录下
    BASEPATH=/usr/local/nginx/logs/mysitelogs
    #一分钟记录一次 
    bak=$BASEPATH/$(date -d today +%Y%m%d%H%M).mysite.access.log
    #重名日志文件
    mv $LOGPATH $bak
    touch $LOGPATH
    #向nginx主进程发送信号,重新写日志
    /usr/local/nginx/sbin/nginx -s reopen

    最后添加一个定时任务,执行命令 crontab -e ,编辑内容如下,表示每分钟执行一次mysitelog.sh脚本:

    * * * * * sh /usr/local/nginx/mysitelog.sh

    到这里日志切片就结束了,我们看一个日志文件, cd /usr/local/nginx/logs/mysitelogs 到日志文件夹下,看到日志文件为每分钟存储一次,前缀格式为yyyyMMddhhmm:

     

    补充:我们在实际使用时一般把一天的日志放在一个文件中(高并发量的除外),下边的脚本实现每天晚上11:30分存储一次日志文件:

    #-------------------shell脚本   
    #该虚拟主机的日志存放路径
    LOGPATH=/usr/local/nginx/logs/mysite.access.log
    #日志备份文件目录,mysite虚拟主机的备份日志放在logs下的单独目录下
    BASEPATH=/usr/local/nginx/logs/mysitelogs
    #一天记录一次,格式为20190326mysite.access.log
    bak=$BASEPATH/$(date -d yesterday +%Y%m%d)mysite.access.log
    #重名日志文件
    echo $bak
    mv $LOGPATH $bak
    touch $LOGPATH
    #向nginx主进程发送信号,重新打开日志
    /usr/local/nginx/sbin/nginx -s reopen
    
    #------------------定时任务
    30 23 * * * sh /usr/local/nginx/mysitelog.sh
    View Code

    2.常用Nginx配置总结

      Nginx的介绍到这里就基本结束了,这里汇总了一些Nginx中最常用的配置

    2.1 基本配置

    # 用户和用户组
    user wyy wyy
    
    #工作进程个数,通常设置和逻辑cpu个数一致
    worker_processes  8;
    #cpu亲和性,每个进程分配一个cpu  00000001表示第一个cpu,00000010表示第二个cpu,依次类推
    worker_cpu_affinity 00000001 00000010 00000100 00001000 00010000 00100000 01000000 10000000;
    #如果是两个逻辑cpu,可以设置worker_processes  2; worker_cpu_affinity 01 10;
    
    #一个nginx工作进程最多可以打开的文件描述符个数 ,最好和linux最多能打开的文件描述符个数(查看命令:ulimit-n)保持一致。
    #出现报错:too open many file,这时我们把worker_rlimit_nofile 值设置大一些就可以了。
    worker_rlimit_nofile 65535
    
    
    #记录的级别严重程度:debug<info<notice<warn<error<crit],一般记录warn/error级别
    #错误日志,级别为error
    error_log  logs/error.log  error;
    
    #记录nginx的master进程的pid
    pid        logs/nginx.pid;
    
     
    events {
        use epoll ;               #多路复用IO的一种方式,效率很高,支持linux2.6以上内核
        worker_connections  1024; #每个工作进程的最大连接数,一台nginx的理论最大连接数就是(单个工作进程的最大连接数*工作进程个数)
        multi_accept on;          #尽可能多地接受请求
    }
    
    
    http {
        #媒体类型,定义在nginx/conf/mine.types中
        include       mime.types;
        #默认的媒体类型
        default_type  application/octet-stream;
        #main日志格式
        log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '
                          '$status $body_bytes_sent "$http_referer" '
                          '"$http_user_agent" "$http_x_forwarded_for"';
      #访问日志
        access_log  logs/access.log  main;
      #nginx是否调用sendfile函数(zero,copy等)来输出文件,普通应用都应该设置成on
        sendfile        on;
      #默认开启,nginx接受到数据包不马上发送,等到数据包达到一定大小再发送,使用Nagle算法控制。减少tcp传输次数,防止网络阻塞
        tcp_nopush      on;
      #tcp不延迟,和tcp_nopush相反,接收到数据包就发送,提高数据的实时响应
      #tcp_nodelay off;
        #长连接,请求资源获取完毕后不断开连接,60s后关闭该连接
        keepalive_timeout  60;
     
       #上传时单个文件最大为10M
      client_max_body_size 10m;
      #客户端的请求头缓冲区大小,一般设置为系统分页大小即可(查询系统分页命令:getconf PAGESIZE)
      #client_header_buffer_size 4k;
      #客户端的请求体缓冲区大小,超过这个大小存放在临时文件中,
      #client_body_buffer_size 8k;
    
      ######超时管理 代理服务器时才有用 (超时都返回502超时错误)
      #nginx连接后台服务器超时时间,
      proxy_connect_timeout 90;
      #后台服务器回传数据超时时间,90s传输数据未完成就报错
      proxy_send_timeout 90;
      #连接成功,等待后台服务器响应的超时时间
      proxy_read_timeout 90;
    
      #为打开文件设定缓存,默认是不启用的,max指定缓存数量,建议和最多能打开文件描述符个数(查询命令:ulimit -n)一致,inactive是指经过多长时间文件没被请求后删除缓存
      open_file_cache max=65535 inactive=60s;
      #多久检查一次缓存的有效信息
      open_file_cache_valid 30s;
      
      #定义负载均衡模块,
      upstream mysiteServers{
          server 123.11.1.2:8080 weight=1 max_fails=2 fail_timeout=30s;
          server 123.11.1.3:8080 weight=2 max_fails=2 fail_timeout=30s;
          server 123.11.1.4:8080 weight=3 max_fails=2 fail_timeout=30s;
      }
    
      server{
           servername :www.site1.com  www.site1.cn;
        #首页 
      location = / {
          proxy_pass http:/123.11.1.1:8080/Home/Index;
        }
    
      #静态文件
      location ~* .(gif|jpg|jpeg|png|css|js|ico)$ {
          root /webroot/res/;
        #缓存十分钟
        expires:600;
        }
      #通用规则,用来转发动态请求到后端应用服务器
      location / {
          proxy_pass http://mysiteServers;
        }
     }

    2.2 压缩配置

      gzip可以放在http/server/location/if下,用于压缩请求资源,减小网络传输的数据尺寸。gzip压缩常用于文本类型(css/js等)文件压缩,二进制文件(如图片,视频)压缩比不大,建议使用缓存(expires)进行优化:

    #开启gzip压缩
    gzip  on;
    #最小压缩大小4000字节,小于4000字节就不压缩了
    gzip_min_length 4000;
    #压缩的缓冲设置,缓冲32块开始输出,每块4k大小
    #gzip_buffers 32 4k;
    #压缩采用的版本
    gzip_http_version 1.1;
    #压缩级别,级别越大压缩后尺寸越小方便传输,但同时压缩时耗费cpu资源也越大(最大为9,一般不要超过6)
    gizp_comp_level 4;
    #压缩的文件类型,不属于这些类型的就不压缩(可以通过 cat nginx/conf/mine.types查看文件类型),注:二进制文件如图片/视频的压缩比不大,不建议压缩
    gzip_types  application/javascript  text/plain  text/css text/xml;   
    # 是否传输gzip压缩标志,请求头中有vary标志的返回压缩版本文件,没有vary头的返回原始文件
    gzip_vary on;

    2.3 负载均衡配置

    #1.weight
    #指定轮询权重,weight越大,转发几率越大,一般用于后端服务器性能不均的情况。
      upstream mysiteServers{
        server 192.168.70.1:8080 weight=1;
        server 192.168.70.2:8080 weight=3;
      }
    #2.ip_hash
    #每个请求按访问ip的hash结果分配,这样每个访客固定访问一个后端服务器,适用后台服务器缓存多的场合,也可以解决session的问题。
      upstream mysiteServers{
        ip_hash;
        server 192.168.70.1:8080;
        server 192.168.70.2:8080;
      }
            
    #一些参数
      upstream mysiteServers{
        server 192.168.70.1:8080 down;
        server 192.168.70.1:8081 weight=2;
        server 192.168.70.2:8080;
        server 192.168.70.2:8081 backup;
      }
    #1.down表示的server暂时不参与负载均衡,请求不会转发给这台服务器;
    #2.weight为weight越大,负载的权重就越大;
    #3.max_fails续请求失败的次数默认为1.当超过最大次数时,不再转发请求给这台服务器;
    #4.fail_timeout:max_fails次失败后,暂停多久后再向这台服务器转发请求;
    #5.backup: 其它所有的非backup机器down或者忙的时候,请求backup机器。所以这台机器压力会最轻。
    

    补充:也可以使用第三方模块实现其他负载均衡模式: ①添加nginx-upstream-fair模块可以实现按响应性能进行负载均衡,响应速度越快的服务器分发请求的几率越大; ②添加nginx_upstream_hash模块可以实现按请求url来进行转发请求,url相同的请求由同一个服务器处理,适用于缓存较多场景。

     补充:Nginx的一些全局变量

    变量

    含义

    $args

    请求中的参数,同$query_string

    $content length

    请求头中的Content-length字段。

    $content_type

    请求头中的Content-Type字段。

    $document_root

    当前请求在root指令中指定的值。

    $host

    请求主机头字段,否则为服务器名称。

    $http_user_agent

    用户代理,一般为用户浏览器信息

    $http_cookie

    客户端cookie信息

    $limit_rate

    这个变量可以限制连接速率。

    $request_method

    客户端请求的动作,通常为GET或POST。

    $remote_addr

    客户端的IP地址。

    $remote_port

    客户端的端口。

    $remote_user

    已经经过Auth Basic Module验证的用户名。

    $request_filename

    当前请求的文件路径,由root或alias指令与URI请求生成。

    $scheme

    协议名(如http,https)。

    $server_protocol

    请求使用的协议,通常是HTTP/1.0或HTTP/1.1。

    $server_addr

    服务器地址,在完成一次系统调用后可以确定这个值。

    $server_name

    服务器名称。

    $server_port

    请求到达服务器的端口号。

    $request_uri

    包含请求参数的原始URI,不包含主机名,如”/user/getuser?id=100”。

    $uri

    不带请求参数的当前URI,$uri不包含主机名,如”/user/getuser”。

    $document_uri

    与$uri相同

    $http_x_forwarded_for

     代理过程的IP

  • 相关阅读:
    简单实现缓存需求
    Visual Studio 项目模板、文件模板、代码段和环境设置
    Memcached 基础应用
    Visual Studio 2010 模型设计工具 基本应用
    委托和事件 委托
    C# 编码规范
    锂电池正确使用方法
    HTC W800(XV6750) USB 连接 Windows 7 设备错误 解决办法
    UML 面向对象分析与设计
    注册表项写入与删除简便方法
  • 原文地址:https://www.cnblogs.com/wyy1234/p/10692441.html
Copyright © 2020-2023  润新知