快速掌握Nginx(四) —— Nginx日志切片和常用配置总结

1.Nginx日志管理

1.日志简单介绍

　　Nginx提供了日志记录的功能，日志文件在对我们管理网站十分有用，通过访问日志(access_log)我们可以获取请求来源、客户端信息、请求的资源等信息；通过错误日志(error_log)可以获取错误发生时间、错误信息等，方便我们及时定位和修复错误。看一下Nginx中日志相关的指令。

#设置访问日志：访问日志文件为nginx/logs/mysite.access.log，格式为main
　　access_log  logs/mysite.access.log  main;
　　　　　　　　　     位置                格式
#设置错误日志：错误日志文件为nginx/logs/mysite.error.log,记录级别为error
　　error_log logs/mysite.error.log error;
　　　　　　　　　　　　位置 　　　　　　　级别
 #定义main格式的日志
   log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '
                      '$status $body_bytes_sent "$http_referer" '
                      '"$http_user_agent" "$http_x_forwarded_for"';

　　在Nginx日志中严重程度：debug<info<notice<warn<error<crit,一般记录warn/error级别；定义日志格式中，$开头的是Nginx中的变量，在前面已经总结过了，为了方便查看本篇底部也放了一份。记录网站的访问/错误日志，十分简单，只需要把access_log/error_log指令放在需要记录的server主机内即可。也可以把access_log/error_log指令放在http中用来记录全局日志。

　　看一个简单的Nginx配置文件,为了方便演示，这里只配置了默认主机，并删去了Nginx中一些和日志不相关的配置：

worker_processes 2;
events {
    worker_connections  1024;
}

http {
    include       mime.types;
    default_type  application/octet-stream;#定义main格式的日志
    log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '
                      '$status $body_bytes_sent "$http_referer" '
                      '"$http_user_agent" "$http_x_forwarded_for"';
　　#默认主机
　　server{
        listen 80;
        server_name localhost;
        location /{
                root html;
                index index.html;
         }
        #访问日志，名字问nginx/logs/mysite.access.log,格式为main格式
        access_log  logs/mysite.access.log  main;
        #错误日志，记录级别为error
        error_log logs/mysite.error.log error;
      }
}

　　当我们输入虚拟机IP会访问到默认主机，这时在nginx/logs目录下自动生成访问日志mysite.access.log和错误日志mysite.error.log。内容如下：

mysite.access.log内容：

　　访问日志的内容为main格式中定义的信息，某些信息不存在没有显示。我们也可以自定义访问日志的格式。

mysite.error.log内容：

　　可以看到错误原因是favicon.ico文件找不到，我们也可以知道错误发生的时间，请求，客户端和服务端IP等信息。

2.日志切片

　　上边我们已经知道怎么去设置访问日志和错误日志，但是这样设置有一个弊端：日志文件都放在同一个文件中，长时间运行后日志文件很大，可能达到几个G，甚至十几个G大小，查看起来很不方便。为了解决这个问题就需要进行日志切片，如每小时或者每天的日志放在一个单独的文件中。怎么实现呢？总体思路是:设置一个定时任务，每隔一段时间将日志文件剪切到一个特定的目录下。

　　这里以访问日志切片为例，为了方便演示这里把每分钟的访问日志放在一个单独的文件中，首先，添加一个存放日志文件的目录，执行命令 mkdir /usr/local/nginx/logs/mysitelogs ，我们打算把mysite的所有访问日志都放在这个文件夹下。然后添加一个切割日志的脚本，执行命令 vim /usr/local/nginx/mysitelog.sh ，脚本内容如下：

#mysite.com虚拟主机的日志存放路径
LOGPATH=/usr/local/nginx/logs/mysite.access.log
#日志备份文件目录,mysite虚拟主机的备份日志放在logs下的单独目录下
BASEPATH=/usr/local/nginx/logs/mysitelogs
#一分钟记录一次 
bak=$BASEPATH/$(date -d today +%Y%m%d%H%M).mysite.access.log
#重名日志文件
mv $LOGPATH $bak
touch $LOGPATH
#向nginx主进程发送信号，重新写日志
/usr/local/nginx/sbin/nginx -s reopen

最后添加一个定时任务，执行命令 crontab -e ，编辑内容如下，表示每分钟执行一次mysitelog.sh脚本：

* * * * * sh /usr/local/nginx/mysitelog.sh

到这里日志切片就结束了，我们看一个日志文件， cd /usr/local/nginx/logs/mysitelogs 到日志文件夹下，看到日志文件为每分钟存储一次，前缀格式为yyyyMMddhhmm：

补充：我们在实际使用时一般把一天的日志放在一个文件中(高并发量的除外)，下边的脚本实现每天晚上11：30分存储一次日志文件：

#-------------------shell脚本   
#该虚拟主机的日志存放路径
LOGPATH=/usr/local/nginx/logs/mysite.access.log
#日志备份文件目录,mysite虚拟主机的备份日志放在logs下的单独目录下
BASEPATH=/usr/local/nginx/logs/mysitelogs
#一天记录一次,格式为20190326mysite.access.log
bak=$BASEPATH/$(date -d yesterday +%Y%m%d)mysite.access.log
#重名日志文件
echo $bak
mv $LOGPATH $bak
touch $LOGPATH
#向nginx主进程发送信号，重新打开日志
/usr/local/nginx/sbin/nginx -s reopen

#------------------定时任务
30 23 * * * sh /usr/local/nginx/mysitelog.sh

View Code

2.常用Nginx配置总结

　　Nginx的介绍到这里就基本结束了，这里汇总了一些Nginx中最常用的配置

2.1 基本配置

# 用户和用户组
user wyy wyy

#工作进程个数，通常设置和逻辑cpu个数一致
worker_processes  8;
#cpu亲和性，每个进程分配一个cpu  00000001表示第一个cpu,00000010表示第二个cpu,依次类推
worker_cpu_affinity 00000001 00000010 00000100 00001000 00010000 00100000 01000000 10000000;
#如果是两个逻辑cpu，可以设置worker_processes  2; worker_cpu_affinity 01 10;

#一个nginx工作进程最多可以打开的文件描述符个数 ，最好和linux最多能打开的文件描述符个数（查看命令：ulimit-n）保持一致。
#出现报错：too open many file，这时我们把worker_rlimit_nofile 值设置大一些就可以了。
worker_rlimit_nofile 65535


#记录的级别严重程度：debug<info<notice<warn<error<crit],一般记录warn/error级别
#错误日志，级别为error
error_log  logs/error.log  error;

#记录nginx的master进程的pid
pid        logs/nginx.pid;

 
events {
    use epoll ;               #多路复用IO的一种方式，效率很高，支持linux2.6以上内核
    worker_connections  1024; #每个工作进程的最大连接数，一台nginx的理论最大连接数就是（单个工作进程的最大连接数*工作进程个数）
    multi_accept on;          #尽可能多地接受请求
}


http {
    #媒体类型，定义在nginx/conf/mine.types中
    include       mime.types;
    #默认的媒体类型
    default_type  application/octet-stream;
    #main日志格式
    log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '
                      '$status $body_bytes_sent "$http_referer" '
                      '"$http_user_agent" "$http_x_forwarded_for"';
　　#访问日志
    access_log  logs/access.log  main;
　　#nginx是否调用sendfile函数（zero,copy等）来输出文件，普通应用都应该设置成on
    sendfile        on;
　　#默认开启，nginx接受到数据包不马上发送，等到数据包达到一定大小再发送，使用Nagle算法控制。减少tcp传输次数，防止网络阻塞
    tcp_nopush      on;
　　#tcp不延迟，和tcp_nopush相反，接收到数据包就发送，提高数据的实时响应
　　#tcp_nodelay off;
    #长连接，请求资源获取完毕后不断开连接，60s后关闭该连接
    keepalive_timeout  60;
　
  　#上传时单个文件最大为10M
　　client_max_body_size 10m;
　　#客户端的请求头缓冲区大小，一般设置为系统分页大小即可（查询系统分页命令:getconf PAGESIZE）
　　#client_header_buffer_size 4k;
　　#客户端的请求体缓冲区大小,超过这个大小存放在临时文件中，
　　#client_body_buffer_size 8k;

　　######超时管理 代理服务器时才有用 （超时都返回502超时错误）
　　#nginx连接后台服务器超时时间，
　　proxy_connect_timeout 90;
　　#后台服务器回传数据超时时间,90s传输数据未完成就报错
　　proxy_send_timeout 90;
　　#连接成功，等待后台服务器响应的超时时间
　　proxy_read_timeout 90;

　　#为打开文件设定缓存，默认是不启用的，max指定缓存数量，建议和最多能打开文件描述符个数（查询命令：ulimit -n）一致，inactive是指经过多长时间文件没被请求后删除缓存
　　open_file_cache max=65535 inactive=60s;
　　#多久检查一次缓存的有效信息
　　open_file_cache_valid 30s;
　　
　　#定义负载均衡模块，
　　upstream mysiteServers{
   　　 server 123.11.1.2:8080 weight=1 max_fails=2 fail_timeout=30s;
   　　 server 123.11.1.3:8080 weight=2 max_fails=2 fail_timeout=30s;
   　　 server 123.11.1.4:8080 weight=3 max_fails=2 fail_timeout=30s;
　　}

　　server{
     　　servername :www.site1.com  www.site1.cn;
    #首页　
　　location = / {
    　　proxy_pass http:/123.11.1.1:8080/Home/Index;
　　　　}

　　#静态文件
　　location ~* .(gif|jpg|jpeg|png|css|js|ico)$ {
    　　root /webroot/res/;
　　　　#缓存十分钟
　　　　expires:600;
　　　　}
　　#通用规则，用来转发动态请求到后端应用服务器
　　location / {
    　　proxy_pass http://mysiteServers;
　　　　}
 }

2.2 压缩配置

　　gzip可以放在http/server/location/if下,用于压缩请求资源，减小网络传输的数据尺寸。gzip压缩常用于文本类型(css/js等)文件压缩，二进制文件(如图片，视频)压缩比不大，建议使用缓存(expires)进行优化:

#开启gzip压缩
gzip  on;
#最小压缩大小4000字节，小于4000字节就不压缩了
gzip_min_length 4000;
#压缩的缓冲设置，缓冲32块开始输出，每块4k大小
#gzip_buffers 32 4k;
#压缩采用的版本
gzip_http_version 1.1;
#压缩级别，级别越大压缩后尺寸越小方便传输，但同时压缩时耗费cpu资源也越大（最大为9，一般不要超过6）
gizp_comp_level 4;
#压缩的文件类型，不属于这些类型的就不压缩（可以通过 cat nginx/conf/mine.types查看文件类型），注：二进制文件如图片/视频的压缩比不大，不建议压缩
gzip_types  application/javascript  text/plain  text/css text/xml;   
# 是否传输gzip压缩标志，请求头中有vary标志的返回压缩版本文件，没有vary头的返回原始文件
gzip_vary on;

2.3 负载均衡配置

#1.weight
#指定轮询权重，weight越大，转发几率越大，一般用于后端服务器性能不均的情况。
　　upstream mysiteServers{
　　　　server 192.168.70.1:8080 weight=1;
　　　　server 192.168.70.2:8080 weight=3;
　　}
#2.ip_hash
#每个请求按访问ip的hash结果分配，这样每个访客固定访问一个后端服务器，适用后台服务器缓存多的场合，也可以解决session的问题。
　　upstream mysiteServers{
　　　　ip_hash;
　　　　server 192.168.70.1:8080;
　　　　server 192.168.70.2:8080;
　　}
        
#一些参数
　　upstream mysiteServers{
　　　　server 192.168.70.1:8080 down;
　　　　server 192.168.70.1:8081 weight=2;
　　　　server 192.168.70.2:8080;
　　　　server 192.168.70.2:8081 backup;
　　}
#1.down表示的server暂时不参与负载均衡,请求不会转发给这台服务器;
#2.weight为weight越大，负载的权重就越大；
#3.max_fails续请求失败的次数默认为1.当超过最大次数时，不再转发请求给这台服务器；
#4.fail_timeout:max_fails次失败后，暂停多久后再向这台服务器转发请求；
#5.backup： 其它所有的非backup机器down或者忙的时候，请求backup机器。所以这台机器压力会最轻。


补充:也可以使用第三方模块实现其他负载均衡模式:
    ①添加nginx-upstream-fair模块可以实现按响应性能进行负载均衡，响应速度越快的服务器分发请求的几率越大；
    ②添加nginx_upstream_hash模块可以实现按请求url来进行转发请求，url相同的请求由同一个服务器处理，适用于缓存较多场景。

补充：Nginx的一些全局变量

变量	含义
$args	请求中的参数，同$query_string
$content length	请求头中的Content-length字段。
$content_type	请求头中的Content-Type字段。
$document_root	当前请求在root指令中指定的值。
$host	请求主机头字段，否则为服务器名称。
$http_user_agent	用户代理，一般为用户浏览器信息
$http_cookie	客户端cookie信息
$limit_rate	这个变量可以限制连接速率。
$request_method	客户端请求的动作，通常为GET或POST。
$remote_addr	客户端的IP地址。
$remote_port	客户端的端口。
$remote_user	已经经过Auth Basic Module验证的用户名。
$request_filename	当前请求的文件路径，由root或alias指令与URI请求生成。
$scheme	协议名（如http，https）。
$server_protocol	请求使用的协议，通常是HTTP/1.0或HTTP/1.1。
$server_addr	服务器地址，在完成一次系统调用后可以确定这个值。
$server_name	服务器名称。
$server_port	请求到达服务器的端口号。
$request_uri	包含请求参数的原始URI，不包含主机名，如”/user/getuser?id=100”。
$uri	不带请求参数的当前URI，$uri不包含主机名，如”/user/getuser”。
$document_uri	与$uri相同
$http_x_forwarded_for	代理过程的IP

相关阅读:
二分查找
 合并两个或多个有序链表
 前缀和
 田忌赛马
 小根堆实现
 汉化破解：ASPack 2.12 > Alexey Solodovnikov Dump
EXT是一款强大的AJAX框架
 var TempViewPanel = Ext
【Azure 事件中心】如何查看事件中心的消息中具体报文内容呢？
【Azure Developer】Azure Logic App 示例: 解析 Request Body 的 JSON 的表达式? triggerBody()?
原文地址：https://www.cnblogs.com/wyy1234/p/10692441.html