• nginx高性能WEB服务器系列之八--nginx日志分析与切割


    nginx系列友情链接:
    nginx高性能WEB服务器系列之一简介及安装
    https://www.cnblogs.com/maxtgood/p/9597596.html
    nginx高性能WEB服务器系列之二命令管理
    https://www.cnblogs.com/maxtgood/p/9597990.html
    nginx高性能WEB服务器系列之三版本升级
    https://www.cnblogs.com/maxtgood/p/9598113.html
    nginx高性能WEB服务器系列之四配置文件详解
    https://www.cnblogs.com/maxtgood/p/9598333.html
    nginx高性能WEB服务器系列之五--实战项目线上nginx多站点配置
    https://www.cnblogs.com/maxtgood/p/9598610.html
    nginx高性能WEB服务器系列之六--nginx负载均衡配置+健康检查
    https://www.cnblogs.com/maxtgood/p/9599068.html
    nginx高性能WEB服务器系列之七--nginx反向代理
    https://www.cnblogs.com/maxtgood/p/9599335.html
    nginx高性能WEB服务器系列之八--nginx日志分析与切割
    https://www.cnblogs.com/maxtgood/p/9599542.html
    nginx高性能WEB服务器系列之九--nginx运维故障日常解决方案
    https://www.cnblogs.com/maxtgood/p/9599752.html

    注:原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 、作者信息和本声明。否则将追究法律责任。

    nginx的强大之处不必要我细说,当初第一次接触nginx的时候就发现了它的强大之处,并且自我觉得非常有必要出一篇记录nginx的各个功能及坑点。

    欢迎大家对nginx感兴趣的朋友们来一起学习与及时提出错误及误点。有问题的可以在评论区@我。

    一:nginx日志分析

    其实在我们日常的运维工作中,只要有线上使用过Nginx服务器的人都知道,nginx正常运行后,我们都会经常密切关注Nginx访问日志的相关情况,发现有异常的日志信息需要进行及时处理。

    那么我将跟大家一起来研究和分析Nginx日志,nginx一般默认日志路径为:/usr/local/nginx/logs/access.log 和error.log文件。如下图:

    Nginx日志的格式一般在nginx.conf里面配置,常见的格式配置如下:

    log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '
                          '$status $body_bytes_sent "$http_referer" '
                          '"$http_user_agent" "$http_x_forwarded_for"';
    access_log  logs/access.log  main;

    格式解释:

    $remote_addr, $http_x_forwarded_for 记录客户端IP地址
    $remote_user 记录客户端用户名称
    $request 记录请求的URL和HTTP协议
    $status 记录请求状态
    $body_bytes_sent 发送给客户端的字节数,不包括响应头的大小; 该变量与Apache模块mod_log_config里的“%B”参数兼容。
    $bytes_sent 发送给客户端的总字节数。
    $connection_requests 当前通过一个连接获得的请求数量。
    $http_referer 记录从哪个页面链接访问过来的
    $http_user_agent 记录客户端浏览器相关信息
    $request_length 请求的长度(包括请求行,请求头和请求正文)。
    $request_time 请求处理时间,单位为秒,精度毫秒; 从读入客户端的第一个字节开始,直到把最后一个字符发送给客户端后进行日志写入为止。

    那么一般Nginx日志分析需求有如下几点:

     

    1) 分析截止目前为止访问量最高的IP排行。

    awk '{print $1}' /usr/local/nginx/logs/access.log|sort |uniq -c |sort -nr |head -20就可以了。

    2)找到当前日志中502或者404错误的页面并统计。

    awk '{print $0}' /usr/local/nginx/logs/access.log|egrep "404|502"|awk '{print $1,$7,$9}'|more

    当然还有很多需求,只要你搞清楚了日志的格式与由来,并且有shell或者python基础的话,相信都不是问题的。

    二:nginx日志切割案例

    Nginx 是一个非常轻量的 Web 服务器,体积小、性能高、速度快等诸多优点。但不足的是也存在缺点,比如在产生的访问日志文件一直就是一个,不会自动地进行切割,如果访问量很大的话,将会导致日志文件容量非常大,不便于管理。当然了,我们也不希望看到这么庞大的一个访问日志文件,那需要手动对这个文件进行切割。那么这里就自然而然用到了shell+crontab 命令了。(当然是用python也是可以的)

    脚本的功能,就是定时切割日志,这里切割的方法我们直接使用mv即可。

    nginx日志切割脚本

    如下:

    #!/bin/bash
    #auto mv nginx log shell
    #by author wugk
    S_LOG=/usr/local/nginx/logs/access.log
    D_LOG=/data/backup/`date +%Y%m%d`
    echo -e "33[32mPlease wait start cut shell scripts...33[1m"
    sleep 2
    if [ ! -d $D_LOG ];then
    
            mkdir -p  $D_LOG
    fi
    
    mv $S_LOG  $D_LOG
    
    kill -USR1 `cat /usr/local/nginx/logs/nginx.pid`
    
    echo "-------------------------------------------"
    echo "The Nginx log Cutting Successfully!"
    echo "You can access backup nginx log $D_LOG/access.log files."

    最后在crontab中添加如下代码即可,每天晚上自动去切割日志:

    0    0  * * *  /bin/sh /data/sh/auto_nginx_log.sh  >>/tmp/nginx_cut.log 2>&1
  • 相关阅读:
    最近几周的总结
    做游戏
    枚举 结构 .....
    抽象类
    面向对象过程
    构造函数 对象关系
    .net 第二周学习
    。net初学
    CSS基本知识点(01)
    C#之ADO.NET基本知识点(01)
  • 原文地址:https://www.cnblogs.com/maxtgood/p/9599542.html
Copyright © 2020-2023  润新知