• Nginx access.log 日志统计分析常用命令


    Nginx access.log 日志统计分析常用命令

    我的 nginx 日志格式

        log_format  access  '$remote_addr - $remote_user [$time_local] "$request" '
                          '$status $body_bytes_sent "$http_referer" '
                          '"$http_user_agent" "$http_x_forwarded_for"';
    

    IP相关统计

    统计IP访问量

    awk '{print $1}' access.log | sort -n | uniq | wc -l
    

    查看某一时间段的IP访问量(4-5点)

    grep "07/Apr/2017:0[4-5]" access.log | awk '{print $1}' | sort | uniq -c| sort -nr | wc -l   
    

    查看访问最频繁的前100个IP

    awk '{print $1}' access.log | sort -n |uniq -c | sort -rn | head -n 100
    

    查看访问100次以上的IP

    awk '{print $1}' access.log | sort -n |uniq -c |awk '{if($1 >100) print $0}'|sort -rn
    

    查询某个IP的详细访问情况,按访问频率排序

    grep '104.217.108.66' access.log |awk '{print $7}'|sort |uniq -c |sort -rn |head -n 100   
    

    页面访问统计

    查看访问最频的页面(TOP100)

    awk '{print $7}' access.log | sort |uniq -c | sort -rn | head -n 100
    

    查看访问最频的页面(排除php页面(TOP100)

    grep -v ".php"  access.log | awk '{print $7}' | sort |uniq -c | sort -rn | head -n 100          
    

    查看页面访问次数超过100次的页面

    cat access.log | cut -d ' ' -f 7 | sort |uniq -c | awk '{if ($1 > 100) print $0}' | less
    

    查看最近1000条记录,访问量最高的页面

    tail -1000 access.log |awk '{print $7}'|sort|uniq -c|sort -nr|less
    

    每秒请求量统计

    统计每秒的请求数,top100的时间点(精确到秒)

    awk '{print $4}' access.log |cut -c 14-21|sort|uniq -c|sort -nr|head -n 100
    

    每分钟请求量统计

    统计每分钟的请求数,top100的时间点(精确到分钟)

    awk '{print $4}' access.log |cut -c 14-18|sort|uniq -c|sort -nr|head -n 100
    

    每小时请求量统计

    统计每小时的请求数,top100的时间点(精确到小时)

    awk '{print $4}' access.log |cut -c 14-15|sort|uniq -c|sort -nr|head -n 100
    

    性能分析

    在nginx log中最后一个字段加入$request_time

    列出传输时间超过 3 秒的页面,显示前20条

    cat access.log|awk '($NF > 3){print $7}'|sort -n|uniq -c|sort -nr|head -20
    

    列出php页面请求时间超过3秒的页面,并统计其出现的次数,显示前100条

    cat access.log|awk '($NF > 1 &&  $7~/.php/){print $7}'|sort -n|uniq -c|sort -nr|head -100
    

    蜘蛛抓取统计

    统计蜘蛛抓取次数

    grep 'Baiduspider' access.log |wc -l
    

    统计蜘蛛抓取404的次数

    grep 'Baiduspider' access.log |grep '404' | wc -l
    

    TCP连接统计

    查看当前TCP连接数

    netstat -tan | grep "ESTABLISHED" | grep ":80" | wc -l
    

    用tcpdump嗅探80端口的访问看看谁最高

    tcpdump -i eth0 -tnn dst port 80 -c 1000 | awk -F"." '{print $1"."$2"."$
    
  • 相关阅读:
    爬取校园新闻首页的新闻的详情,使用正则表达式,函数抽离
    网络爬虫基础练习
    Hadoop综合大作业
    hive基本操作与应用
    用mapreduce 处理气象数据集
    熟悉常用的HBase操作
    爬虫大作业
    熟悉常用的HDFS操作
    数据结构化与保存
    获取全部校园新闻
  • 原文地址:https://www.cnblogs.com/carry00/p/13763415.html
Copyright © 2020-2023  润新知