使用Log日志计算带宽流量峰值

使用Log日志计算带宽流量峰值
awk 19

一般来说流量带宽是通过snmp协议取网卡流量画图。不过有的时候，为了优化分析或者排错，也会直接去计算服务的访问流量。方法很简单，根据日志中记录的请求时间（squid记录的是请求响应完成时间，如果要精确，可以再减去响应时间，不过一般squid的文件不至于5分钟内还传不完的……），按每5分钟一汇总其字节数，然后均摊到300秒上。

计算全日志中最高带宽的命令行如下：
```
cat $ACCESS_LOG|awk -F'[: ]' '{a[$5":"$6]+=$14}END{for(i in a){print i,a[i]}}'|sort|awk '{a+=$2;if(NR%5==0){if(a>b){b=a;c=$1};a=0}}END{print c,b*8/300/1024/1024}'
```
（日志为标准apache日志格式）而把最后的awk改成’{a+=$2;if(NR%5==0){print $1,a*8/300/1024/1024;a=0}}’，就可以输出每5分钟时的流量值，然后用GD库画图~~（有时间看看perl的GD:Graph 模块，应该不难）

案例:使用awk与sort -nr分析访问日志,找出每种请求返回状态码的请求个数:

访问日志的文件格式:

113.31.27.213 www.5iops.com – [15/Apr/2012:04:06:17 +0800] “GET /faq/ HTTP/1.0″ 200 2795 “-” “Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.2 Safari/535.11″ 118.119.120.248, 222.215.136.44 0.003 192.168.0.25:80 200 3.31

我们最常用的处理方式为:cat /home/logs/nginx/www.5iops.com.access.log|awk ‘{print $(NF-1)}’|sort -nr |uniq -c ,但其实,这个处理的效率较低:

time cat /home/logs/nginx/www.5iops.com.access.log|awk ‘{print $(NF-1)}’|sort -nr |uniq -c

1 200″

3 “404”

4 “304”

7377 “200”

48 “-”

real 0m0.107s

user 0m0.102s

sys 0m0.013s

time cat /home/logs/nginx/www.5iops.com.access.log|awk ‘{a[$(NF-1)]++} END{for (i in a) print i ” ” a[i]}’

“304” 4

“404” 3

“200” 7399

“-” 49

200″ 1

real 0m0.018s

user 0m0.013s

sys 0m0.008s

可见使用后面的awk处理效率高10倍~

另一个案例,用一行shell 命令处理以下文本分析任务：

有一个文本文件，内容为每行为每隔5分钟记录的带宽峰值，共一个月（共8640行），我需要计算出，每天的峰值并排序：

traffic文件格式:

-bash-4.1$ cat traffic.txt|more

2012-04-01 00:00 1952.34mbps

2012-04-01 00:05 2198.34 mbps

2012-04-01 00:10 2117.07 mbps

2012-04-01 00:15 2104.83 mbps

2012-04-01 00:20 1878.73 mbps

…

一种常见解决方法:

-bash-4.1$ for i in cat traffic.txt|awk '{print $1}'|sort|uniq ; do cat traffic.txt|grep $i|sort -nr -k3 |head -1 ; done

2012-04-01 21:35 3876.02 mbps

2012-04-02 21:15 3577.66 mbps

2012-04-03 21:35 3371.59 mbps

2012-04-04 21:10 3087.17 mbps

2012-04-05 21:35 3202.44 mbps

2012-04-06 20:45 3703.53 mbps

2012-04-07 20:40 4177.43 mbps

2012-04-08 14:25 3837.9 mbps

2012-04-09 20:50 3082.46 mbps

…

更高效的解决方法:

-bash-4.1$ cat traffic.txt |awk ‘{if($3 > a[$1])a[$1]=$3} END{for(i in a)print i ” ” a[i]}’

2012-04-28 5369.81

2012-04-19 3474.73

2012-04-29 4824.24

2012-04-10 2979.91

2012-04-01 3876.02

2012-04-20 3866.19

2012-04-11 3548.73

2012-04-02 3577.66

2012-04-30 4077.35

…

经对比,后面一种方法处理执行效率仍然高10倍.可见活用awk对文本或日志分析处理效率明显提高.
- 本文来自：Linux教程网
相关阅读:
【数据结构】Trie树
 【算法】动态规划经典题之最长公共子序列
 【Leetcode】583. Delete Operation for Two Strings
【Java】SpringBoot入门学习及基本使用
 【Java学习】调用ByteBuffer.getInt()方法得到808464432
Install rapyuta Robot Cloud Engine on Ubuntu14.04
Install rapyuta Robot Cloud Engine on Ubuntu12.04
怎样下载youtube的字幕
 国内老版本ubuntu更新源地址以及sources.list的配置方法
 配置 ROS 的 apt 源
原文地址：https://www.cnblogs.com/www886/p/4350645.html

使用Log日志 计算带宽流量峰值

使用Log日志计算带宽流量峰值