统计nginx日访问数累积和
长话短说,今天有点头疼,眼痛。。。昨晚比较晚睡。。。
调试了大半天的脚本,算是弄好了。
这个需求源于早几天,有个运营同事叫我统计上年8月到今年6月的累积访问量,那会算的有点尴尬呢,因为只有这种统计文件,一个月统计数写到一个文件上,前运维写的。当时只能打开每个月的统计文件,列标记出每天数量,然后弄到excel里,函数sum统计结果。。。很费时间。于是一气之下,给自己安排了这个需求。其实,这个运营同事不是第一次问我拿这样的访问量数据了,中心有个人也是问我拿过。
先看看最终成果图:
这个累计访问数,从每年1月份开始算起,统计直到年底。
最终调试脚本
(这个是假设已经统计完4月份累积和,到开始统计5月份的)
1 #/bin/bash 2 ## 统计xxx网,累积用户访问数 3 4 y='2021' 5
6 m=`seq -f "%02g" 5 5` 7 d='1' 8 ym='202105' 9 10 sum01=${gd_path}/${ym}/sum/gd_count_sum.txt 11 sum=`tail -n 1 ${gd_path}/gdsum | awk -F ':' '{print $2}'` 12 13 14 >${sum01} 15 cat gd_count.txt | while read line 16 do 17 day=`seq -f "%02g" $d $d` 18 gd_cnt=`echo $line | awk -F':' '{print $2}'` 19 sum=`expr $sum + $gd_cnt` 20 21 echo "xxx网 ${y}年${m}月${day}日 用户累计访问数为:${sum}" >> ${sum01} 22 sed -i '/'"${y}"'年'"${m}"'月'"${day}"'日/s/$/ 用户累计访问数为:'"${sum}"'/' gd_count.txt 23 24 d=`expr $d + 1` 25 done 26 27 lastsum=`tail -n 1 gd_count.txt | awk -F ':' '{print $3}'` 28 sleep 2 29 30 echo "xxxx网 ${y}年${m}月,用户累计访问数为:$lastsum" >> ${gd_path}/gdsum
脚本不长,但坑比较多
1、 sum01变量说明
这个变量,对应文件:gd_count_sum.txt,是用来单独保存月累积数的,不跟日访问量的文件写一起,非必要~~可以去掉
2、sum变量说明,
用来读gdsum文件最后一列,到上月底统计出的访问量总和。gdsum文件内容如下:
需要预先写入第一行内容,作为基准数据,因为前面说了,每统计一份总数,作为月前第一天的访问初始数。
xxx网 2021年00月,用户累计访问数为:0
一开始的时候,这个gdsum只记录一个最近统计的数,而不是每月得出一个累积访问数的。改良成这样是为了好追查某些时段的访问数,例如我需要2~4月的用户统计数,用4月的累计访问数减去1月的,就能得出了,或者要2到4月某一天的访问数,这样也相对容易统计。
3、m的赋值说明
m=`seq -f "%02g" 5 5`
用来限定输出格式宽度的(下面的day变量也是),不然“03月”这种是打印不出来的,会打印“3月”。另外不要写少一个“5”,不然会给你打印出01~05,我这里只需要05就行。
4、gd_count文件说明
就是这个原始文件,我需要一行一行读,拿到当天用户访问数,然后进行相加
5、sed匹配变量并追加行尾内容
sed -i '/'"${y}"'年'"${m}"'月'"${day}"'日/s/$/ 用户累计访问数为:'"${sum}"'/' gd_count.txt
sed如果要匹配变量的话,要写成 '"${y}"' ——》 单引号+双引号括住
$:表示行尾的意思,为了行尾追加内容