使用shell统计出出现次数排名top10的网址(在博客园中没找到，特转一下）

使用shell统计出出现次数排名top10的网址(在博客园中没找到，特转一下）
转自：http://blog.csdn.net/guaguastd/article/details/8332757

使用shell统计出出现次数排名top10的网址

分类： Shell脚本2012-12-19 17:17 286人阅读评论(0) 收藏举报

统计排名
[plain] view plain copy

#!/bin/sh





foo()

{

    if [ $# -ne 1 ];

    then

        echo "Usage:$0 filename";

        exit -1

    fi





egrep -o "http://[a-zA-Z0-9.]+.[a-zA-Z]{2,3}" website | awk '{ count[$0]++ } END { printf("%-30s %s ","wensite","count"); for(ind in count) { printf("%-30s %d ",ind,count[ind]); } }' | sort -nrk 2 | head -n 10 >websorted2.txt;





}





foo website

例子：

文件website中的内容：

http://www.google.com
http://www.baidu.com
http://www.sina.com
http://www.bjtu.edu.cn
http://www.codeproject.com
http://www.csdn.com
http://www.sohu.com
http://www.yahoo.com
http://mail.163.com
http://www.bjtu.edu.cn
http://www.codeproject.com
http://www.csdn.com
http://www.sohu.com
http://www.yahoo.com
http://mail.163.com
http://www.codeproject.com
http://www.csdn.com
http://www.sohu.com
http://www.yahoo.com
http://mail.163.com
http://www.qq.com
http://www.hao123.com
http://www.163.com
http://youku.com
http://taobao/com
http://www.bjtu.edu.cn
http://www.codeproject.com
http://www.csdn.com
http://www.sohu.com
http://www.yahoo.com
http://mail.163.com
http://www.codeproject.com
http://www.csdn.com
http://www.sohu.com
http://www.yahoo.com
http://mail.163.com
http://www.qq.com
http://www.hao123.com
http://www.163.com
http://youku.com
http://taobao/com

生成的文件内容为（即结果）

http://www.yahoo.com 5
http://www.sohu.com 5
http://www.csdn.com 5
http://www.codeproject.com 5
http://mail.163.com 5
http://www.bjtu.edu.cn 3
http://youku.com 2
http://www.qq.com 2
http://www.hao123.com 2
http://www.163.com 2
相关阅读:
arrayAppend.php
C语言中一个语句太长用什么换行?
date
Mysql复制一条或多条记录并插入表|mysql从某表复制一条记录到另一张表
 Unable to load bean org.apache.struts2.dispatcher.multipart.MultiPartRequest
javascript:location=location;">刷新</a>
TestAbstract
scanner=new Scanner(System.in); int i=scanner.nextInt();
public static void Swap2
JIRA 模块 bug管理工具
原文地址：https://www.cnblogs.com/yidaxia/p/4459682.html