1将access_log.txt导入HDFS
2.利用Hadoop Stream 处理access_log.txt,只取记录第一列即IP地址,保存到文件access_ip.txt之中
3. 进入Pig,加载文件access_ip.txt
4. 将记录按照IP分组
5. 计算每个IP访问次数
按照访问次数降序排列
保存结果
6.显示结果
其余结果省略