leetcode-192 Word Frequency(统计单词频率)

leetcode-192 Word Frequency(统计单词频率)

cat words.txt | tr -s " " " "| sort | uniq -c | sort -r | awk '{print $2, $1}'

tr -s " " " " : 是将空格替换为换行符，即文件中的单词每一行一个单词

sort 对单词进行排序

uniq -c 统计相同的单词个数单词数目单词

sort -r 正序排序

awk '{print $2,$1}' 按照格式化输出，即最后先输出单词单词数目

如果要求严格一点，我们还应该去掉文章中的标点符号后再进行统计：统计频率最高的前5个单词

cat word.txt| sed 's/[,.?!;]/ /g' | tr -s " " " "|sort|uniq -c | sort -r | awk '{print $2,$1}'| head -n 5
相关阅读:
eclipse中SVN分支合并到主干
 Nginx+Php-fpm+MySQL+Redis源代码编译安装指南
 php-fpm的重启/关闭
 修改PHP上传文件大小限制的方法
 【转】Android AlertDialog自定义布局
 unity 多线程
 今天无意中发现的WWW.threadPriority
Socket.IO for Unity 简要介绍
 shader一般都是用工具调试的
 METAL渲染是什么？
原文地址：https://www.cnblogs.com/leavescy/p/11240497.html