1.编码转换
iconv -futf8 -tgbk filename
-c 从输出中忽略无效字符
-o 输出文件
2.wc命令
-l filename 查看文件有多少行
-w filename 查看文件里有多少word
-L filename 常看文件里最长的那一行是多少字
利用管道只显示行数不显示文件名: cat filename | wc -l
3.sort命令
-n 按数值排序
-r 降序
-k 指定按第几列排序
-t 指定间隔符号
-u 去除重复行
-f 忽略大小写
4.cut命令
-d 后接分割字符,用双引号括起来
-c 后接第几个字符
-f 后接第几个区块
5.uniq命令
-c 在行首加上本行出现的次数
-d 显示重复行
-u 显示不重复行
-f n 忽略前n个字段
-s n 忽略前n个字符