cut sort uniq wc 一文本处理工具

cut

cut是一个选取命令，就是将一段数据经过分析，取出我们想要的。
一般来说，选取信息通常是针对“行”来进行分析的，并不是整篇信息分析的。


-c ：
	以字符为单位进行分割。

	cut -c1-3 test.txt：打印第1个到第3个字符
	cut -c5- test.txt：打印从第5个字符开始到结尾

-d ：
	自定义分隔符，默认为制表符。

	cut -d';' -f 1

-f ：
	用-d将文本分隔成一段一段后，-f用来取出第几段

	cut -f1 test.txt：取出一行分割后的第一个

	cut -f2,3 test.txt：取出一行分割后的第2到3个

sort

sort将文件的每一行作为一个单位，相互比较。
比较原则是从首字符向后，依次按ASCII码值进行比较，最后将他们按升序输出。

-u : 
	它的作用很简单，就是在输出行中去除重复行。

-r : 
	sort默认的排序方式是升序，如果想改成降序，就加个-r就搞定了。

-n : 
	以数值来进行排序。

-f : 
	忽略大小写


cat ld | sort -n

uniq

uniq命令可以在排序后处理重复的行。

常用选项：

-i
	忽略大小写

-c
	在行的开头输出该行出现的次数

-d
	只输出重复的行

-u
	只输出出现过一次的行


sort -n ld | uniq -c

wc

wc统计文件里面有多少单词，多少行，多少字符。

-l
	仅列出行；

-w
	仅列出多少字(英文单字)；

-m
	多少字符；

相关阅读:
ABAP ole方式对EXCEL进行操作
 ABAP 通过视图取数到内表函数
 ABAP 数值类型转换
 ABAP 供应商、工厂对应公里数维护
 deb包转换为rpm包格式
 Linux统计即时网速
 RedHat可用的几处软件源
 linux 技巧：使用 screen 管理你的远程会话
 国内常用Linux镜像站点
 telnet访问出现telnet:Unable to connect to remote host: No route to host
原文地址：https://www.cnblogs.com/loveer/p/11621718.html

Copyright © 2020-2023 润新知