• cut sort uniq wc 一 文本处理工具


    cut

    cut是一个选取命令,就是将一段数据经过分析,取出我们想要的。
    一般来说,选取信息通常是针对“行”来进行分析的,并不是整篇信息分析的。
    
    
    -c :
    	以字符为单位进行分割。
    
    	cut -c1-3 test.txt:打印第1个到第3个字符
    	cut -c5- test.txt:打印从第5个字符开始到结尾
    
    -d :
    	自定义分隔符,默认为制表符。
    
    	cut -d';' -f 1
    
    -f :
    	用-d将文本分隔成一段一段后,-f用来取出第几段
    
    	cut -f1 test.txt:取出一行分割后的第一个
    
    	cut -f2,3 test.txt:取出一行分割后的第2到3个
    

    sort

    sort将文件的每一行作为一个单位,相互比较。
    比较原则是从首字符向后,依次按ASCII码值进行比较,最后将他们按升序输出。
    
    -u : 
    	它的作用很简单,就是在输出行中去除重复行。
    
    -r : 
    	sort默认的排序方式是升序,如果想改成降序,就加个-r就搞定了。
    
    -n : 
    	以数值来进行排序。
    
    -f : 
    	忽略大小写
    
    
    cat ld | sort -n
    

    uniq

    uniq命令可以在排序后处理重复的行。
    
    常用选项:
    
    -i
    	忽略大小写
    
    -c
    	在行的开头输出该行出现的次数
    
    -d
    	只输出重复的行
    
    -u
    	只输出出现过一次的行
    
    
    sort -n ld | uniq -c
    

    wc

    wc统计文件里面有多少单词,多少行,多少字符。
    
    -l
    	仅列出行;
    
    -w
    	仅列出多少字(英文单字);
    
    -m
    	多少字符;
    
  • 相关阅读:
    小技巧
    常用的交互设计软件
    Android studio 使用SVN需要忽略的文件
    android studio 使用SVN 锁定文件,防止别人修改(基于Android studio 1.4 )
    git 和 github 关系?
    Double 数据保留两位小数一:五舍六入
    设计模式
    Java中关于日期类那些方法
    ios 开源免费接口
    华为招聘机试整理5:简单四则运算
  • 原文地址:https://www.cnblogs.com/loveer/p/11621718.html
Copyright © 2020-2023  润新知