• shell 去除数字中的字母


    Linux shell tr 命令详解

    该随笔摘自 https://www.jb51.net/article/103892.htm

    Linux shell tr 命令详解

    1. 用途

    tr,translate的简写,主要用于压缩重复字符,删除文件中的控制字符以及进行字符转换操作。

    2. 语法

    tr [OPTION]... SET1 [SET2]

    -s 替换重复的字符

      -s: squeeze-repeats,用SET1指定的字符来替换对应的重复字符 (replace each input sequence of  a  repeated  character  that  is listed in SET1 with a single occurrence of that character)

    -d 删除字符

      -d:delete,删除SET1中指定的所有字符,不转换(delete characters in SET1, do not translate)

    -t 字符替换

      -t:truncate,将SET1中字符用SET2对应位置的字符进行替换,一般缺省为-t

    -c 字符补集替换

      -c:complement,用SET2替换SET1中没有包含的字符

    3. 实例

    a) -s 参数

    [root@localhost ~]# echo "aaabbbaacccfddd" | tr -s [abcdf]
    abacfd

    可以使用这一特点,删除文件中的空白行,实质上跟上面一样,都是用SET1指定的字符来替换对应的重复字符

    复制代码
    [root@localhost ~]# cat b.txt
    I like football
    Football is very fun!
    
    Hello
    
    [root@localhost ~]# cat b.txt | tr -s ["
    "]
    I like football
    Football is very fun!
    Hello
    复制代码

    b) -d 参数

    [root@localhost ~]# echo "a12HJ13fdaADff" | tr -d "[a-z][A-Z]"
    1213
    [root@localhost ~]# echo "a1213fdasf" | tr -d [adfs]
    1213

    c) -t 参数

    [root@localhost ~]# echo "a1213fdasf" | tr -t [afd] [AFO]
    A1213FOAsF

    上述代码将a转换为A,f转换为F,d转换为O。

    可以利用这一特点,实现大小字母的转换

    [root@localhost ~]# echo "Hello World I Love You" |tr -t [a-z] [A-Z]
    HELLO WORLD I LOVE YOU
    [root@localhost ~]# echo "HELLO WORLD I LOVE YOU" |tr -t [A-Z] [a-z]
    hello world i love you

    也可以利用字符集合进行转换

    [root@localhost ~]# echo "Hello World I Love You" |tr -t [:lower:] [:upper:]
    HELLO WORLD I LOVE YOU
    [root@localhost ~]# 
    [root@localhost ~]# echo "HELLO WORLD I LOVE YOU" |tr -t [:upper:] [:lower:]
    hello world i love you

    备注:

    字符集合如下

    复制代码
    NNN 八进制值的字符 NNN (1 to 3 为八进制值的字符)
    \ 反斜杠
    a Ctrl-G 铃声
     Ctrl-H 退格符
    f Ctrl-L 走行换页
    
     Ctrl-J 新行
    
     Ctrl-M 回车
    	 Ctrl-I tab键
    v Ctrl-X 水平制表符
    CHAR1-CHAR2 从CHAR1 到 CHAR2的所有字符按照ASCII字符的顺序
    [CHAR*] in SET2, copies of CHAR until length of SET1
    [CHAR*REPEAT] REPEAT copies of CHAR, REPEAT octal if starting with 0
    [:alnum:] 所有的字母和数字
    [:alpha:] 所有字母
    [:blank:] 水平制表符,空白等
    [:cntrl:] 所有控制字符
    [:digit:] 所有的数字
    [:graph:] 所有可打印字符,不包括空格
    [:lower:] 所有的小写字符
    [:print:] 所有可打印字符,包括空格
    [:punct:] 所有的标点字符
    [:space:] 所有的横向或纵向的空白
    [:upper:] 所有大写字母
    复制代码

    d) -c 参数

    复制代码
    [root@localhost ~]# cat a.txt
    Monday   09:00
    Tuesday  09:10
    Wednesday 10:11
    Thursday  11:30
    Friday   08:00
    Saturday  07:40
    Sunday   10:00
    [root@localhost ~]# cat a.txt | tr -c "[a-z][A-Z]" "#" | tr -s "#" | tr -t "#" "
    "
    Monday
    Tuesday
    Wednesday
    Thursday
    Friday
    Saturday
    Sunday
    复制代码

    上面代码中 tr -c "[a-z][A-Z]" "#" 表示将除大小字母以外的所有的字符都替换为#。

    上面代码可优化为:

    复制代码
    [root@localhost ~]# cat a.txt | tr -cs "[a-z][A-Z]" "
    "
    Monday
    Tuesday
    Wednesday
    Thursday
    Friday
    Saturday
    Sunday
    复制代码
    改行去放羊
  • 相关阅读:
    Annual Summary-2019
    (翻译向)kafka--简介篇1
    mysql 查看数据库大小
    nohup保证程序后台运行
    NLP(四):文本向量化word2vec
    NLP(三):关键词提取
    NLP(二):jieba高频词提取
    NLP(一):jieba分词
    爬虫(一)百度翻译
    【论文笔记】社交网络中的信息扩散分析及其应用研究
  • 原文地址:https://www.cnblogs.com/musen/p/14751336.html
Copyright © 2020-2023  润新知