• shell之文本小工具


    一、文本处理小工具

    1.1 grep小工具

    grep是行过滤工具,用于根据关键字对行进行过滤!

    1)常用选项
    -i: 不区分大小写
    -v: 查找不包含指定内容的行,反向选择
    -w: 按单词搜索
    -o: 打印匹配关键字
    -c: 统计匹配到的行数
    -n: 显示行号
    -r: 逐层遍历目录查找
    -A: 显示匹配行及后面多少行 
    -B: 显示匹配行及前面多少行
    -C: 显示匹配行前后多少行
    -l:只列出匹配的文件名
    -L:列出不匹配的文件名
    -e: 使用正则匹配
    -E:使用扩展正则匹配
    ^key:以关键字开头
    key$:以关键字结尾
    ^$:匹配空行
    --color=auto :可以将找到的关键词部分加上颜色的显示
    
    2)颜色设置
    临时设置:
    # alias grep='grep --color=auto'  #只针对当前终端和当前用户生效
    永久设置:
    1)全局(针对所有用户生效)
    vim /etc/bashrc
    alias grep='grep --color=auto'
    source /etc/bashrc
    2)局部(针对具体的某个用户)
    vim ~/.bashrc
    alias grep='grep --color=auto'
    source ~/.bashrc
    
    3)举例说明
    # grep -i root passwd    忽略大小写匹配包含root的行
    # grep -w ftp passwd     精确匹配ftp单词
    # grep -w hello passwd    精确匹配hello单词;自己添加包含hello的行到文件
    # grep -wo ftp passwd    打印匹配到的关键字ftp
    # grep -n root passwd    打印匹配到root关键字的行好
    # grep -ni root passwd   忽略大小写匹配统计包含关键字root的行
    # grep -nic root passwd   忽略大小写匹配统计包含关键字root的行数
    # grep -i ^root passwd   忽略大小写匹配以root开头的行
    # grep bash$ passwd      匹配以bash结尾的行
    # grep -n ^$ passwd      匹配空行并打印行号
    # grep ^# /etc/vsftpd/vsftpd.conf       匹配以#号开头的行
    # grep -v ^# /etc/vsftpd/vsftpd.conf    匹配不以#号开头的行
    # grep -A 5 mail passwd   匹配包含mail关键字及其后5行
    # grep -B 5 mail passwd   匹配包含mail关键字及其前5行
    # grep -C 5 mail passwd   匹配包含mail关键字及其前后5行
    

    1.2 cut工具

    cut是列截取工具,主要用于列的截取!

    1)常用选项
    -c: 以字符为单位进行分割,截取
    -d: 自定义分隔符,默认为制表符	
    -f: 与-d一起使用,指定截取哪个区域
    
    2)举例说明
    # cut -d: -f1 1.txt             以:冒号分割,截取第1列内容
    # cut -d: -f1,6,7 1.txt     以:冒号分割,截取第1,6,7列内容
    # cut -c4 1.txt                 截取文件中每行第4个字符
    # cut -c1-4 1.txt           截取文件中每行的1-4个字符
    # cut -c4-10 1.txt          截取文件中每行的4-10个字符
    # cut -c5- 1.txt                从第5个字符开始截取后面所有字符
    

    1.3 sort工具

    sort工具用于排序;它将文件的每一行作为一个单位,从首字符向后,依次按ASCII码值进行比较,最后将他们按升序输出。

    1)常用选项
    -u :去除重复行
    -r :降序排列,默认是升序
    -o : 将排序结果输出到文件中,类似重定向符号>
    -n :以数字排序,默认是按字符排序
    -t :分隔符
    -k :第N列
    -b :忽略前导空格。
    -R :随机排序,每次运行的结果均不同
    
    2)举例说明
    # sort -n -t: -k3 1.txt             按照用户的uid进行升序排列
    # sort -nr -t: -k3 1.txt            按照用户的uid进行降序排列
    # sort -n 2.txt                         按照数字排序
    # sort -nu 2.txt                        按照数字排序并且去重
    # sort -nr 2.txt 
    # sort -nru 2.txt 
    # sort -nru 2.txt 
    # sort -n 2.txt -o 3.txt            按照数字排序并将结果重定向到文件
    # sort -R 2.txt 
    # sort -u 2.txt 
    

    1.4 uniq工具

    uniq工具主要用于去除连续的重复的行!

    1)常用选项
    -i: 忽略大小写
    -c: 统计重复行次数
    -d:只显示重复行
    
    2)举例说明
    # uniq 2.txt        去除文件中的重复行
    # uniq -d 2.txt    只显示文件中的重复行
    # uniq -dc 2.txt   显示文件中的重复行并统计重复的次数
    

    1.5 tee工具

    tee工具是从标准输入读取并写入到标准输出和文件,即:双向覆盖重定向(屏幕输出|文本输入)!

    1)常用选项
    -a:双向追加重定向
    
    2)举例说明
    # echo hello world|tee file1    屏幕输出并重定向到文件中(覆盖原有的文件内容)
    # echo 999|tee -a file1     屏幕输出并追加重定向到文件中(不覆盖原有的文件内容)
    

    1.6 diff工具

    diff工具主要用于逐行比较文件的不同!

    注意:diff描述两个文件不同的方式是告诉我们:怎样改变第一个文件之后才可与第二个文件匹配。

    1)常用选项
    -b:不检查空格
    -B:不检查空白行
    -i:不检查大小写
    -w:忽略所有的空格
    --normal:正常格式显示(默认)
    -c:上下文格式显示
    -u:合并格式显示
    
    2)举例说明

    1)正常显示

    diff目的:file1如何改变才能和file2匹配
    # diff file1 file2
    1c1,2                   第一个文件的第1行需要改变(c=change)才能和第二个文件的第1到2行匹配         
    < aaaa              小于号"<"表示左边文件(file1)文件内容
    ---                 ---表示分隔符
    > aaa                   大于号">"表示右边文件(file2)文件内容
    > hello
    3d3                 第一个文件的第3行删除(d=delete)后才能和第二个文件的第3行匹配
    < hello world
    5d4                 第一个文件的第5行删除后才能和第二个文件的第4行匹配
    < 333
    6a6,7                   第一个文件的第6行增加(a=add)内容后才能和第二个文件的第6到7行匹配
    > 333                   需要增加的内容在第二个文件里是333和world
    > world
    

    2)上下文格式

    # diff -c file1 file2
    前两行主要列出需要比较的文件名和文件的时间戳;文件名前面的符号***表示file1,---表示file2
    *** file1       2019-04-16 16:26:05.748650262 +0800
    --- file2       2019-04-16 16:26:30.470646030 +0800
    *************** 我是分隔符
    *** 1,6 ****        以***开头表示file1文件,1,6表示1到6行
    ! aaaa              !表示该行需要修改才与第二个文件匹配
      111
    - hello world       -表示需要删除该行才与第二个文件匹配
      222
    - 333                   -表示需要删除该行才与第二个文件匹配
      bbb
    --- 1,7 ----        以---开头表示file2文件,1,7表示1到7行
    ! aaa                   表示第一个文件需要修改才与第二个文件匹配
    ! hello             表示第一个文件需要修改才与第二个文件匹配
      111
      222
      bbb
    + 333        表示第一个文件需要加上该行才与第二个文件匹配
    + world      表示第一个文件需要加上该行才与第二个文件匹配
    

    3)合并格式显示

    # diff -u file1 file2
    前两行主要列出需要比较的文件名和文件的时间戳;文件名前面的符号---表示file1,+++表示file2
    --- file1       2019-04-16 16:26:05.748650262 +0800
    +++ file2       2019-04-16 16:26:30.470646030 +0800
    @@ -1,6 +1,7 @@
    -aaaa
    +aaa
    +hello
     111
    -hello world
     222
    -333
     bbb
    +333
    +world
    

    4)比较两个目录不同

    默认情况下也会比较两个目录里相同文件的内容

    # diff dir1 dir2
    diff dir1/file1 dir2/file1
    0a1
    > hello
    Only in dir1: file3
    Only in dir2: test1
    如果只需要比较两个目录里文件的不同,不需要进一步比较文件内容,需要加-q选项
    # diff -q dir1 dir2
    Files dir1/file1 and dir2/file1 differ
    Only in dir1: file3
    Only in dir2: test1
    
    3)工作使用小技巧

    有时候我们需要以一个文件为标准,去修改其他文件,并且修改的地方较多时,我们可以通过打补丁的方式完成。

    1)先找出文件不同,然后输出到一个文件
    # diff -uN file1 file2 > file.patch
    -u:上下文模式
    -N:将不存在的文件当作空文件
    2)将不同内容打补丁到文件
    # patch file1 file.patch
    patching file file1
    3)测试验证
    # diff file1 file2
    #
    

    1.7 paste工具

    paste工具主要用于合并文件行!

    1)常用选项
    -d:自定义间隔符,默认是tab
    -s:串行处理,非并行
    
    2)举例说明
    # cat file1
    111
    222
    333
    444
    # cat file2
    aaa
    bbb
    ccc
    ddd
    # paste file1 file2
    111	aaa
    222	bbb
    333	ccc
    444	ddd
    # paste -s file1 file2
    111	222	333	444
    aaa	bbb	ccc	ddd
    # paste -d: file1 file2
    111:aaa
    222:bbb
    333:ccc
    444:ddd
    

    1.8 tr工具

    tr工具用于主要用于字符转换,替换和删除!

    1)常用选项
    -d:删除字符串1中所有输入字符
    -s:删除所有重复出现字符序列,只保留第一个;即将重复出现字符串压缩为一个字符串
    
    2)常用匹配字符串
    字符串 含义
    a-z或[:lower:] 匹配所有小写字母
    A-Z或[:upper:] 匹配所有大写字母
    0-9或[:digit:] 匹配所有数字
    [:alnum:] 匹配所有字母和数字
    [:alpha:] 匹配所有字母
    [:blank:] 所有水平空白
    [:punct:] 匹配所有标点符号
    [:space:] 所有水平或垂直的空格
    [:cntrl:] 所有控制字符
    3)举例说明
    # tr -d '[:/]' < 3.txt         删除文件中的:和/
    # cat 3.txt |tr -d '[:/]'       删除文件中的:和/
    # tr '[0-9]' '@' < 3.txt       将文件中的数字替换为@符号
    # tr '[a-z]' '[A-Z]' < 3.txt     将文件中的小写字母替换成大写字母
    # tr -s '[a-z]' < 3.txt        匹配小写字母并将重复的压缩为一个
    # tr -s '[a-z0-9]' < 3.txt      匹配小写字母和数字并将重复的压缩为一个
    # tr -d '[:digit:]' < 3.txt      删除文件中的数字
    # tr -d '[:blank:]' < 3.txt      删除水平空白
    # tr -d '[:space:]' < 3.txt      删除所有水平和垂直空白
    
    4)小试牛刀

    1.使用小工具分别截取当前主机IP;截取NETMASK;截取广播地址;截取MAC地址,方法如下:

    # ifconfig eth0|grep 'Bcast'|tr -d '[a-zA-Z ]'|cut -d: -f2,3,4
    10.1.1.1:10.1.1.255:255.255.255.0
    # ifconfig eth0|grep 'Bcast'|tr -d '[a-zA-Z ]'|cut -d: -f2,3,4|tr ':' '
    '
    10.1.1.1
    10.1.1.255
    255.255.255.0
    # ifconfig eth0|grep 'HWaddr'|cut -d: -f2-|cut -d' ' -f4
    00:0C:29:25:AE:54
    # ifconfig eth0|grep 'HW'|tr -s ' '|cut -d' ' -f5
    00:0C:29:B4:9E:4E
    
    # ifconfig eth1|grep Bcast|cut -d: -f2|cut -d' ' -f1
    # ifconfig eth1|grep Bcast|cut -d: -f2|tr -d '[ a-zA-Z]'
    # ifconfig eth1|grep Bcast|tr -d '[:a-zA-Z]'|tr ' ' '@'|tr -s '@'|tr '@' '
    '|grep -v ^$
    # ifconfig eth0|grep 'Bcast'|tr -d [:alpha:]|tr '[ :]' '
    '|grep -v ^$
    # ifconfig eth1|grep HWaddr|cut -d ' ' -f11
    # ifconfig eth0|grep HWaddr|tr -s ' '|cut -d' ' -f5
    # ifconfig eth1|grep HWaddr|tr -s ' '|cut -d' ' -f5
    # ifconfig eth0|grep 'Bcast'|tr -d 'a-zA-Z:'|tr ' ' '
    '|grep -v '^$'
    #多种方法任选其一
    

    2.将系统中所有普通用户的用户名、密码和默认shell保存到一个文件中,要求用户名密码和默认shell之间用tab键分割!

    # grep 'bash$' passwd |grep -v 'root'|cut -d: -f1,2,7|tr ':' '	' |tee abc.txt
    

    二、bash的特性

    2.1 常用的快捷键

    ^c              终止前台运行的程序
    ^z              将前台运行的程序挂起到后台
    ^d              退出 等价exit
    ^l              清屏 
    ^a |home    光标移到命令行的最前端
    ^e |end     光标移到命令行的后端
    ^u              删除光标前所有字符
    ^k              删除光标后所有字符
    ^r              搜索历史命令
    

    2.2 常用的通配符

    *:  匹配0或多个任意字符
    ?:  匹配任意单个字符
    [list]: 匹配[list]中的任意单个字符,或者一组单个字符   [a-z]
    [!list]: 匹配除list中的任意单个字符
    {string1,string2,...}:匹配string1,string2或更多字符串
    
    # rm -f file*
    # cp *.conf  /dir1
    # touch file{1..5}
    

    2.3 bash中的引号

    1)双引号"" :会把引号的内容当成整体来看待,允许通过$符号引用其他变量值;
    2)单引号'' :会把引号的内容当成整体来看待,禁止引用其他变量值,shell中特殊符号都被视为普通字符;
    3)反撇号`` :反撇号和$()一样,引号或括号里的命令会优先执行,如果存在嵌套,反撇号不能用;

    # echo "$(hostname)"
    server
    # echo '$(hostname)'
    $(hostname)
    # echo "hello world"
    hello world
    ]# echo 'hello world'
    hello world
    
    # echo $(date +%F)
    2018-11-22
    # echo `echo $(date +%F)`
    2018-11-22
    # echo `date +%F`
    2018-11-22
    # echo `echo `date +%F``
    date +%F
    # echo $(echo `date +%F`)
    2018-11-22
    
    *************** 当你发现自己的才华撑不起野心时,就请安静下来学习吧!***************
  • 相关阅读:
    第4章 栈和队列
    第3章 线性表
    第2章 算法
    第1章 数据结构绪论
    First Blood
    第52条:通过接口引用对象
    第51条:当心字符串连接的性能
    第50条:如果其他类型更合适,则尽量避免使用字符串
    第49条:基本类型优先于装箱基本类型
    第48条:如果需要精确的答案,请避免使用float和double
  • 原文地址:https://www.cnblogs.com/lvzhenjiang/p/14199185.html
Copyright © 2020-2023  润新知