• shell 编程四剑客简介 find sed grep awk(微信公众号摘抄)


    一,Shell编程四剑客之Find

    通过如上基础语法的学习,读者对Shell编程有了更近一步的理解,Shell编程不再是简单命令的堆积,而是演变成了各种特殊的语句、各种语法、编程工具、各种命令的集合。

    在Shell编程工具中,四剑客工具的使用更加的广泛,Shell编程四剑客包括:find、sed、grep、awk,熟练掌握四剑客会对Shell编程能力极大的提升。

    四剑客之Find工具实战,Find工具主要用于操作系统文件、目录的查找,其语法参数格式为:

    find   path   -option   [   -print ]   [ -exec   -ok   command ]   { }  ;

    其option常用参数详解如下:

    -name   filename       #查找名为filename的文件;

    -type    b/d/c/p/l/f   #查是块设备、目录、字符设备、管道、符号链接、普通文件;

    -size      n[c]           #查长度为n块[或n字节]的文件;

    -perm                  #按执行权限来查找;

    -user    username      #按文件属主来查找;

    -group   groupname     #按组来查找;

    -mtime    -n +n        #按文件更改时间来查找文件,-n指n天以内,+n指n天以前;

    -atime    -n +n            #按文件访问时间来查找文件;

    -ctime    -n +n            #按文件创建时间来查找文件;

    -mmin     -n +n            #按文件更改时间来查找文件,-n指n分钟以内,+n指n分钟以前;

    -amin     -n +n            #按文件访问时间来查找文件;

    -cmin     -n +n            #按文件创建时间来查找文件;

    -nogroup                   #查无有效属组的文件;

    -nouser                    #查无有效属主的文件;

    -newer   f1 !f2            #找文件,-n指n天以内,+n指n天以前;

    -depth                     #使查找在进入子目录前先行查找完本目录;

    -fstype                    #查更改时间比f1新但比f2旧的文件;

    -mount                     #查文件时不跨越文件系统mount点;

    -follow                    #如果遇到符号链接文件,就跟踪链接所指的文件;

    -cpio                  #查位于某一类型文件系统中的文件;

    -prune                     #忽略某个目录;

    -maxdepth      #查找目录级别深度。

    (1) Find工具-name参数案列:

    find   /data/    -name   "*.txt"       #查找/data/目录以.txt结尾的文件;

    find   /data/    -name   "[A-Z]*"      #查找/data/目录以大写字母开头的文件;

    find   /data/    -name   "test*"       #查找/data/目录以test开头的文件;

    (2) Find工具-type参数案列:

    find   /data/    -type d       #查找/data/目录下的文件夹;

    find   /data/    !   -type   d      #查找/data/目录下的非文件夹;

    find   /data/    -type l       #查找/data/目录下的链接文件。

    find  /data/ -type d|xargs chmod 755 -R  #查目录类型并将权限设置为755;

    find  /data/ -type f|xargs chmod 644 -R  #查文件类型并将权限设置为644;

    (3) Find工具-size参数案列:

    find   /data/    -size   +1M              #查文件大小大于1Mb的文件;

    find   /data/    -size   10M             #查文件大小为10M的文件;

    find   /data/    -size   -1M             #查文件大小小于1Mb的文件;

    (4) Find工具-perm参数案列:

    find   /data/    -perm   755     #查找/data/目录权限为755的文件或者目录;

    find   /data/    -perm   -007     #与-perm 777相同,表示所有权限;

    find   /data/    -perm   +644         #文件权限符号644以上;

    (5) Find工具-mtime参数案列:

    atime,access time   文件被读取或者执行的时间;

    ctime,change time   文件状态改变时间;

    mtime,modify time   文件内容被修改的时间;

    find /data/ -mtime +30  -name  "*.log"   #查找30天以前的log文件;

    find /data/ -mtime -30  -name  "*.txt"   #查找30天以内的log文件;

    find /data/ -mtime 30  -name   "*.txt" #查找第30天的log文件;

    find /data/ -mmin  +30 -name   "*.log"   #查找30分钟以前修改的log文件;

    find /data/ -amin  -30  -name   "*.txt"   #查找30分钟以内被访问的log文件;

    find /data/ -cmin  30  -name   "*.txt" #查找第30分钟改变的log文件。

    (6) Find工具参数综合案列:

    #查找/data目录以.log结尾,文件大于10k的文件,同时cp到/tmp目录;

    find /data/ -name "*.log"  –type f  -size +10k -exec cp {} /tmp/ ;

    #查找/data目录以.txt结尾,文件大于10k的文件,权限为644并删除该文件;

    find /data/ -name "*.log"  –type f  -size +10k  -m perm 644 -exec rm –rf {} ;

    #查找/data目录以.log结尾,30天以前的文件,大小大于10M并移动到/tmp目录;

    find /data/ -name "*.log"  –type f  -mtime +30 –size +10M -exec mv {} /tmp/ ;

    二,Shell编程四剑客之SED

    SED是一个非交互式文本编辑器,它可对文本文件和标准输入进行编辑,标准输入可以来自键盘输入、文本重定向、字符串、变量,甚至来自于管道的文本,与VIM编辑器类似,它一次处理一行内容,Sed可以编辑一个或多个文件,简化对文件的反复操作、编写转换程序等。

    在处理文本时把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),紧接着用SED命令处理缓冲区中的内容,处理完成后把缓冲区的内容输出至屏幕或者写入文件。

    逐行处理直到文件末尾,然而如果打印在屏幕上,实质文件内容并没有改变,除非你使用重定向存储输出或者写入文件。其语法参数格式为:

    sed    [-Options]     [‘Commands’]    filename;

    sed工具默认处理文本,文本内容输出屏幕已经修改,但是文件内容其实没有修改,需要加-i参数即对文件彻底修改;

    x                     #x为指定行号;

    x,y                       #指定从x到y的行号范围;

    /pattern/                 #查询包含模式的行;

    /pattern/pattern/             #查询包含两个模式的行;

    /pattern/,x               #从与pattern的匹配行到x号行之间的行;

    x,/pattern/               #从x号行到与pattern的匹配行之间的行;

    x,y!                      #查询不包括x和y行号的行;

    r                   #从另一个文件中读文件;

    w                   #将文本写入到一个文件;

    y                   #变换字符;

    q                 #第一个模式匹配完成后退出;

    l                   #显示与八进制ASCII码等价的控制字符;

    {}                     #在定位行执行的命令组;

    p                   #打印匹配行;

    =                   #打印文件行号;

    a                     #在定位行号之后追加文本信息;

    i                     #在定位行号之前插入文本信息;

    d                   #删除定位行;

    c                     #用新文本替换定位文本;

    s                   #使用替换模式替换相应模式;

    n                   #读取下一个输入行,用下一个命令处理新的行;

    N                           #将当前读入行的下一行读取到当前的模式空间。

    h                   #将模式缓冲区的文本复制到保持缓冲区;

    H                   #将模式缓冲区的文本追加到保持缓冲区;

    x                   #互换模式缓冲区和保持缓冲区的内容;

    g                   #将保持缓冲区的内容复制到模式缓冲区;

    G                   #将保持缓冲区的内容追加到模式缓冲区。

    常用SED工具企业演练案列:

    (1) 替换jfedu.txt文本中old为new:

    sed    's/old/new/g'       jfedu.txt

    (2) 打印jfedu.txt文本第一行至第三行:

    sed    -n  '1,3p'           jfedu.txt

    (3) 打印jfedu.txt文本中第一行与最后一行:

    sed    -n '1p;$p'           jfedu.txt

    (4) 删除jfedu.txt第一行至第三行、删除匹配行至最后一行:

    sed       '1,3d'             jfedu.txt

    sed       '/jfedu/,$d'         jfedu.txt

    (5) 删除jfedu.txt最后6行及删除最后一行:

    for   i  in `seq 1 6`;do  sed  -i   '$d'  jfedu.txt ;done

    sed       '$d'               jfedu.txt

    (6) 删除jfedu.txt最后一行:

    sed       '$d'             jfedu.txt

    (7) 在jfedu.txt查找jfedu所在行,并在其下一行添加word字符,a表示在其下一行添加字符串:

    sed    '/jfedu/aword'      jfedu.txt

    (8) 在jfedu.txt查找jfedu所在行,并在其上一行添加word字符,i表示在其上一行添加字符串:

    sed    '/jfedu/iword'       jfedu.txt

    (9) 在jfedu.txt查找以test结尾的行尾添加字符串word,$表示结尾标识,&在Sed中表示添加:

    sed   's/test$/&word/g'     jfedu.txt

    (10) 在jfedu.txt查找www的行,在其行首添加字符串word,^表示起始标识,&在Sed中表示添加:

    sed   '/www/s/^/&word/'    jfedu.txt

    (11) 多个sed命令组合,使用-e参数:

    sed  -e  '/www.jd.com/s/^/&1./'  -e  's/www.jd.com$/&./g'  jfedu.txt

    (12) 多个sed命令组合,使用分号“;”分割:

    sed  -e  '/www.jd.com/s/^/&1./;s/www.jd.com$/&./g'  jfedu.txt

    (13) Sed读取系统变量,变量替换:

    WEBSITE=WWW.JFEDU.NET

    Sed  “s/www.jd.com/$WEBSITE/g” jfedu.txt

    (14) 修改Selinux策略enforcing为disabled,查找/SELINUX/行,然后将其行enforcing值改成disabled、!s表示不包括SELINUX行:

    sed  -i   '/SELINUX/s/enforcing/disabled/g' /etc/selinux/config

    sed  -i   '/SELINUX/!s/enforcing/disabled/g' /etc/selinux/config

    通常而言,SED将待处理的行读入模式空间,脚本中的命令逐行进行处理,直到脚本执行完毕,然后该行被输出,模式空间请空;然后重复刚才的动作,文件中的新的一行被读入,直到文件处理完备。

    如果用户希望在某个条件下脚本中的某个命令被执行,或者希望模式空间得到保留以便下一次的处理,都有可能使得sed在处理文件的时候不按照正常的流程来进行。这时可以使用SED高级语法来满足用户需求。总的来说,SED高级命令可以分为三种功能:

    q N、D、P:处理多行模式空间的问题;

    q H、h、G、g、x:将模式空间的内容放入存储空间以便接下来的编辑;

    q :、b、t:在脚本中实现分支与条件结构。

    (1) 在jfedu.txt每行后加入空行,也即每行占永两行空间,每一行后边插入一行空行、两行空行及前三行每行后插入空行:

    sed     '/^$/d;G'            jfedu.txt

    sed     '/^$/d;G;G'      jfedu.txt

    sed     '/^$/d;1,3G;'     jfedu.txt

    (2) 将jfedu.txt偶数行删除及隔两行删除一行:

    sed    'n;d'              jfedu.txt

    sed    'n;n;d'           jfedu.txt

    (3) 在jfedu.txt匹配行前一行、后一行插入空行以及同时在匹配前后插入空行:

    sed  '/jfedu/{x;p;x;}'      jfedu.txt

    sed  '/jfedu/G'                jfedu.txt

    sed  '/jfedu/{x;p;x;G;}'   jfedu.txt

    (4) 在jfedu.txt每行后加入空行,也即每行占永两行空间,每一行后边插入空行:

    sed '/^$/d;G' jfedu.txt

    (5) 在jfedu.txt每行后加入空行,也即每行占永两行空间,每一行后边插入空行:

    sed '/^$/d;G' jfedu.txt

    (6) 在jfedu.txt每行前加入顺序数字序号、加上制表符 及.符号:

    sed = jfedu.txt| sed 'N;s/ / /'

    sed = jfedu.txt| sed 'N;s/ / /'

    sed = jfedu.txt| sed 'N;s/ /./'

    (7) 删除jfedu.txt行前和行尾的任意空格:

    sed 's/^[ ]*//;s/[ ]*$//' jfedu.txt

    (8) 打印jfedu.txt关键词old与new之间的内容:

    sed -n '/old/,/new/'p     jfedu.txt

    (9) 打印及删除jfedu.txt最后两行:

    sed   '$!N;$!D'             jfedu.txt

    sed   'N;$!P;$!D;$d'      jfedu.txt

    (10) 合并上下两行,也即两行合并:

    sed    '$!N;s/ / /'          jfedu.txt

    sed    'N;s/ / /'            jfedu.txt

     三,Shell编程四剑客之AWK

    AWK是一个优良的文本处理工具,LinuxUnix环境中现有的功能最强大的数据处理引擎之一,以Aho、Weinberger、Kernighan三位发明者名字首字母命名为AWK,AWK是一个行级文本高效处理工具,AWK经过改进生成的新的版本有Nawk、Gawk,一般Linux默认为Gawk,Gawk是 AWK的GNU开源免费版本。

    AWK基本原理是逐行处理文件中的数据,查找与命令行中所给定内容相匹配的模式,如果发现匹配内容,则进行下一个编程步骤,如果找不到匹配内容,则  继续处理下一行。其语法参数格式为,AWK常用参数、变量、函数详解如下:

    awk    'pattern   +   {action}'     file

    (1) AWK基本语法参数详解:

    q 单引号' '是为了和shell命令区分开;

    q 大括号{ }表示一个命令分组;

    q pattern是一个过滤器,表示匹配pattern条件的行才进行Action处理;

    q action是处理动作,常见动作为Print;

    q 使用#作为注释,pattern和action可以只有其一,但不能两者都没有。

    (2) AWK内置变量详解:

    q FS 分隔符,默认是空格;

    q OFS 输出分隔符;

    q NR 当前行数,从1开始;

    q NF 当前记录字段个数;

    q $0 当前记录;

    q $1~$n 当前记录第n个字段(列)。

    (3) AWK内置函数详解:

    q gsub(r,s):在$0中用s代替r;

    q index(s,t):返回s中t的第一个位置;

    q length(s):s的长度;

    q match(s,r):s是否匹配r;

    q split(s,a,fs):在fs上将s分成序列a;

    q substr(s,p):返回s从p开始的子串。

    (4) AWK常用操作符,运算符及判断符:

    q ++ --                     增加与减少( 前置或后置);

    q ^ **                      指数( 右结合性);

    q ! + -                     非、一元(unary) 加号、一元减号;

    q + - * / %                    加、减、乘、除、余数;

    q < <= == != > >=      数字比较;

    q &&                      逻辑and;

    q ||                      逻辑or;

    q = += -= *= /= %= ^= **=   赋值。

    (5) AWK与流程控制语句:

    q if(condition) { } else { };

    q while { };

    q do{ }while(condition);

    q for(init;condition;step){ };

    q break/continue。

    常用AWK工具企业演练案列:

    (1) AWK打印硬盘设备名称,默认以空格为分割:

    df    -h|awk  '{print  $1}'

    (2) AWK以空格、冒号、 、分号为分割:

    awk  -F '[ : ;]'  '{print  $1}'            jfedu.txt

    (3) AWK以冒号分割,打印第一列,同时将内容追加到/tmp/awk.log下:

    awk  -F:  '{print $1 >>"/tmp/awk.log"}'  jfedu.txt

    (4) 打印jfedu.txt文件中的第3行至第5行,NR表示打印行,$0表示文本所有域:

    awk 'NR==3,NR==5  {print}'             jfedu.txt

    awk 'NR==3,NR==5  {print $0}'          jfedu.txt

    (5) 打印jfedu.txt文件中的第3行至第5行的第一列与最后一列:

    awk 'NR==3,NR==5 {print $1,$NF}'       jfedu.txt

    (6) 打印jfedu.txt文件中,长度大于80的行号:

    awk   'length($0)>80 {print NR}'        jfedu.txt

    (7) AWK引用Shell变量,使用-v或者双引号+单引号即可:

    awk -v STR=hello  '{print STR,$NF}'      jfedu.txt

    STR="hello";echo| awk  '{print "'${STR}'";}'

    (8) AWK以冒号切割,打印第一列同时只显示前5行:

    cat  /etc/passwd|head -5|awk  -F:   '{print $1}'

    awk  -F:  'NR>=1&&NR<=5 {print $1}'  /etc/passwd

    (9) Awk指定文件jfedu.txt第一列的总和:

    cat jfedu.txt |awk '{sum+=$1}END{print sum}'

    (10) AWK NR行号除以2余数为0则跳过该行,继续执行下一行,打印在屏幕:

    awk  -F:  'NR%2==0 {next} {print NR,$1}'  /etc/passwd

    (11) AWK添加自定义字符:

    ifconfig  eth0|grep "Bcast"|awk '{print "ip_"$2}'

    (12) AWK格式化输出passwd内容,printf打印字符串,%格式化输出分隔符,s表示字符串类型,-12表示12个字符,-6表示6个字符:

    awk -F:  '{printf "%-12s %-6s %-8s ",$1,$2,$NF}'  /etc/passwd

    (13) AWK OFS输出格式化 :

    netstat -an|awk '$6 ~ /LISTEN/&&NR>=1&&NR<=10 {print NR,$4,$5,$6}' OFS=" "  

    (14) AWK与if组合实战,判断数字比较:

    echo 3 2 1 | awk '{ if(($1>$2)||($1>$3)) { print $2} else {print $1} }'

    (15) AWK与数组组合实战,统计passwd文件用户数:

    awk -F ':' 'BEGIN {count=0;} {name[count] = $1;count++;};END{for (i = 0;i < NR;i++) print i, name[i]}'  /etc/passwd

    (16) awk分析Nginx访问日志的状态码404、502等错误信息页面,统计次数大于20的IP地址。

    awk '{if ($9~/502|499|500|503|404/) print $1,$9}' access.log|sort|uniq –c|sort –nr | awk '{if($1>20) print $2}'

    (17) 用/etc/shadow文件中的密文部分替换/etc/passwd中的"x"位置,生成新的/tmp/passwd文件。

    awk 'BEGIN{OFS=FS=":"} NR==FNR{a[$1]=$2}NR>FNR{$2=a[$1];print >>"/tmp/passwd"}' /etc/shadow /etc/passwd

    (18) Awk统计服务器状态连接数:

    netstat -an | awk '/tcp/ {s[$NF]++} END {for(a in s) {print a,s[a]}}'

    netstat -an | awk '/tcp/ {print $NF}' | sort | uniq -c

    四,Shell编程四剑客之GREP

    全面搜索正则表达式(Global search regular expression(RE) ,GREP)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。

    Unix/Linux的grep家族包括grep、egrep和fgrep,其中egrep和fgrep的命令跟grep有细微的区别,egrep是grep的扩展,支持更多的re元字符, fgrep是fixed grep或fast grep简写,它们把所有的字母都看作单词,正则表达式中的元字符表示其自身的字面意义,不再有其他特殊的含义,一般使用比较少。

    目前Linux操作系统默认使用GNU版本的grep。它功能更强,可以通过-G、-E、-F命令行选项来使用egrep和fgrep的功能。其语法格式及常用参数详解如下:

    grep     -[acinv]    'word'     Filename

    Grep常用参数详解如下:

    -a       以文本文件方式搜索;

    -c       计算找到的符合行的次数;

    -i       忽略大小写;

    -n       顺便输出行号;

    -v       反向选择,即显示不包含匹配文本的所有行;

    -h       查询多文件时不显示文件名;

    -l       查询多文件时只输出包含匹配字符的文件名;

    -s       不显示不存在或无匹配文本的错误信息;

    -E       允许使用egrep扩展模式匹配。

    学习Grep时,需要了解通配符、正则表达式两个概念,很多读者容易把彼此搞混淆,通配符主要用在Linux的Shell命令中,常用于文件或者文件名称的操作,而正则表达式用于文本内容中的字符串搜索和替换,常用在AWK、GREP、SED、VIM工具中对文本的操作。

    通配符类型详解:

    *      0个或者多个字符、数字;

    ?      匹配任意一个字符;

    #      表示注解;

    |      管道符号;

    ;     多个命令连续执行;

    &      后台运行指令;

    !      逻辑运算非;

    [ ]      内容范围,匹配括号中内容;

    { }      命令块,多个命令匹配。

    正则表达式详解:

    *      前一个字符匹配0次或多次;

    .      匹配除了换行符以外任意一个字符;

    .*      代表任意字符;

    ^      匹配行首,即以某个字符开头;

    $      匹配行尾,即以某个字符结尾;

    (..)      标记匹配字符;

    []      匹配中括号里的任意指定字符,但只匹配一个字符;

    [^]      匹配除中括号以外的任意一个字符;

         转义符,取消特殊含义;

    <       锚定单词的开始;

    >       锚定单词的结束;

    {n}      匹配字符出现n次;

    {n,}     匹配字符出现大于等于n次;

    {n,m}     匹配字符至少出现n次,最多出现m次;

    w       匹配文字和数字字符;

    W       w的反置形式,匹配一个或多个非单词字符;

           单词锁定符;

    s      匹配任何空白字符;

    d      匹配一个数字字符,等价于[0-9]。

    常用GREP工具企业演练案列:

    grep  -c "test"       jfedu.txt  统计test字符总行数;

    grep  -i "TEST"       jfedu.txt  不区分大小写查找TEST所有的行;

    grep  -n "test"       jfedu.txt  打印test的行及行号;

    grep  -v "test"       jfedu.txt  不打印test的行;

    grep  "test[53]"       jfedu.txt  以字符test开头,接5或者3的行;

    grep  "^[^test]"       jfedu.txt  显示输出行首不是test的行;

    grep  "[Mm]ay"     jfedu.txt  匹配M或m开头的行;

    grep  "K…D"    jfedu.txt  匹配K,三个任意字符,紧接D的行;

    grep  "[A-Z][9]D"    jfedu.txt  匹配大写字母,紧跟9D的字符行;

    grep  "T{2,}"       jfedu.txt  打印字符T字符连续出现2次以上的行;

    grep  "T{4,6}"       jfedu.txt  打印字符T字符连续出现4次及6次的行;

    grep  -n "^$"     jfedu.txt  打印空行的所在的行号;

    grep  -vE "#|^$"       jfedu.txt    不匹配文件中的#和空行;

    grep   --color -ra -E "db|config|sql"  *  匹配包含db或者config或者sql的文件;

    grep   --color -E "<([0-9]{1,3}.){3}([0-9]{1,3})>"    jfedu.txt 匹配IPV4地址。

  • 相关阅读:
    反射和内置方法重写
    封装
    接口与抽象类 、多态
    面向对象--继承和组合
    python对象
    模块导入
    python序列化模块
    time random sys os 模块
    python re模块和collections
    python各种推导式
  • 原文地址:https://www.cnblogs.com/Lonelychampion/p/11427598.html
Copyright © 2020-2023  润新知