一,Shell编程四剑客之Find
通过如上基础语法的学习,读者对Shell编程有了更近一步的理解,Shell编程不再是简单命令的堆积,而是演变成了各种特殊的语句、各种语法、编程工具、各种命令的集合。
在Shell编程工具中,四剑客工具的使用更加的广泛,Shell编程四剑客包括:find、sed、grep、awk,熟练掌握四剑客会对Shell编程能力极大的提升。
四剑客之Find工具实战,Find工具主要用于操作系统文件、目录的查找,其语法参数格式为:
find path -option [ -print ] [ -exec -ok command ] { } ; |
其option常用参数详解如下:
-name filename #查找名为filename的文件; -type b/d/c/p/l/f #查是块设备、目录、字符设备、管道、符号链接、普通文件; -size n[c] #查长度为n块[或n字节]的文件; -perm #按执行权限来查找; -user username #按文件属主来查找; -group groupname #按组来查找; -mtime -n +n #按文件更改时间来查找文件,-n指n天以内,+n指n天以前; -atime -n +n #按文件访问时间来查找文件; -ctime -n +n #按文件创建时间来查找文件; -mmin -n +n #按文件更改时间来查找文件,-n指n分钟以内,+n指n分钟以前; -amin -n +n #按文件访问时间来查找文件; -cmin -n +n #按文件创建时间来查找文件; -nogroup #查无有效属组的文件; -nouser #查无有效属主的文件; -newer f1 !f2 #找文件,-n指n天以内,+n指n天以前; -depth #使查找在进入子目录前先行查找完本目录; -fstype #查更改时间比f1新但比f2旧的文件; -mount #查文件时不跨越文件系统mount点; -follow #如果遇到符号链接文件,就跟踪链接所指的文件; -cpio #查位于某一类型文件系统中的文件; -prune #忽略某个目录; -maxdepth #查找目录级别深度。 |
(1) Find工具-name参数案列:
find /data/ -name "*.txt" #查找/data/目录以.txt结尾的文件; find /data/ -name "[A-Z]*" #查找/data/目录以大写字母开头的文件; find /data/ -name "test*" #查找/data/目录以test开头的文件; |
(2) Find工具-type参数案列:
find /data/ -type d #查找/data/目录下的文件夹; find /data/ ! -type d #查找/data/目录下的非文件夹; find /data/ -type l #查找/data/目录下的链接文件。 find /data/ -type d|xargs chmod 755 -R #查目录类型并将权限设置为755; find /data/ -type f|xargs chmod 644 -R #查文件类型并将权限设置为644; |
(3) Find工具-size参数案列:
find /data/ -size +1M #查文件大小大于1Mb的文件; find /data/ -size 10M #查文件大小为10M的文件; find /data/ -size -1M #查文件大小小于1Mb的文件; |
(4) Find工具-perm参数案列:
find /data/ -perm 755 #查找/data/目录权限为755的文件或者目录; find /data/ -perm -007 #与-perm 777相同,表示所有权限; find /data/ -perm +644 #文件权限符号644以上; |
(5) Find工具-mtime参数案列:
atime,access time 文件被读取或者执行的时间; ctime,change time 文件状态改变时间; mtime,modify time 文件内容被修改的时间; find /data/ -mtime +30 -name "*.log" #查找30天以前的log文件; find /data/ -mtime -30 -name "*.txt" #查找30天以内的log文件; find /data/ -mtime 30 -name "*.txt" #查找第30天的log文件; find /data/ -mmin +30 -name "*.log" #查找30分钟以前修改的log文件; find /data/ -amin -30 -name "*.txt" #查找30分钟以内被访问的log文件; find /data/ -cmin 30 -name "*.txt" #查找第30分钟改变的log文件。 |
(6) Find工具参数综合案列:
#查找/data目录以.log结尾,文件大于10k的文件,同时cp到/tmp目录; find /data/ -name "*.log" –type f -size +10k -exec cp {} /tmp/ ; #查找/data目录以.txt结尾,文件大于10k的文件,权限为644并删除该文件; find /data/ -name "*.log" –type f -size +10k -m perm 644 -exec rm –rf {} ; #查找/data目录以.log结尾,30天以前的文件,大小大于10M并移动到/tmp目录; find /data/ -name "*.log" –type f -mtime +30 –size +10M -exec mv {} /tmp/ ; |
二,Shell编程四剑客之SED
SED是一个非交互式文本编辑器,它可对文本文件和标准输入进行编辑,标准输入可以来自键盘输入、文本重定向、字符串、变量,甚至来自于管道的文本,与VIM编辑器类似,它一次处理一行内容,Sed可以编辑一个或多个文件,简化对文件的反复操作、编写转换程序等。
在处理文本时把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),紧接着用SED命令处理缓冲区中的内容,处理完成后把缓冲区的内容输出至屏幕或者写入文件。
逐行处理直到文件末尾,然而如果打印在屏幕上,实质文件内容并没有改变,除非你使用重定向存储输出或者写入文件。其语法参数格式为:
sed [-Options] [‘Commands’] filename; sed工具默认处理文本,文本内容输出屏幕已经修改,但是文件内容其实没有修改,需要加-i参数即对文件彻底修改; x #x为指定行号; x,y #指定从x到y的行号范围; /pattern/ #查询包含模式的行; /pattern/pattern/ #查询包含两个模式的行; /pattern/,x #从与pattern的匹配行到x号行之间的行; x,/pattern/ #从x号行到与pattern的匹配行之间的行; x,y! #查询不包括x和y行号的行; r #从另一个文件中读文件; w #将文本写入到一个文件; y #变换字符; q #第一个模式匹配完成后退出; l #显示与八进制ASCII码等价的控制字符; {} #在定位行执行的命令组; p #打印匹配行; = #打印文件行号; a #在定位行号之后追加文本信息; i #在定位行号之前插入文本信息; d #删除定位行; c #用新文本替换定位文本; s #使用替换模式替换相应模式; n #读取下一个输入行,用下一个命令处理新的行; N #将当前读入行的下一行读取到当前的模式空间。 h #将模式缓冲区的文本复制到保持缓冲区; H #将模式缓冲区的文本追加到保持缓冲区; x #互换模式缓冲区和保持缓冲区的内容; g #将保持缓冲区的内容复制到模式缓冲区; G #将保持缓冲区的内容追加到模式缓冲区。 |
常用SED工具企业演练案列:
(1) 替换jfedu.txt文本中old为new:
sed 's/old/new/g' jfedu.txt |
(2) 打印jfedu.txt文本第一行至第三行:
sed -n '1,3p' jfedu.txt |
(3) 打印jfedu.txt文本中第一行与最后一行:
sed -n '1p;$p' jfedu.txt |
(4) 删除jfedu.txt第一行至第三行、删除匹配行至最后一行:
sed '1,3d' jfedu.txt sed '/jfedu/,$d' jfedu.txt |
(5) 删除jfedu.txt最后6行及删除最后一行:
for i in `seq 1 6`;do sed -i '$d' jfedu.txt ;done sed '$d' jfedu.txt |
(6) 删除jfedu.txt最后一行:
sed '$d' jfedu.txt |
(7) 在jfedu.txt查找jfedu所在行,并在其下一行添加word字符,a表示在其下一行添加字符串:
sed '/jfedu/aword' jfedu.txt |
(8) 在jfedu.txt查找jfedu所在行,并在其上一行添加word字符,i表示在其上一行添加字符串:
sed '/jfedu/iword' jfedu.txt |
(9) 在jfedu.txt查找以test结尾的行尾添加字符串word,$表示结尾标识,&在Sed中表示添加:
sed 's/test$/&word/g' jfedu.txt |
(10) 在jfedu.txt查找www的行,在其行首添加字符串word,^表示起始标识,&在Sed中表示添加:
sed '/www/s/^/&word/' jfedu.txt |
(11) 多个sed命令组合,使用-e参数:
sed -e '/www.jd.com/s/^/&1./' -e 's/www.jd.com$/&./g' jfedu.txt |
(12) 多个sed命令组合,使用分号“;”分割:
sed -e '/www.jd.com/s/^/&1./;s/www.jd.com$/&./g' jfedu.txt |
(13) Sed读取系统变量,变量替换:
WEBSITE=WWW.JFEDU.NET Sed “s/www.jd.com/$WEBSITE/g” jfedu.txt |
(14) 修改Selinux策略enforcing为disabled,查找/SELINUX/行,然后将其行enforcing值改成disabled、!s表示不包括SELINUX行:
sed -i '/SELINUX/s/enforcing/disabled/g' /etc/selinux/config sed -i '/SELINUX/!s/enforcing/disabled/g' /etc/selinux/config |
通常而言,SED将待处理的行读入模式空间,脚本中的命令逐行进行处理,直到脚本执行完毕,然后该行被输出,模式空间请空;然后重复刚才的动作,文件中的新的一行被读入,直到文件处理完备。
如果用户希望在某个条件下脚本中的某个命令被执行,或者希望模式空间得到保留以便下一次的处理,都有可能使得sed在处理文件的时候不按照正常的流程来进行。这时可以使用SED高级语法来满足用户需求。总的来说,SED高级命令可以分为三种功能:
q N、D、P:处理多行模式空间的问题;
q H、h、G、g、x:将模式空间的内容放入存储空间以便接下来的编辑;
q :、b、t:在脚本中实现分支与条件结构。
(1) 在jfedu.txt每行后加入空行,也即每行占永两行空间,每一行后边插入一行空行、两行空行及前三行每行后插入空行:
sed '/^$/d;G' jfedu.txt sed '/^$/d;G;G' jfedu.txt sed '/^$/d;1,3G;' jfedu.txt |
(2) 将jfedu.txt偶数行删除及隔两行删除一行:
sed 'n;d' jfedu.txt sed 'n;n;d' jfedu.txt |
(3) 在jfedu.txt匹配行前一行、后一行插入空行以及同时在匹配前后插入空行:
sed '/jfedu/{x;p;x;}' jfedu.txt sed '/jfedu/G' jfedu.txt sed '/jfedu/{x;p;x;G;}' jfedu.txt |
(4) 在jfedu.txt每行后加入空行,也即每行占永两行空间,每一行后边插入空行:
sed '/^$/d;G' jfedu.txt |
(5) 在jfedu.txt每行后加入空行,也即每行占永两行空间,每一行后边插入空行:
sed '/^$/d;G' jfedu.txt |
(6) 在jfedu.txt每行前加入顺序数字序号、加上制表符 及.符号:
sed = jfedu.txt| sed 'N;s/ / /' sed = jfedu.txt| sed 'N;s/ / /' sed = jfedu.txt| sed 'N;s/ /./' |
(7) 删除jfedu.txt行前和行尾的任意空格:
sed 's/^[ ]*//;s/[ ]*$//' jfedu.txt |
(8) 打印jfedu.txt关键词old与new之间的内容:
sed -n '/old/,/new/'p jfedu.txt |
(9) 打印及删除jfedu.txt最后两行:
sed '$!N;$!D' jfedu.txt sed 'N;$!P;$!D;$d' jfedu.txt |
(10) 合并上下两行,也即两行合并:
sed '$!N;s/ / /' jfedu.txt sed 'N;s/ / /' jfedu.txt |
三,Shell编程四剑客之AWK
AWK是一个优良的文本处理工具,Linux及Unix环境中现有的功能最强大的数据处理引擎之一,以Aho、Weinberger、Kernighan三位发明者名字首字母命名为AWK,AWK是一个行级文本高效处理工具,AWK经过改进生成的新的版本有Nawk、Gawk,一般Linux默认为Gawk,Gawk是 AWK的GNU开源免费版本。
AWK基本原理是逐行处理文件中的数据,查找与命令行中所给定内容相匹配的模式,如果发现匹配内容,则进行下一个编程步骤,如果找不到匹配内容,则 继续处理下一行。其语法参数格式为,AWK常用参数、变量、函数详解如下:
awk 'pattern + {action}' file |
(1) AWK基本语法参数详解:
q 单引号' '是为了和shell命令区分开;
q 大括号{ }表示一个命令分组;
q pattern是一个过滤器,表示匹配pattern条件的行才进行Action处理;
q action是处理动作,常见动作为Print;
q 使用#作为注释,pattern和action可以只有其一,但不能两者都没有。
(2) AWK内置变量详解:
q FS 分隔符,默认是空格;
q OFS 输出分隔符;
q NR 当前行数,从1开始;
q NF 当前记录字段个数;
q $0 当前记录;
q $1~$n 当前记录第n个字段(列)。
(3) AWK内置函数详解:
q gsub(r,s):在$0中用s代替r;
q index(s,t):返回s中t的第一个位置;
q length(s):s的长度;
q match(s,r):s是否匹配r;
q split(s,a,fs):在fs上将s分成序列a;
q substr(s,p):返回s从p开始的子串。
(4) AWK常用操作符,运算符及判断符:
q ++ -- 增加与减少( 前置或后置);
q ^ ** 指数( 右结合性);
q ! + - 非、一元(unary) 加号、一元减号;
q + - * / % 加、减、乘、除、余数;
q < <= == != > >= 数字比较;
q && 逻辑and;
q || 逻辑or;
q = += -= *= /= %= ^= **= 赋值。
(5) AWK与流程控制语句:
q if(condition) { } else { };
q while { };
q do{ }while(condition);
q for(init;condition;step){ };
q break/continue。
常用AWK工具企业演练案列:
(1) AWK打印硬盘设备名称,默认以空格为分割:
df -h|awk '{print $1}' |
(2) AWK以空格、冒号、 、分号为分割:
awk -F '[ : ;]' '{print $1}' jfedu.txt |
(3) AWK以冒号分割,打印第一列,同时将内容追加到/tmp/awk.log下:
awk -F: '{print $1 >>"/tmp/awk.log"}' jfedu.txt |
(4) 打印jfedu.txt文件中的第3行至第5行,NR表示打印行,$0表示文本所有域:
awk 'NR==3,NR==5 {print}' jfedu.txt awk 'NR==3,NR==5 {print $0}' jfedu.txt |
(5) 打印jfedu.txt文件中的第3行至第5行的第一列与最后一列:
awk 'NR==3,NR==5 {print $1,$NF}' jfedu.txt |
(6) 打印jfedu.txt文件中,长度大于80的行号:
awk 'length($0)>80 {print NR}' jfedu.txt |
(7) AWK引用Shell变量,使用-v或者双引号+单引号即可:
awk -v STR=hello '{print STR,$NF}' jfedu.txt STR="hello";echo| awk '{print "'${STR}'";}' |
(8) AWK以冒号切割,打印第一列同时只显示前5行:
cat /etc/passwd|head -5|awk -F: '{print $1}' awk -F: 'NR>=1&&NR<=5 {print $1}' /etc/passwd |
(9) Awk指定文件jfedu.txt第一列的总和:
cat jfedu.txt |awk '{sum+=$1}END{print sum}' |
(10) AWK NR行号除以2余数为0则跳过该行,继续执行下一行,打印在屏幕:
awk -F: 'NR%2==0 {next} {print NR,$1}' /etc/passwd |
(11) AWK添加自定义字符:
ifconfig eth0|grep "Bcast"|awk '{print "ip_"$2}' |
(12) AWK格式化输出passwd内容,printf打印字符串,%格式化输出分隔符,s表示字符串类型,-12表示12个字符,-6表示6个字符:
awk -F: '{printf "%-12s %-6s %-8s ",$1,$2,$NF}' /etc/passwd |
(13) AWK OFS输出格式化 :
netstat -an|awk '$6 ~ /LISTEN/&&NR>=1&&NR<=10 {print NR,$4,$5,$6}' OFS=" " |
(14) AWK与if组合实战,判断数字比较:
echo 3 2 1 | awk '{ if(($1>$2)||($1>$3)) { print $2} else {print $1} }' |
(15) AWK与数组组合实战,统计passwd文件用户数:
awk -F ':' 'BEGIN {count=0;} {name[count] = $1;count++;};END{for (i = 0;i < NR;i++) print i, name[i]}' /etc/passwd |
(16) awk分析Nginx访问日志的状态码404、502等错误信息页面,统计次数大于20的IP地址。
awk '{if ($9~/502|499|500|503|404/) print $1,$9}' access.log|sort|uniq –c|sort –nr | awk '{if($1>20) print $2}' |
(17) 用/etc/shadow文件中的密文部分替换/etc/passwd中的"x"位置,生成新的/tmp/passwd文件。
awk 'BEGIN{OFS=FS=":"} NR==FNR{a[$1]=$2}NR>FNR{$2=a[$1];print >>"/tmp/passwd"}' /etc/shadow /etc/passwd |
(18) Awk统计服务器状态连接数:
netstat -an | awk '/tcp/ {s[$NF]++} END {for(a in s) {print a,s[a]}}' netstat -an | awk '/tcp/ {print $NF}' | sort | uniq -c |
四,Shell编程四剑客之GREP
全面搜索正则表达式(Global search regular expression(RE) ,GREP)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。
Unix/Linux的grep家族包括grep、egrep和fgrep,其中egrep和fgrep的命令跟grep有细微的区别,egrep是grep的扩展,支持更多的re元字符, fgrep是fixed grep或fast grep简写,它们把所有的字母都看作单词,正则表达式中的元字符表示其自身的字面意义,不再有其他特殊的含义,一般使用比较少。
目前Linux操作系统默认使用GNU版本的grep。它功能更强,可以通过-G、-E、-F命令行选项来使用egrep和fgrep的功能。其语法格式及常用参数详解如下:
grep -[acinv] 'word' Filename |
Grep常用参数详解如下:
-a 以文本文件方式搜索; -c 计算找到的符合行的次数; -i 忽略大小写; -n 顺便输出行号; -v 反向选择,即显示不包含匹配文本的所有行; -h 查询多文件时不显示文件名; -l 查询多文件时只输出包含匹配字符的文件名; -s 不显示不存在或无匹配文本的错误信息; -E 允许使用egrep扩展模式匹配。 |
学习Grep时,需要了解通配符、正则表达式两个概念,很多读者容易把彼此搞混淆,通配符主要用在Linux的Shell命令中,常用于文件或者文件名称的操作,而正则表达式用于文本内容中的字符串搜索和替换,常用在AWK、GREP、SED、VIM工具中对文本的操作。
通配符类型详解:
* 0个或者多个字符、数字; ? 匹配任意一个字符; # 表示注解; | 管道符号; ; 多个命令连续执行; & 后台运行指令; ! 逻辑运算非; [ ] 内容范围,匹配括号中内容; { } 命令块,多个命令匹配。 |
正则表达式详解:
* 前一个字符匹配0次或多次; . 匹配除了换行符以外任意一个字符; .* 代表任意字符; ^ 匹配行首,即以某个字符开头; $ 匹配行尾,即以某个字符结尾; (..) 标记匹配字符; [] 匹配中括号里的任意指定字符,但只匹配一个字符; [^] 匹配除中括号以外的任意一个字符; 转义符,取消特殊含义; < 锚定单词的开始; > 锚定单词的结束; {n} 匹配字符出现n次; {n,} 匹配字符出现大于等于n次; {n,m} 匹配字符至少出现n次,最多出现m次; w 匹配文字和数字字符; W w的反置形式,匹配一个或多个非单词字符; 单词锁定符; s 匹配任何空白字符; d 匹配一个数字字符,等价于[0-9]。 |
常用GREP工具企业演练案列:
grep -c "test" jfedu.txt 统计test字符总行数; grep -i "TEST" jfedu.txt 不区分大小写查找TEST所有的行; grep -n "test" jfedu.txt 打印test的行及行号; grep -v "test" jfedu.txt 不打印test的行; grep "test[53]" jfedu.txt 以字符test开头,接5或者3的行; grep "^[^test]" jfedu.txt 显示输出行首不是test的行; grep "[Mm]ay" jfedu.txt 匹配M或m开头的行; grep "K…D" jfedu.txt 匹配K,三个任意字符,紧接D的行; grep "[A-Z][9]D" jfedu.txt 匹配大写字母,紧跟9D的字符行; grep "T{2,}" jfedu.txt 打印字符T字符连续出现2次以上的行; grep "T{4,6}" jfedu.txt 打印字符T字符连续出现4次及6次的行; grep -n "^$" jfedu.txt 打印空行的所在的行号; grep -vE "#|^$" jfedu.txt 不匹配文件中的#和空行; grep --color -ra -E "db|config|sql" * 匹配包含db或者config或者sql的文件; grep --color -E "<([0-9]{1,3}.){3}([0-9]{1,3})>" jfedu.txt 匹配IPV4地址。 |