awk 【单独的编程语言解释器】
1、awk介绍
全称:Aho Weinberger Kernaighan三个人的首字母缩写;
1970年第一次出现在Unix机器上,后来在开源领域使用它;
所以,我们在linux中使用,改名为GNU awk;在linux上实际上叫做gawk
gcc---c语言的解释器
RSA
Grep 行过滤器
-o -I -v -E egrep fgrep grep
Sed 行编辑器/流编辑器
将每一行依次放入模式空间中进行操作
-n p---打印
地址定界3,5 命令p a i w c s/pattern/string/g|1|2…|&
Awk 报告生成器 【默认情况下,三个工具都不编辑源文件】
通过模式匹配以及自己本身的语言格式,来获取并输出客户所需要的内容;
例子:获取系统上面用户id小于等于500大于等于1的用户的用户名和用户ID
a=`awk -F: '{print $3}' /etc/passwd`
awk最后实现这个功能的时候只需要一句话
2、awk原理
属于行处理,不用去循环
与sed相同
将提取出的一行内容,默认以空格分割
$0 $1 $2
第一步,做分割
第二步,去匹配,pattern,模式匹配对应字段,过滤行(地址定界)
第三步,通过对应的命令—printf做格式化输出
【难点:关联逻辑语句,他有自己的语法格式】
依次把匹配到的行使用awk工具进行编辑或者格式化输出
【所以,关于行的循环,在awk中,就可以不用使用了】
awk -v FS=":" '{if($3>=1&&$3<=500){print $3}}' /etc/passwd
3、awk用法
awk [option]…‘program’ FILE…
program 必须使用单引号
多条program语句使用大括号包含起来,可以并列,可以嵌套
awk ‘{print}’ /etc/passwd-----默认有$0
4、option
-F 指定分隔符 可以指定多个分隔符awk -F[/:] '{print $1,$2,$3}' q.txt
-v 因为awk是一种语言编译器,能自己定义变量,同时也有内置变量(与环境变量类似)
手动指定变量参数
给a赋值,打印a这个变量
awk -v a="a/b" '{print a}' q.txt
a是自定义变量 -v FS=”:”
在awk中调用变量不用加$符号
了解cut与awk的区别
5、awk自己的固定语法语句
a) print 默认输出(在屏幕上打印一次) 在awk中没有保存命令,可以关联其他命令来保存
[root@localhost ~]# awk '{a="a/b" ; print a}' q.txt | tee q.bak
a/b
[root@localhost ~]# cat q.bak
a/b
b) printf
显示格式化输出
printf “ %s是%d班学的%c最好的学生”,$a,$b,$c
【仅仅只有顺序关系】
格式符
%s-------------字符串
%d %i --------数值
%e %E--------科学计算数值
%c ------------ACSII码值
%%------------逃逸符 只显示%自己
%f-------------浮点数
%u------------无符号整数
修饰符
默认为右对齐
- 代表左对齐
+ 代表右对齐
%5.4f 5代表占位数 4代表所取小数位
awk '/^UUID/{printf "被挂载文件: %-10s 挂载点:%-10s 文件系统格式:%-10s ",$1,$2,$3}' /etc/fstab
被挂载文件: UUID=b35bca91-5dc3-4539-beb2-50f7d26389ff 挂载点:/boot 文件系统格式:xfs
注意地址定界 sed /pattern1/,/pattern2/
c) 变量(内置变量、自定义变量)
内置变量 – 环境变量(bash)(env、set -C +C)
Awk语言所默认支持的变量
FS 定义输入分隔符的变量
OFS定义输出分隔符的变量
NF 定义的是分割以后的参数的个数($NF 分割以后最后的一列变量)
*变量引用的时候,不用加$ $0,$1$n
awk -v FS=":" '//bash$/{print $NF}' /etc/passwd
awk -v FS=":" '//bash$/{print $1,$NF}' /etc/passwd
NR 定义的文件行数 定义多个文件的时候,行号叠加
awk ‘{print NR}’/etc/passwd /etc/fstab
FNR 文件只计算自己的行号
awk ‘{print NR}’/etc/passwd /etc/fstab
FILENAME 存储文件名字
awk ‘{print FILENAME }’/etc/passwd –文件名会被打印N次,N是文件的行数,只打印一次使用BEGIN
awk ‘BEGIN{print FILENAME }’/etc/passwd //BEGIN{语句}----只在循环开始时执行一次
ARGC 整个命令的段数,[不包含命令本身]
cut -d: -f1 /etc/passwd ----- 4段
awk 'BEGIN{print ARGC}' /etc/passwd /etc/fstab /etc/shadow
ARGV 数组,用来调取命令中,指定的段ARGV[2]
*注意* 数组中也不包含program
RS 指定换行符 可以指定新的换行符,并不影响本身的换行符
awk -v RS=" " '{print}' /etc/passwd
ORS 输出的时候指定换行符,将默认换行符替换为指定字符
awk -v ORS="@" '{print}' /etc/passwd //可以取消换行
自定义变量 -v 变量=值
在后面’program’中去调用自定义变量时,直接使用即可
或者将“变量=值”语句直接写在‘program’亦可