最基本功能是在文件或者字符串中基于指定规则浏览和抽取信息,awk抽取信息后,才能进行其他文本操作.
如last -n 5:显示最新登陆用户的信息。
只显示最新登陆的5个账号:
awk工作流程是这样的:读入有' '换行符分割的一条记录,然后将记录按指定的域分隔符划分域,填充域,$0则表示所有域,$1表示第一个域,$n表示第n个域。默认域分隔符是"空白键" 或 "[tab]键",所以$1表示登录用户,$3表示登录用户ip,以此类推。
如果只是显示/etc/passwd的账户和账户对应的shell,而账户与shell之间以tab键分割-F用于输入字段分隔符。
给打印出来的信息添加头和尾:
在passwd文件中搜索“/root/”字样的行打印出来:
搜索/etc/passwd有root关键字的所有行,并显示对应的shell
awk内置变量
awk有许多内置变量用来设置环境信息,这些变量可以被改变,下面给出了常用的一些变量。
ARGC 命令行参数个数
ARGV 命令行参数排列
ENVIRON S 支持队列中系统环境变量的使用
FILENAME awk浏览的文件名
FNR 浏览文件的记录数
FS 设置输入域分隔符,等价于命令行 -F选项
NF 浏览记录的域的个数
NR 已读的记录数
OFS 输出域分隔符
ORS 输出记录分隔符
RS 控制记录分隔符
统计/etc/passwd:文件名,每行的行号,每行的列数,对应的完整行内容:
$0代表整条记录
使用printf替代print,可以让代码更加简洁,易读:
printf函数,其用法和c语言中printf基本相似,可以格式化字符串,输出复杂时,printf更加好用,代码更易懂。
awk编程:
变量和赋值
下面统计/etc/passwd的账户人数:
统计某个文件夹下的文件占用的字节数:
统计某个文件夹下的文件占用的字节数,过滤4096大小的文件(一般都是文件夹):
循环语句
awk中的循环语句同样借鉴于C语言,支持while、do/while、for、break、continue,这些关键字的语义和C语言中的语义完全相同。
显示/etc/passwd的账户:
awk -F ':' 'BEGIN {count=0;} {name[count] = $1;count++;}; END{for (i = 0; i < NR; i++) print i, name[i]}' /etc/passwd