• #每日Linux小练习#05 awk-好用的数据处理工具


    awk是数据处理工具。相比如sed常作用于一整行的处理,awk则倾向于将一行分为数个“字段”来处理。

    因此,awk适合处理小型的数据。

    awk的基本模式如下:

    awk '条件类型1{动作1}条件类型2{动作2}'

    首先,看一段基本的代码

    echo "basis exmaple pf awk"
    echo "**************************"
    echo "before awk###############"
    last -n 5
    echo "after awk################"
    last -n 5 | awk '{print $1 "	" $3}'

    1、awk默认使用空格或者[tab]键来分隔,分别储存在$1、$2、$3。。。中,$0代表一整行

    awk有一些内置变量

    内置变量名称 代表意义
    NF 每一行拥有的字段总数(多少列)
    NR 目前awk处理的是“第几行”的数据
    FS 目前的分隔符,默认是空格或者[Tab]
    echo " "
    echo " "
    echo "change FS"
    echo "**************************"
    cat /etc/passwd | awk '{FS=":"}  $3< 10 {print $1 "	" $2 "	" $3}'
    echo " "
    echo "add BEGIN"
    cat /etc/passwd | awk ' BEGIN {FS=":"}  $3< 10 {print $1 "	" $2 "	" $3}'
    echo "add BEGIN"
    cat /etc/passwd | awk ' BEGIN {FS=":"}  $3< 10 {print $1 "	" $2 "	" $3 "	lines:" NR "	 columes" NF}'

    1、执行第一个动作  {FS=":"} 将分隔符改为:

    2、分隔符不会立即生效,需要到第二行才能生效,所以增加BEGIN关键词,这样第一行也能生效

    echo " "
    echo " "
    echo "calculate"
    echo "**************************"
    echo -e "Name 	 1st 	 2nd 	 3th" > ./material/20150807awk_pay.txt
    echo -e "Liu 	 26 	 200 	 300" >> ./material/20150807awk_pay.txt
    echo -e "Wu 		 24 	 210 	 310" >> ./material/20150807awk_pay.txt
    echo -e "Chen 	 24 	 220 	 320" >> ./material/20150807awk_pay.txt
    echo -e "Zhong 	 25 	 230 	 330" >> ./material/20150807awk_pay.txt
    
    cat ./material/20150807awk_pay.txt | 
    awk 'NR==1 {printf "%10s %10s %10s %10s %10s
    ",$1,$2,$3,$4,"Total"}  #第一个动作
    NR>=2 {total= $2 + $3 + $4                           #第二个动作
    printf "%10s %10d %10d %10d %10.2f
    ",$1,$2,$3,$4,total}'

    1、echo -e " "可以将tab键打印出来,如果是 echo " ",打印出来的是 这两个字符

    2、这个实例中,存在不同的判断条件,然后紧跟着对应的动作。如果需要多个命名辅助,可利用分号或者[Enter]来分隔命令

    3、与bash,shell的变量不同,在awk中,变量可以直接使用(如最后一句的total),不需要加上$符号

  • 相关阅读:
    css 基线与行高
    requests超时
    小记--------Ambari2.7.4集成Kylin3.0
    记一次--------HDP3.1 spark创建表hive读不到,hive创建表spark读不到
    记一次-------- sqoop同步mysql到hive 执行太慢
    记一次--------hive创建表comment中文乱码解决
    .Net Core学习之路-跳坑(一)
    NGINX、HAProxy和Traefik负载均衡能力对比
    idea 一键启动多个微服务项目
    vuedraggable自由拖拽
  • 原文地址:https://www.cnblogs.com/wuqi/p/4712623.html
Copyright © 2020-2023  润新知