• Linux awk 替换文本字符串内容


    awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大。简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理。

    1
    awk '{pattern + action}' {filenames}

    尽管操作可能会很复杂,但语法总是这样,其中 pattern 表示 AWK 在数据中查找的内容,而 action 是在找到匹配内容时所执行的一系列命令。花括号({})不需要在程序中始终出现,但它们用于根据特定的模式对一系列指令进行分组。 pattern就是要表示的正则表达式,用斜杠括起来。

    awk语言的最基本功能是在文件或者字符串中基于指定规则浏览和抽取信息,awk抽取信息后,才能进行其他文本操作。完整的awk脚本通常用来格式化文本文件中的信息。通常,awk是以文件的一行为处理单位的。awk每接收文件的一行,然后执行相应的命令,来处理文本。

    awk内置变量

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    ARGC               命令行参数个数
    ARGV               命令行参数排列
    ENVIRON            支持队列中系统环境变量的使用
    FILENAME           awk浏览的文件名
    FNR                浏览文件的记录数
    FS                 设置输入域分隔符,等价于命令行 -F选项
    NF                 浏览记录的域的个数
    NR                 已读的记录数
    OFS                输出域分隔符
    ORS                输出记录分隔符
    RS                 控制记录分隔符
    $0变量是指整条记录。$1表示当前行的第一个域,$2表示当前行的第二个域,......以此类推。
    $NF是number finally,表示最后一列的信息,跟变量NF是有区别的,变量NF统计的是每行列的总数

    awk 替换后写入文件awk的sub/gsub函数用来替换字符串

    1
    sub(/regexp/, replacement, target)

    注意第三个参数target,如果忽略则使用$0作为参数,即整行文本。

    例子1:替换单个串

    只把每行的第一个AAAA替换为BBBB

    1
    awk '{ sub(/AAAA/,"BBBB"); print $0 }' t.txt

    例子2:替换所有的串

    把每一行的所有AAAA替换为BBBB

    1
    awk '{ gsub(/AAAA/,"BBBB"); print $0 }' t.txt

    例子3:替换满足条件的行的串

    只在出现字符串CCCC的前提下,将行中所有AAAA替换为BBBB

    1
    2
    3
    awk '/CCCC/ { gsub(/AAAA/,"BBBB"); print $0; next }
                { print $0 }
        ' t.txt

    例子4:替换多个可选串

    不管是AAAA,还是CCCC,全部替换为BBBB

    1
    awk '{ gsub(/AAAA|aaaa/,"BBBB"); print $0 }' t.txt

    例子5:全字匹配替换

    全字匹配AAAA;即不匹配AAA,以及AAAAA,也就是说完整的四个字符串AAAA。

    1
    awk '{ sub(/\<AAAA\>/,"BBBB"); print $0 }' t.txt

    例子6:规则表达式匹配

    把所有以A开头,不管后面连续包含几个A的串替换成一个字符B。

    1
    awk '{ gsub(/^A*/,"B"); print $0 }' t.txt

    awk 替换后写入文件

    1
    awk '{gsub(/tomcat/,"tomcatxxxx"); print $0 }' content.txt > test.tmp && mv test.tmp content2.txt

    替换满足条件的行的串

    awk '/release/ { gsub(/false/,"true"); print $0; next }{ print $0 }' /home/yang/src/config.js > /home/yang/src/config.tmp && mv /home/yang/src/config.tmp /home/yang/src/config.js

  • 相关阅读:
    由于可能不会将凭据发送到远程计算机,因此将不会进行连接。若要获得协助,请与您的系统管理员联系。
    URL编码与解码
    linux服务器openjdk11环境easypoi导出excel报错(class sun.font.CompositeFont cannot be cast to class sun.font.PhysicalFont)
    解决Drools中文乱码
    CISSP-什么是安全冠军以及您为什么需要安全冠军
    windows环境中JDK环境变量配置
    【Django】定时任务
    【Django】权限之has_perm
    一些连接
    数据库
  • 原文地址:https://www.cnblogs.com/yangzp/p/15608966.html
Copyright © 2020-2023  润新知