• awk从放弃到入门(2):awk分隔符


    一、awk分隔符

      awk的默认分割符是空格,但是,这样描述并不精确,因为,awk的分隔符还分为两种,"输入分隔符" 和 "输出分隔符" 。

      (1)输入分隔符:英文原文为field separator,此处简称为FS。默认是空白字符(即空格),awk默认以空白字符为分隔符对每一行进行分割。

      (2)输出分割符:英文原文为output field separator,此处简称为OFS。awk将每行分割后,输出在屏幕上的时候,以什么字符作为分隔符,awk默认的输出分割符也是空格。

    二、输入分隔符(FS)

      输入分隔符比较容易理解,当awk逐行处理文本的时候,以输入分隔符为准,将文本切成多个片段,默认使用空格,但是,如果一段文字中没有空格,我们可以指定以特定的文字或符号作为输入分割符,比如下图中的例子,我们指定使用"#"作为输入分隔符。

    上图中,我们使用了-F 选项,指定了使用#号作为输入分隔符,于是,awk将每一行都通过#号为我们分割了。

    除了使用 -F 选项指定输入分隔符,还能够通过设置内部变量的方式,指定awk的输入分隔符,awk内置变量FS可以用于指定输入分隔符,但是在使用变量时,需要使用-v选项,用于指定对应的变量,比如 -v FS='#',如下图:

    其实不管是通过-F选项,还是通过FS这个内置变量,目的都是设置指定的输入分隔符,达到的效果是相同的。

    而此处,我们使用了awk中的一个选项,就是-F,还记得我们之前总结的awk的使用语法吗。我们说过,awk的语法如下:awk [options] 'Pattern{Action}' file    而-F,就是options的一种,用于指定输入分隔符。-v也是options的一种,用于设置变量的值。再结合之前的文章,我们已经将options 、pattern 、action都简单的应用了一遍,好了,我们已经"会用"awk了。

     三、输出分隔符(OFS)

       awk将每行分割后,输出在屏幕上的时候,以什么字符作为分隔符,就叫做输出分隔符。

      3.1使用awk的内置变量OFS来设定awk的输出分隔符,当然,使用变量的时候要配合使用-v选项,示例如下:

      3.1-1问题:如果文本文件中的分隔符为#,但是系统默认输入分隔符为空格,就会产生如下问题:解决方法就是同时指定输入、输出分隔符。

      3.2同时指定输入分隔符和输出分割符,示例如下:

    或者

      3.3输出时合并显示(不使用输出分隔符分开显示)

    awk '{print $1 $2}' 表示每行分割后,将第一列(第一个字段)和第二列(第二个字段)连接在一起输出。

    awk '{print $1,$2}' 表示每行分割后,将第一列(第一个字段)和第二列(第二个字段)以输出分隔符隔开后显示。

     【参考文章:http://www.zsythink.net/archives/1357】

  • 相关阅读:
    进程同步&&进程互斥
    CHAP4 字符串和格式化输入输出
    记录学习到的内容
    数据链路层 差错控制
    二叉树的顺序存储
    Java复习笔记
    Stream流
    函数式接口
    网络编程
    接口,多态,抽象类总结
  • 原文地址:https://www.cnblogs.com/python-wen/p/10776722.html
Copyright © 2020-2023  润新知