• 关于sed中的Pattern Space和Hold Space的随笔


    首先是一部分概念和示例,这部分转自:http://coolshell.cn/articles/9104.html
    Pattern Space
    第零个是关于-n参数的,大家也许没看懂,没关系,我们来看一下sed处理文本的伪代码,并了解一下Pattern Space的概念:
     
    1. foreach line in file {
    2. //放入把行Pattern_Space
    3. Pattern_Space <= line;
    4. // 对每个pattern space执行sed命令
    5. Pattern_Space <= EXEC(sed_cmd, Pattern_Space);
    6. // 如果没有指定 -n 则输出处理后的Pattern_Space
    7. if (sed option hasn't "-n") {
    8.   print Pattern_Space
    9. }
    10. }
    Address
    第一个是关于address,几乎上述所有的命令都是这样的(注:其中的!表示匹配成功后是否执行命令) 
    [address[,address]][!]{cmd} 
    address可以是一个数字,也可以是一个模式,你可以通过逗号要分隔两个address 表示两个address的区间,参执行命令cmd,伪代码如下:
     
    1. bool bexec = false
    2. foreach line in file {
    3. if ( match(address1) ){
    4. bexec = true;
    5. }
    6. if ( bexec == true) {
    7. EXEC(sed_cmd);
    8. }
    9. if ( match (address2) ) {
    10. bexec = false;
    11. }
    12. }

    关于address可以使用相对位置,如:

     
    1. # 其中的+3表示后面连续3行
    2. $ sed '/dog/,+3s/^/# /g' pets.txt
    3. This is my cat
    4. my cat's name is betty
    5. # This is my dog
    6. # my dog's name is frank
    7. # This is my fish
    8. # my fish's name is george
    9. This is my goat
    10. my goat's name is adam
    命令打包
    cmd可以是多个,它们可以用分号分开,可以用大括号括起来作为嵌套命令。下面是几个例子:
     
    1. $ cat pets.txt
    2. This is my cat
    3. my cat's name is betty
    4. This is my dog
    5. my dog's name is frank
    6. This is my fish
    7. my fish's name is george
    8. This is my goat
    9. my goat's name is adam
    10. # 对3行到第6行,执行命令/This/d
    11. $ sed '3,6 {/This/d}' pets.txt
    12. This is my cat
    13. my cat's name is betty
    14. my dog's name is frank
    15. my fish's name is george
    16. This is my goat
    17. my goat's name is adam
    18. # 对3行到第6行,匹配/This/成功后,再匹配/fish/,成功后执行d命令
    19. $ sed '3,6 {/This/{/fish/d}}' pets.txt
    20. This is my cat
    21. my cat's name is betty
    22. This is my dog
    23. my dog's name is frank
    24. my fish's name is george
    25. This is my goat
    26. my goat's name is adam
    27. # 从第一行到最后一行,如果匹配到This,则删除之;如果前面有空格,则去除空格
    28. $ sed '1,${/This/d;s/^ *//g}' pets.txt
    29. my cat's name is betty
    30. my dog's name is frank
    31. my fish's name is george
    32. my goat's name is adam
    Hold Space
    接下来,我们需要了解一下Hold Space的概念,我们先来看四个命令:

    g: 将hold space中的内容拷贝到pattern space中,原来pattern space里的内容清除 
    G: 将hold space中的内容append到pattern space 后 
    h: 将pattern space中的内容拷贝到hold space中,原来的hold space里的内容被清除 
    H: 将pattern space中的内容append到hold space 后 
    x: 交换pattern space和hold space的内容

    这些命令有什么用?我们来看两个示例吧,用到的示例文件是:

     
    1. $ cat t.txt
    2. one
    3. two
    4. three

    第一个示例:

     
    1. $ sed 'H;g' t.txt
    2. one
    3. one
    4. two
    5. one
    6. two
    7. three

    是不是有点没看懂,我作个图你就看懂了。 
    此处输入图片的描述

    第二个示例,反序了一个文件的行:

     
    1. $ sed '1!G;h;$!d' t.txt
    2. three
    3. two
    4. one

    其中的 ‘1!G;h;$!d’ 可拆解为三个命令

    1!G —— 只有第一行不执行G命令,将hold space中的内容append回到pattern space 
    h —— 第一行都执行h命令,将pattern space中的内容拷贝到hold space中 
    $!d —— 除了最后一行不执行d命令,其它行都执行d命令,删除当前行 
    如图: 
    此处输入图片的描述

     

     

    附上自己的一点理解:sed有P区(Pattern space)和H区(Hold space),每读取一行就会把内容放入P区,这时如果我们想对之前对内容做些操作,就需要用到H区用于暂存一些数据。

    拿上面最后一个图来说,读取第一行,读取one到P区,然后h命令放到H区;

    后面依次读取到P区,然后追加到H区,删除P区是为了不输出内容;

    读到最后一行,把数据追加到H区,然后用H区的内容替换掉P区,最后输出P区的内容。

     

  • 相关阅读:
    【2021-05-18】人生十三信条
    【2021-05-17】打了第一针疫苗
    【2021-05-16】该工作时好好工作,该休息时好好休息
    【2021-05-15】人生十三信条
    【2021-05-14】要保持团队作战的模式
    【2021-05-13】罗马不是一天能建成的
    【2021-05-12】己所不欲勿施于人
    【2021-05-11】服务好了别人,也就服务好了自己
    二维区域和检索
    寻找重复数
  • 原文地址:https://www.cnblogs.com/aboutblank/p/4793423.html
Copyright © 2020-2023  润新知