• linux


    1. grep是linux中的文本处理工具
    2. grep家族总共有三个 : grep , egrep , fgrep
    3. grep命令的常见格式为: grep [选项]  “模式” [文件]  例如 grep –w  “.{0,2}sh” /etc/passwd     .下面依次介绍 选项和模式怎么设定
    4. 常见选项
      1. -E : 开启扩展(Extend)的正则表达式。
      2. -i :忽略大小写(ignore case)。
      3. -v :反过来(invert),只打印没有匹配的,而匹配的反而不打印。
      4. -n :显示行号
      5. -w :被匹配的文本只能是单词,而不能是单词中的某一部分,如文本中有liker,而我搜寻的只是like,就可以使用-w选项来避免匹配liker
      6. -c :显示总共有多少行被匹配到了,而不是显示被匹配到的内容,注意如果同时使用-cv选项是显示有多少行没有被匹配到。
      7. -o :只显示被模式匹配到的字符串。
      8. --color :将匹配到的内容以颜色高亮显示。
      9. -A  n:显示匹配到的字符串所在的行及其后n行,after
      10. -B  n:显示匹配到的字符串所在的行及其前n行,before
      11. -C  n:显示匹配到的字符串所在的行及其前后各n行,context
    5. 模式部分
      1. 直接输入要匹配的字符串,这个可以用fgrep(fast grep)代替来提高查找速度,比如我要匹配一下hello.c文件中printf的个数:fgrep  -c  "printf"  hello.c
      2. 使用基本正则表达式,下面谈关于基本正则表达式的使用:
        1. 匹配字符:
          1. . :任意一个字符。
          2.  [abc] :表示匹配一个字符,这个字符必须是abc中的一个。
          3. [a-zA-Z] :表示匹配一个字符,这个字符必须是a-z或A-Z这52个字母中的一个。
          4. [^123] :匹配一个字符,这个字符是除了1、2、3以外的所有字符。
          5. 对于一些常见的字符集,系统做了定义
          6. [A-Za-z] 等价于 [[:alpha:]]
          7. [0-9] 等价于 [[:digit:]]
          8. [A-Za-z0-9] 等价于 [[:alnum:]]
          9. tab,space 等空白字符 [[:space:]]
          10. [A-Z] 等价于 [[:upper:]]
          11. [a-z] 等价于 [[:lower:]]
          12. 标点符号 [[:punct:]]
        2. 匹配次数
          1. {m,n} :匹配其前面出现的字符至少m次,至多n次。是转义字符。
          2. ? :匹配其前面出现的内容0次或1次,等价于{0,1}。
          3. * :匹配其前面出现的内容任意次,等价于{0,},所以 ".*" 表述任意字符任意次,即无论什么内容全部匹配。
        3. 位置锚定
          1. ^ :锚定行首
          2. $ :锚定行尾。技巧:"^$"用于匹配空白行。
          3. 或<:锚定单词的词首。如"like"不会匹配alike,但是会匹配liker
          4. 或>:锚定单词的词尾。如"like"不会匹配alike和liker,只会匹配like
          5. B :与作用相反。
        4. 分组及引用
          1. (string) :将string作为一个整体方便后面引用
          2. 1 :引用第1个左括号及其对应的右括号所匹配的内容。
          3. 2 :引用第2个左括号及其对应的右括号所匹配的内容。
          4. :引用第n个左括号及其对应的右括号所匹配的内容。
    6. 扩展的正则表达式。(注意要使用扩展的正则表达式要加-E选项,或者直接使用egrep):
      1. 匹配字符:这部分和基本正则表达式一样
      2. 匹配次数
        1. * :和基本正则表达式一样
        2. ? :基本正则表达式是?,二这里没有。
        3. {m,n} :相比基本正则表达式也是没有了 。
        4. + :匹配其前面的字符至少一次,相当于{1,}。
      3. 位置锚定:和基本正则表达式一样。
      4. 分组及引用
        1. (string) :相比基本正则表达式也是没有了。
        2. 1 :引用部分和基本正则表达式一样。
        3. :引用部分和基本正则表达式一样。
      5. a|b :匹配a或b,注意a是指 | 的左边的整体,b也同理。比如 C|cat 表示的是 C或cat,而不是Cat或cat,如果要表示Cat或cat,则应该写为 (C|c)at 。记住(string)除了用于引用还用于分组。
    7. 注意:
      1. 默认情况下,正则表达式的匹配工作在贪婪模式下,也就是说它会尽可能长地去匹配,比如某一行有字符串 abacb,如果搜索内容为 "a.*b" 那么会直接匹配 abacb这个串,而不会只匹配ab或acb。
      2. 所有的正则字符,如 [ 、* 、( 等,若要搜索 * ,而不是想把 * 解释为重复先前字符任意次,可以使用 * 来转义。
  • 相关阅读:
    andorid(3) 使用sqllite进行数据持久化
    android(1)--hello world中的layout与 onCreate()
    android(2)--listView
    linux 常用指令
    关于虚拟内存、驻留内存与共享内存——virt res shr之间的关系
    base64 和 md5
    python阿里云短信服务
    python邮件发送
    算法
    python3 字典
  • 原文地址:https://www.cnblogs.com/cyj1258/p/12186245.html
Copyright © 2020-2023  润新知