扩展正则表达式
事实上,一般实验者只需要熟悉基础的正则表达式就足够了。不过有时候为了简化命令操作,了解一些使用范围更广的扩展表达式,会更加方便。
一、简单对比
正规表示法:
$ grep -v '^$' regular_express.txt |grep -v '^#'
需要使用到管线命令来搜寻两次! 那么如果使用延伸型的正规表示法,我们可以简化为:
$ egrep -v '^$|^#' regular_express.txt
利用支持延伸型正规表示法的 egrep 与特殊字符 “|” 的组功能来区隔两组字符串,如此一来,是否方便很多呢?
此外,grep 默认仅支持基础正则表达式,如果要使用扩展性正则表达式,可以使用 grep - E。grep -E 与 egrep 相当于命令别名关系。
二、扩展规则
1、 + :表示重复一个或一个以上的前一个 RE 字符
$ egrep -n 'go+d' regular_express.txt
普通写法:
$ grep -n 'goo*d' regular_express.txt
2、 ? : 表示重复零个或一个前一个 RE 字符
$ egrep -n 'go?d' regular_express.txt
操作截图:
上述三条命令结果如上,发现 ‘goo*d’ 与 ‘go+d’ 等同,而 ‘go?d’ 结果不同。
3、 | :表示用或的方式找出数个字符串
$ egrep -n 'gd|good' regular_express.txt
4、 () : 表示找出群组字符串
$ egrep -n 'g(la|oo)d' regular_express.txt
也就是搜寻(glad)或 good 这两个字符串
操作截图:
5、()+ : 多个重复群组判别
$ echo 'AxyzxyzxyzxyzC'|egrep 'A(xyz)+C'
$ echo 'AxyzxyzxyzxyzC'|egrep 'A(xz)+C'
也就是要找开头是 A 结尾是 C 中间有一个以上的 ‘xyz’ 或 ‘xz’ 字符串的意思。
结果显示 ‘A(xyz)+C’ 可以匹配, ‘A(xz)+C’ 没有匹配项。
操作截图: