everything搜索、notepad++文档搜索、网络爬虫等等,很多地方都会用到正则表达式,花点时间了解一下几个常用的:
- 元字符匹配
1-hi:匹配hi单词
2-hi.*Lucy:hi不远处跟着一个Lucy
3-0d{2}-d{8}:d,数字匹配。连续重复2次/8次
- 字符转义
如果查找* .本身就是正则表达式中的字符,需要转义,* .
- 字符重复
1-Windowsd+:匹配Windows后面跟1个或多个数字
2-^w+:一行的第一个单词
3-.*
.*:匹配任意文本(尽可能长) a.*b:匹配最长的以a开始,以b结束的字符串。
.*?:匹配任意文本(尽可能少) a.*?b:匹配最短的以a开始,以b结束的字符串。
- 结构语句
1-|:或 A | B
2-():分组,(d{1,3}.){3}d{1,3},黄色部分为第一个表达式,匹配三位数字加上一个英文句号。 与其说是分组,不如理解成:范围的划定。
- 反义语句
1-S+:匹配不包含空白符的字符串。
2-<a[^>]+>:匹配用尖括号括起来的以a开头的字符串。
其他用到再记录吧,参考:https://deerchao.net/tutorials/regex/regex.htm