首先,推荐一个在线的正则网站,可用作学习与测试。支持php、pecl、js、python、golang. https://regex101.com/
本文记录一些我不熟悉的正则表达式:
- id=([^;]+)(?:;|$)
解析:
1. ([^;]+) 指的是匹配除了";"以外的任意字符1次或者多次。对应的语法: [^xyz] 负值字符集合。匹配未包含的任意字符。例如,“[^abc]”可以匹配“plain”中的“plin”。
2. (?:;|$) 指的是匹配“;”或者“$”,并且不获取匹配。 对应的语法:(?:pattern) 非获取匹配,匹配pattern但不获取匹配结果,不进行存储供以后使用。这在使用或字符“(|)”来组合一个模式的各个部分时很有用。例如“industr(?:y|ies)”就是一个比“industry|industries”更简略的表达式。 - (pattern) 、(?:pattern)、(?=pattern)、(?!pattern)、(?<=pattern)、(?<!pattern)
(pattern) 匹配pattern并获取这一匹配。所获取的匹配可以从产生的Matches集合得到,在VBScript中使用SubMatches集合,在JScript中则使用$0…$9属性。要匹配圆括号字符,请使用“(”或“)”。(?:pattern)非获取匹配,匹配pattern但不获取匹配结果,不进行存储供以后使用。这在使用或字符“(|)”来组合一个模式的各个部分时很有用。例如“industr(?:y|ies)”就是一个比“industry|industries”更简略的表达式。(?=pattern)非获取匹配,正向肯定预查,在任何匹配pattern的字符串开始处匹配查找字符串,该匹配不需要获取供以后使用。例如,“Windows(?=95|98|NT|2000)”能匹配“Windows2000”中的“Windows”,但不能匹配“Windows3.1”中的“Windows”。预查不消耗字符,也就是说,在一个匹配发生后,在最后一次匹配之后立即开始下一次匹配的搜索,而不是从包含预查的字符之后开始。(?!pattern)非获取匹配,正向否定预查,在任何不匹配pattern的字符串开始处匹配查找字符串,该匹配不需要获取供以后使用。例如“Windows(?!95|98|NT|2000)”能匹配“Windows3.1”中的“Windows”,但不能匹配“Windows2000”中的“Windows”。(?<=pattern)非获取匹配,反向肯定预查,与正向肯定预查类似,只是方向相反。例如,“(?<=95|98|NT|2000)Windows”能匹配“2000Windows”中的“Windows”,但不能匹配“3.1Windows”中的“Windows”。(?<!pattern)非获取匹配,反向否定预查,与正向否定预查类似,只是方向相反。例如“(?<!95|98|NT|2000)Windows”能匹配“3.1Windows”中的“Windows”,但不能匹配“2000Windows”中的“Windows”。这个地方不正确,有问题此处用或任意一项都不能超过2位,如“(?<!95|98|NT|20)Windows正确,“(?<!95|980|NT|20)Windows 报错,若是单独使用则无限制,如(?<!2000)Windows 正确匹配 - ^(www.)?(?<domain>.+)$ 命名捕获(PECL)
例如: www.baidu.com
与上面的正则表达式完全匹配,并且捕获组group 1 是“www”.
有名捕获组domain 是“baidu.com”。之后就可以用$domain来使用捕获到的内容
The PCRE library supports named captures using the following syntax:?<
name
>Perl 5.10 compatible syntax, supported since PCRE-7.0 ?'
name
'Perl 5.10 compatible syntax, supported since PCRE-7.0 ?P<
name
>Python compatible syntax, supported since PCRE-4.0 - ([a-z])1+
匹配aaabbaaac中的相同的连续字符串,如aaa,bb,aaa,c
- 未完待续