例一:
正则:(?<=(href|src|filepath)=)S+?(.jpg|.JPG)
解析:表达式分为三段
第一段:
(?<=(href|src|filepath)=) 获取开始的位置 意思是从 以href=、src=、filepath=这三个字符开头的地方以后开始匹配。
使用的正则为(?<=pattern),假如没有<那么就从该字符开始匹配.
第二段:
S+? 中间的配置字符。注意?表示最小匹配,也就是说往后第一个匹配的。
第三段:
(.jpg|.JPG) 结束的字符 意思是 以.jpg或者.JPG结尾的位置。
这个表达式可以用来获取href或者src或者filepath后面的地址。
比如 <href=http://avatar.csdn.net/8/3/2/1_xanxus46.jpg></href> //已经去掉了双引号了
匹配结果为http://avatar.csdn.net/8/3/2/1_xanxus46.jpg
例二
正则:(.)\1(.)\2
用到的表达式
um
匹配num,其中num是一个正整数。对所获取的匹配的引用。例如,“(.)1”匹配两个连续的相同字符。
解析:匹配两个(可以相同)重复的字符,
比如: htttpp
匹配结果 ttpp (不相同)
httttpp匹配的结果为 tttt(相同)