1.通配符
.能够匹配任意字符
2.特殊字符转义
例如想要匹配baidu.com的正确做法应该讲正则表达式写成baidu//.com
3.字符集
[a-z]表示能匹配a到z之间的字母[a-z0-9]表示能匹配小写字母和数字
翻转字符集就是在之前加上^,[^abc]表示能匹配除了abc之外的字符
4.选择符
只想匹配两"abc"和"ade"两个字符串可以写成'abc|ade'
5.子模式
前例可以写成a(ba|de)
在子模式后面加上问号,它就变成了可选项。它可能出现在匹配字符串,但并非必须的。
5.可选项
对子模式后面加?就变成了可选项
r’(heep://)?(www.)?python.org’
只能匹配下列字符:
‘http://www.python.org’
‘http://python.org’
‘www.python.org’
‘python.org’
6.重复子模式
(pattern)* : 允许模式重复0次或多次
(pattern)+ : 允许模式重复1次或多次
(pattern){m,n} : 允许模式重复m~ n 次
例如:
r’w * .python.org’ 匹配 ‘www.python.org’ 、’.python.org’ 、’wwwwwww.python.org’
r’w + .python.org’ 匹配 ‘w.python.org’ ;但不能匹配 ’.python.org’
r’w {3,4}.python.org’ 只能匹配‘www.python.org’ 和‘wwww.python.org’