正则表达式:就是通过指定的规则去匹配你想要的字符串(一种用表达式对字符串进行匹配的语法规则)
元字符:具有固定含义的特殊字符:
常用元字符:
. 匹配换行符以外的任意字符
w 匹配字母数字下划线
s 任意空白符
d 任意数字
换行符
制表符
^ 字符串开始
$ 字符串结尾
W 匹配非字母数字下划线
S 任意非空白符
D 任意非数字
a|b a或者b
() 分组
[..] 字符集,例如[1-9]
[^...] 匹配除了字符集中的所有字符
量词:控制元字符出现的次数
常用量词:
* 0或更多次
+ 1次或更多次
? 0或1次
{n} 重复n次
{n,} 重复n或更多次
{n,m} 重复n到m次
贪婪匹配与惰性匹配:
.* 贪婪匹配
.*? 惰性匹配
贪婪匹配:尽可能多的匹配
惰性匹配:尽可能少的匹配