字符
一,正则表达式的单字符匹配
字符 | 功能 | 示例 | 结果 |
. | 匹配任意1个字符(除了 ) |
|
|
[] | 匹配[ ]中列举的字符 |
|
'7' |
d | 匹配数字,即[0-9] |
|
'嫦娥2号' |
D | 匹配非数字,即不是数字 [^d] |
|
'abc' |
s | 匹配空白,即 空格,tab键 [<空格> fv] |
|
'a c' |
S | 匹配非空白 [^S] |
|
'abc' |
w | 匹配单词字符,即a-z、A-Z、0-9、_ [a-zA-Z0-9_] |
|
'abc' |
W | 匹配非单词字符 [^w] |
|
'a c' |
二,原生字符串
与大多数编程语言相同,正则表达式里使用""作为转义字符
,这就可能造成反斜杠困扰。假如你需要匹配文本中的字符"",那么使用编程语言表示的正则表达式里将需要4个反斜杠"\":前两个和后两个分别用于在编程语言里转义成反斜杠,转换成两个反斜杠后再在正则表达式里转义成一个反斜杠。
Python里的原生字符串很好地解决了这个问题,有了原始字符串,你再也不用担心是不是漏写了反斜杠,写出来的表达式也更直观。
ret = re.match(r"c:\a",mm).group() print(ret) 结果:c:a