写在前面
正则表达式
正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、以及这些特定字符的组合,组成一个“规则字符串”,这个规则字符串用来表达对字符串的一种过滤逻辑,在Python用re模块实现。
在线正则表达式工具
元字符
元字符就是指那些在正则表达式中具有特殊意义的专用字符,可以用来写匹配的规则。
1.常用元字符
元字符 | 描述 |
---|---|
^ | 匹配以什么字符开始 |
$ | 匹配以什么字符结束 |
. | 匹配任意除换行符" "外的字符 |
d | 匹配数字 0-9 |
D | 匹配非数字 |
s | 匹配任何空白字符 空格 f v |
S | 匹配除了空白符以外的任一字符 |
w | 匹配包括下划线在内的任何字字符 |
W | 匹配非字母字符,即匹配特殊字符 |
2.限定符
限定符 | 描述 |
---|---|
? | 匹配前面的字符零次或一次 |
+ | 匹配前面的字符一次或者多次 |
* | 匹配前面的字符零次或者多次 |
{n} | 匹配前面的字符n次 |
{n,} | 匹配前面的字符最少n次 |
{n,m} | 匹配前面的字符最少n次,最多m次 |
3.排除字符和选择字符
字符 | 描述 |
---|---|
[ ] | 匹配 [ ] 中的任意一个字符 |
[ ^ ] | 匹配除了 [ ] 中的任意一个字符 |
| | 匹配一个或者另一个字符 |
4.转义字符和分组
字符 | 描述 |
---|---|
将字符串中含有特殊字符进行转义,使其称为普通字符串的一部分 | |
() | 改变限定符的作用范围,和进行分组 |
r或者R | 使 的转义功能失效 |