休养生息 --模块03
1.正则表达式
2.在python中使用正则.re
一,正则表达式 (匹配字符串,主要是给字符串使用的)
1)元字符
. 除换行符之外
w 数字,字母,下划线组成 W 非数字,字母,下划线组成
d 数字 D 非数字
s 空白符 S 非空白符
Enter ,换行符
Tab
以xxx结尾
[] 字符组
[^xxx] 非xxx
^x 以x开头
x$ 以x结尾
a|b a或者b
2) 量词
* [0,无穷)
+ [1,无穷)
?[0,1]
{n} 出现n次
{n,} 最少出现n次
{n,m} 出现[n,m]次
3)贪婪和惰性匹配
贪婪匹配:
.*x尽可能多的从[0,无穷]取值,但结尾必须是x
.+x尽可能多的从[1,无穷]取值,但结尾必须是x
惰性匹配
.*?x 尽可能少的取到x,但是末尾必须是x
转义 : \n --> (正则前面要加r)
分组 :()
二 .在Python中使用正则.re
import re
1).re.findall('','内容')从内容中查找所有的符合要求的东西
2).re.finditer('','内容') 从内容中返回迭代器
3).re.match('','内容')从内容中找到结果返回,必须是从头开始匹配
4).re.seatch('','内容')从内容中找到结果返回,找到一个结果后就返回
5).compile() 编译
6).group() 获取数据内容
7).re.S 去掉.中的换行符,(.变成了可以匹配所有的数据)