re模块正则表达式
一、元字符
1、. ^ $ * + ? { } [ ] | ( )
"." 代表(任意一个字符) "*" 代表(任意数量任意字符,0-无穷) "+" 代表(任意一个或无数字符,1-无穷) "?" 代表(0或1个字符) "^" 代表(字符串开头) "$" 代表(字符串结尾) "{}" 代表(指定次数)
2、转义符
1)、反斜杠后边跟元字符去除特殊功能,比如.
2)、反斜杠后边跟普通字符实现特殊功能,比如d
d 匹配任何十进制数; 它相当于类 [0-9]。 D 匹配任何非数字字符; 它相当于类 [^0-9]。 s 匹配任何空白字符; 它相当于类 [ fv]。 S 匹配任何非空白字符; 它相当于类 [^ fv]。 w 匹配任何字母数字字符; 它相当于类 [a-zA-Z0-9_]。 W 匹配任何非字母数字字符; 它相当于类 [^a-zA-Z0-9_] 匹配一个特殊字符边界,比如空格 ,&,#等
3、分组 ()
ret = re.findall("(yuan)+","lalal11yuanhao22yuanyuanhaohao33yuan") #分组(),用findall命令返回的是分组内容 print(ret) #['yuan', 'yuan', 'yuan']