re模块（详解正则）

re模块

imort re

1、w　　W

print(re.findall('w','ab 12+- _*&')) #w 匹配字母 数字 及下划线

执行结果：['a', 'b', '1', '2', '_']

print(re.findall('W','ab 12+- _*&')) #w 匹配非字母 数字 及下划线

执行结果：[' ', '\', '+', '-', ' ', '*', '&']

2、s　　S

print(re.findall('s','ab 12+- _*&')) #s 匹配任意空白字符，等价于[	

f]

执行结果：[' ', ' ']

print(re.findall('S','ab 12+- _*&')) #s 匹配非空白字符

执行结果：['a', 'b', '1', '2', '\', '+', '-', '_', '*', '&']

3、d　　D

print(re.findall('d','ab 12+- _*&')) #s 匹配任意数字，等价于[0-9]

执行结果：['1', '2']

print(re.findall('D','ab 12+- _*&')) #s 匹配非数字

执行结果：['a', 'b', ' ', '\', '+', '-', ' ', '_', '*', '&']

综合：

print(re.findall('w_sb','egon alex_sb12332wxx_sb,lxx_sb'))

执行结果：['x_sb', 'x_sb', 'x_sb']

4、A 基本上不用

print(re.findall('Aalex','alex isalex sb'))#从头开始匹配只匹配第一个alex

执行结果：['alex']

print(re.findall('alex','alex isalex sb'))

执行结果：['alex', 'alex']

5、^

print(re.findall('^alex','alex is salexb'))#从头开始匹配，匹配到第一个则不往后匹配

执行结果：['alex']

print(re.findall('sb','alexsb is sbalexsb'))#从头开始匹配，匹配所有

执行结果：['sb', 'sb', 'sb']

print(re.findall('^sb','alexsb is sbalexsb'))#从头开始匹配,第一个没有则不往后面匹配

执行结果：[]

6、　　$

print(re.findall('sb','alexsb is sbalexsb'))#从尾部开始匹配,匹配到则不往前匹配

执行结果：['sb']

print(re.findall('sb$','alexsb is sbalexsb'))#从尾部开始匹配,匹配到则不往前匹配

执行结果：['sb']

综合：

print(re.findall('^ebn$','ebn'))#从头开始找，正反找都是ebn，都可以匹配上

执行结果：['ebn']

7、　　　　(同理)

print(re.findall('
','a
c a	c al
c'))#匹配到

执行结果：['
', '
']

print(re.findall('a
c','a
c a	c al
c'))#匹配到['a
c']

执行结果：['a
c']

重复匹配:　　.　　?　　*　　+　　{m,n}　　.*　　.*?

1、.　　：代表除了换行符外的任意一个字符

print(re.findall('a.c','abc alc aAsc aaaaaac'))#匹配以a开头以c结尾.代表中间的任意一个字符

执行结果：['abc', 'alc', 'aac']

print(re.findall('a.c','abc alc aAc aaaaaa
c'))#ac中间有换行符
所以匹配不到a
c

执行结果：['abc', 'alc', 'aAc']

print(re.findall('a.c','abc alc aAsc aaaaaa
c',re.DOTALL))#.能匹配ac中间的所有一个字符,包括

执行结果：['abc', 'alc', 'a
c']

2、?　　：代表左边那一个字符重复0次或1次

print(re.findall('ab?','a ab abb abbb abbbb abbbbb albbbbb'))#从头匹配ab中，b是零个或一个

执行结果：['a', 'ab', 'ab', 'ab', 'ab', 'ab', 'a']

3、*　　：代表左边那一个字符出现0次或无穷次

print(re.findall('ab*','a ab abb abbb abbbb abbbbb albbbbbbb'))#从头匹配ab中，b是零个或无穷个

执行结果：['a', 'ab', 'abb', 'abbb', 'abbbb', 'abbbbb', 'a']

4、+　　：代表左边那一个字符出现至少一次或无穷次

print(re.findall('ab+','a ab abb abbb abbbb abbbbb albbbbbbb'))#从头匹配ab中，b是一个或无穷个

执行结果：['ab', 'abb', 'abbb', 'abbbb', 'abbbbb']

5、{m,n}　　：代表左边那一个字符出现m次到n次

print(re.findall('ab?','a ab abb abbb abbbb abbbbb  albbbbbb'))
print(re.findall('ab{0,1}','a ab abb abbb abbbb abbbbb albbbbbb'))

执行结果：['a', 'ab', 'ab', 'ab', 'ab', 'ab', 'a'] , ['a', 'ab', 'ab', 'ab', 'ab', 'ab', 'a']

print(re.findall('ab*','a ab abb abbb abbbb abbbbb albbbbbbb'))
print(re.findall('ab{0,}','a ab abb abbb abbbb abbbbb albbbbbbb'))

执行结果：['a', 'ab', 'abb', 'abbb', 'abbbb', 'abbbbb', 'a'] , ['a', 'ab', 'abb', 'abbb', 'abbbb', 'abbbbb', 'a']

print(re.findall('ab+','a ab abb abbb abbbb abbbbb albbbbbbb'))
print(re.findall('ab{1,}','a ab abb abbb abbbb abbbbb albbbbbbb'))

执行结果：['ab', 'abb', 'abbb', 'abbbb', 'abbbbb'] ， ['ab', 'abb', 'abbb', 'abbbb', 'abbbbb']

print(re.findall('ab{1,3}','a ab abb abbb abbbb abbbbb albbbbbbb'))

执行结果：['ab', 'abb', 'abbb', 'abbb', 'abbb']

6、.*　　:匹配任意长度，任意的字符=====》贪婪匹配

print(re.findall('a.*c','ac a123c  aaaac a * 123) ()c asdfsdfkjdls'))#尽可能长的匹配

执行结果：['ac a123c  aaaac a * 123) ()c']

7、.*?　　:非贪婪匹配

print(re.findall('a.*?c','a123c456c'))#尽可能短的匹配

执行结果：['a123c']

8、()　　:分组

print(re.findall('(alex)_sb','alex_sb sfksdfksdalex_sb'))#在匹配到的情况下只留括号内的内容

执行结果：['alex', 'alex']

例子：非贪婪匹配到网址

print(re.findall('href="(.*?)"','<li><a id="blog_nav_sitehome" class="menu" href="https://www.cnblogs.com/happyfei/">博客园</a></li>'))

执行结果：['https://www.cnblogs.com/happyfei/']

9、[]　　:匹配一个指定范围内的字符（这一字符来自于括号内定义的）

print(re.findall('a[0-9]c','a1c a+c a2c a9c a*c a11c a-c acc aAc '))#-号在[]内有特殊意义，如果要匹配带-号的，-号要放在最前面或最后面

执行结果：['a1c', 'a2c', 'a9c']

print(re.findall('a[-+*]c','a1c a+c a2c a9c a*c a11c a-c acc aAc '))

执行结果：['a+c', 'a*c', 'a-c']

print(re.findall('a[a-zA-Z]c','a1c a+c a2c a9c a*c a11c a-c acc aAc '))

执行结果：['acc', 'aAc']

print(re.findall('a[^a-zA-Z]c','a c a1c a+c a2c a9c a*c a11c a-c acc aAc '))#[]内的^代表取反的意思

执行结果：['a c', 'a1c', 'a+c', 'a2c', 'a9c', 'a*c', 'a-c']

例子：取出_sb

print(re.findall('[a-z]_sb','egon alex_sb12332wxx_sb,lxx_sb'))#[]匹配一个字符后面跟_sb

执行结果：['x_sb', 'x_sb', 'x_sb']

print(re.findall('[a-z]+_sb','egon alex_sb12332wxxxxx_sb,lxx_sb'))#[]+匹配多个字符后面跟_sb

执行结果：['alex_sb', 'wxxxxx_sb', 'lxx_sb']

print(re.findall('([a-z]+)_sb','egon alex_sb12332wxxxxx_sb,lxx_sb'))#只取到_sb的人名

执行结果：['alex', 'wxxxxx', 'lxx']

10、|　　:代表或者

print(re.findall('compan(ies|y)','Too many companies have gone bankrupt, and the next none is my company'))#取出公司的英文单词

执行结果：['ies', 'y']

注：（？：代表取匹配成功的所有内容，而不仅仅只是括号内的内容）

print(re.findall('compan(?:ies|y)','Too many companies have gone bankrupt, and the next none is my company'))

执行结果：['companies', 'company']

print(re.findall('alex|sb','alex sb ssdfsdf  alex sb egon'))

执行结果：['alex', 'sb', 'alex', 'sb']

11、re模块的其他用法

 1 print(re.findall('alex|sb','123123 alex sb sdlfjlsdkegon alex sb egon'))
 2 print(re.search('alex|sb','123123 alex sb sdlfjlsdkegon alex sb egon').group())
 3 #执行结果：['alex', 'sb', 'alex', 'sb'] , alex
 4 
 5 
 6 print(re.search('^alex','alex sb sdlfjlsdkegon alex sb egon').group())#表示从头开始匹配
 7 print(re.match('alex','alex sb sdlfjlsdkegon alex sb egon').group())#表示从头开始匹配
 8 #执行结果：alex , alex
 9 
10 
11 info='a:b:c:d'
12 print(info.split(':'))
13 print(re.split(':',info))
14 #执行结果：['a', 'b', 'c', 'd'] ， ['a', 'b', 'c', 'd']
15 
16 info='a :cd/e'
17 print(re.split('[ :\/]',info))
18 #执行结果：['a', '', 'c', 'd', 'e']
19 
20 #需求：xxx与Sb调换
21 print(re.sub('(xxx)(.*?)(SB)',r'321',r'xxx is SB'))
22 #执行结果：SB is xxx
23 
24 print(re.sub('([a-zA-Z]+)([^a-zA-Z]+)([a-zA-Z]+)([^a-zA-Z]+)([a-zA-Z]+)',r'52341',r'xxx123+ is SB'))
25 #执行结果：SB123+ is xxx
26 
27 pattern=re.compile('alex')#把常用的正则表达式式存起来，以后直接用
28 print(pattern.findall('alex is alex sdjflk alexalex'))
29 #执行结果：['alex', 'alex', 'alex', 'alex']

2018-08-18 19:20:32

相关阅读:
web安全性测试用例
 Postman界面介绍及实例（转）
基于RFS(robot framework selenium)框架模拟POST/GET请求执行自动化接口测试
 python 将list中的元素按字母排序
 Python操作字典取Key对应的值
 excel的常用工具类
 事务隔离机制
 如何上传附件
 sql函数认识
 对导出poi报表的更深层次了解
原文地址：https://www.cnblogs.com/happyfei/p/9498322.html

re模块（详解正则）

re模块

1、w W

2、s S

3、d D

综合：

4、A 基本上不用

5、^

6、 $

综合：

7、 (同理)

重复匹配: . ? * + {m,n} .* .*?

1、. ：代表除了换行符外的任意一个字符

2、? ：代表左边那一个字符重复0次或1次

3、* ：代表左边那一个字符出现0次或无穷次

4、+ ：代表左边那一个字符出现至少一次或无穷次

5、{m,n} ：代表左边那一个字符出现m次到n次

6、.* :匹配任意长度，任意的字符=====》贪婪匹配

7、.*? :非贪婪匹配

8、() :分组

例子：非贪婪匹配到网址

9、[] :匹配一个指定范围内的字符（这一字符来自于括号内定义的）

例子：取出_sb

10、| :代表或者

11、re模块的其他用法

1、w　　W

2、s　　S

3、d　　D

6、　　$

7、　　　　(同理)

重复匹配:　　.　　?　　*　　+　　{m,n}　　.*　　.*?

1、.　　：代表除了换行符外的任意一个字符

2、?　　：代表左边那一个字符重复0次或1次

3、*　　：代表左边那一个字符出现0次或无穷次

4、+　　：代表左边那一个字符出现至少一次或无穷次

5、{m,n}　　：代表左边那一个字符出现m次到n次

6、.*　　:匹配任意长度，任意的字符=====》贪婪匹配

7、.*?　　:非贪婪匹配

8、()　　:分组

9、[]　　:匹配一个指定范围内的字符（这一字符来自于括号内定义的）

10、|　　:代表或者