盘点Python正则表达式中的贪婪模式和非贪婪模式

盘点Python正则表达式中的贪婪模式和非贪婪模式
大家好，我是我是皮皮。

一、前言

前几天在Python最强王者交流群有个叫【杰】的粉丝问了一个关于Python正则表达式的问题，其中涉及到Python正则表达式中的贪婪模式和非贪婪模式，讨论十分火热，这里拿出来给大家分享下，一起学习。

二、解决过程

这里分享【小王】大佬的解答，一起来看看吧，下面是他给的一个示例代码。
```
import re

txt = "This is an HTML tag: <head>HEADER</head>. It means the head of the whole HTML document."
pattern1 = re.compile(r"<.*>")
pattern2 = re.compile(r"<.*?>")
result1 = re.findall(pattern1, txt)
result2 = re.findall(pattern2, txt)
print(result1)
print(result2)
```
输出结果如下图所示：

关于输出的解析如下：

我想匹配HTML标签中的数据，也就是<>之间的数据。
```
pattern1 = re.compile(r"<.*>")
pattern2 = re.compile(r"<.*?>")
```
这两种只相差了一个?，但是区别却很大。解析如下图所示：

直到什么时候停止呢？

这个就是贪婪模式的匹配方式，那么非贪婪模式呢？

小彩蛋

分享一个【小王】大佬的代码，实现的效果是将正则匹配结果写成命名分组Python代码。

常规写法如下所示：
```
import re

txt = "This is an HTML tag: <head>HEADER</head>. It means the head of the whole HTML document."

tag = re.compile(r"<([A-Za-z0-9]+)>.*?</\1>.*")
print(re.findall(tag, txt))
```
写成命名分组的写法如下所示：
```
txt = "This is an HTML tag: <head>HEADER</head>. It means the head of the whole HTML document."

tag = re.compile(r"<(?P<tag_mark>[A-Za-z0-9]+)>.*?</(?P=tag_mark)>.*")
print(re.findall(tag, txt))
```
总结

大家好，我是皮皮。这篇文章基于粉丝提问，针对Python正则表达式中的贪婪模式和非贪婪模式问题，给出了具体说明和演示，顺利的帮助粉丝解决了问题。

最后感谢粉丝【杰】提问，感谢【小王】大佬给出的解答和示例，感谢【（这是月亮的背面）】、【dcpeng】、【wangning】、【Chloé P.】等大佬们参与学习交流。

小伙伴们，快快用实践一下吧！如果在学习过程中，有遇到任何问题，欢迎加我好友，我拉你进Python学习交流群共同探讨学习。
相关阅读:
python实战之爬取喜玛拉雅专辑信息
 python工具之exccel模板生成报表
 python模拟登录博客园（附：问题求教）
maven 三个基本插件 clean dependency compiler
oracle 安装注意
 mybatis generate 自动生成 entity dao 和 xml 文件
 mybatis 打印sql 语句
 mybatis 关联查询 association
oracle 多级菜单查询。start with connect by prior
mybatis 控制台打印sql
原文地址：https://www.cnblogs.com/dcpeng/p/16090228.html

盘点Python正则表达式中的贪婪模式和非贪婪模式

一、前言

二、解决过程

小彩蛋

总结