• Python正则表达式re.findall一个有趣的现象


    下面通过几个案例来分析一下,
    注意:本节的parsematch函数请参考《妙用re.sub分析正则表达式解析匹配过程

    案例一:

    >>> re.findall(r".* .* (.*)",'第二回 悟彻菩提真妙理 断魔归本合元神')
    ['断魔归本合元神']
    >>> parsematch(r".* .* (.*)",'第二回 悟彻菩提真妙理 断魔归本合元神')
    第1次匹配,匹配情况:
        匹配子串group(0): 第二回 悟彻菩提真妙理 断魔归本合元神,位置为:(0, 19)
        匹配子串group(1): 断魔归本合元神,位置为:(12, 19)
    >>> re.findall(r".* .* (.*)",'第二回 悟彻菩提真妙理 断魔归本合元神')
    ['断魔归本合元神']
    

    案例二:

    >>> re.findall("(.)*",'第二回 悟彻菩提真妙理 断魔归本合元神')
    ['神', '']
    >>> parsematch("(.)*",'第二回 悟彻菩提真妙理 断魔归本合元神')
    第1次匹配,匹配情况:
        匹配子串group(0): 第二回 悟彻菩提真妙理 断魔归本合元神,位置为:(0, 19)
        匹配子串group(1): 神,位置为:(18, 19)
    第2次匹配,匹配情况:
        匹配子串group(0): ,位置为:(19, 19)
    
    

    案例三:

    >>> re.findall(".*",'第二回 悟彻菩提真妙理 断魔归本合元神')
    ['第二回 悟彻菩提真妙理u3000断魔归本合元神', '']
    >>> parsematch(".*",'第二回 悟彻菩提真妙理 断魔归本合元神')
    第1次匹配,匹配情况:
        匹配子串group(0): 第二回 悟彻菩提真妙理 断魔归本合元神,位置为:(0, 19)
    第2次匹配,匹配情况:
        匹配子串group(0): ,位置为:(19, 19)
    >>>
    

    案例四:

    >>> re.findall(r"(.*) (.*) (.*)",'第二回 悟彻菩提真妙理 断魔归本合元神')
    [('第二回', '悟彻菩提真妙理', '断魔归本合元神')]
    >>>
    

    上述4个案例的前2个案例,在第一次匹配存在group(1)的情况下,findall中返回的第一个元素为group(1)的匹配子串,而group(0)的数据没有在findall中返回,而3个案例的第2次匹配以及第3个案例的第1次匹配都只有group(0),此时findall返回的就是group(0)的整体搜索串,第4个案例返回的是group(1,2,3)。

    从这几个案例的情况来看,findall在匹配后,如果匹配的子串只有一个组,则返回组0,否则返回组0后面的组,而组0不再返回。

    老猿Python,跟老猿学Python!
    博客地址:https://blog.csdn.net/LaoYuanPython

    请大家多多支持,点赞、评论和加关注!谢谢!

  • 相关阅读:
    软件定义网络(SDN)研究进展
    第四章:地址解析协议
    Open vSwitch流表应用实战
    Open vSwitch使用案例扩展实验
    mininet实验 脚本实现控制交换机行为
    mininet实验 动态改变转发规则实验
    websocket
    mongodb增删改查常用命令总结
    Mongo简介
    Redis数据库常用命令总结
  • 原文地址:https://www.cnblogs.com/LaoYuanPython/p/13643610.html
Copyright © 2020-2023  润新知