• python使用正则表达式文本替换


    2D客户端编程从某种意义上来讲就是素材组织,所以,图片素材组织经常需要批量处理,python一定是最佳选择,不管是win/linux/mac都有一个简单的运行环境

    举两个应用场景:

    • 如果不是在某个文件夹里面则将文件夹名称插入前面
    • 所有的文件名名称加上一个前缀

    直接看代码吧

    # encoding: UTF-8
    import re
    
    # 将正则表达式编译成Pattern对象
    p = re.compile(r'(?P<folder>(w+/)*)(?P<filename>w+.png)')
    
    # 使用Pattern匹配文本,获得匹配结果,无法匹配时将返回None
    #match = pattern.match('<key>xxx/duobaojiemian_L/yangpizi.png</key>')
    
    the_str = """<key>XXXX/duobaojiemian2222_L/duobaojiemian_L/yangpizi.png</key>  
      <key>yangpizi2.png</key>  
      <key>yangpizi3.png</key> """
    
    for m in p.finditer(the_str):
      # 使用Match获得分组信息
      print m.groupdict()
    
    print '-------------------------------'
    
    #f = lambda m: m.group().find('XXXX/') == -1 and 'XXXX/'+m.group() or m.group() 
    def f(m):
      s = m.group()
      return s.find('XXXX/') == -1 and 'XXXX/'+s or s
    
    def f2(m2):
      d = m2.groupdict()
      return d['folder']+'the_'+d['filename']
    
    print p.sub(f2, the_str)
    

      

    关于正则表达式有几个需要交代的

    • python的正则表达式如果捕获需要分组则使用这个语法(?P<命名>匹配的正则表达式)
    • re.compile用于编译正则表达式并返回对象
    • p.finditer返回所有匹配的迭代器
    • p.sub将匹配项传入回调函数,并且用返回值替换文本
    • m.groupdict,可以使用则的分组命名取相应的值
  • 相关阅读:
    Mysql Group by week
    查询数据库占用磁盘大小
    菜根谭#117
    菜根谭#116
    保护眼睛颜色的RGB数值
    手动释放linux内存和缓存
    菜根谭#115
    菜根谭#114
    菜根谭#113
    spring mvc静态资源文件的引用
  • 原文地址:https://www.cnblogs.com/linbc/p/4298799.html
Copyright © 2020-2023  润新知