• re


    Python3正则表达式应用:

    目的:获取匹配的字符串

    输出:直接输出或是.group() / .group(0)

    常用函数:

    re.compile

    可以把正则表达式编译成一个正则表达式对象,这样可以提高一定的效率。

    import re
    text = "JGood is a handsome boy, he is cool, clever, and so on..."
    regex = re.compile(r'w*oow*')
    print regex.findall(text)   #查找所有包含'oo'的单词
    print regex.sub(lambda m: '[' + m.group(0) + ']', text) #将字符串中含有'oo'的单词用[]括起来。

    re.match

    尝试从字符串的开始匹配一个模式

    import re
    text = "JGood is a handsome boy, he is cool, clever, and so on..."
    m = re.match(r"(w+)s", text)
    if m:
        print(m.group(0), '
    ', m.group(1))
    else:
        print('not match')

    re.match的函数原型为:re.match(pattern, string, flags)

    第一个参数是正则表达式,这里为"(w+)s",如果匹配成功,则返回一个Match,否则返回一个None

    第二个参数表示要匹配的字符串;

    第三个参数是标致位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等

    re.search

    re.search函数会在字符串内查找模式匹配,只到找到第一个匹配然后返回,如果字符串没有匹配,则返回None

    import re
    text = "JGood is a handsome boy, he is cool, clever, and so on..."
    m = re.search(r'shan(ds)omes', text)
    
    if m:
        print(m.group(0), '
    ', m.group(1))
    else:
        print('not match')

    re.search的函数原型为: re.search(pattern, string, flags)

    每个参数的含意与re.match一样。

    re.match与re.search的区别:

     re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;

     而re.search匹配整个字符串,直到找到一个匹配。

    re.sub 

    re.sub用于替换字符串中的匹配项。下面一个例子将字符串中的空格 ' ' 替换成 '-' :  

    import re
    text = "JGood is a handsome boy, he is cool, clever, and so on..."
    print(re.sub(r's+', '-', text))
    
    结果
    ------------------
    JGood-is-a-handsome-boy,-he-is-cool,-clever,-and-so-on...

      

    re.sub的函数原型为:re.sub(pattern, repl, string, count)

    其中第二个函数是替换后的字符串;本例中为'-'

    第四个参数指替换个数。默认为0,表示每个匹配项都替换。

    re.sub还允许使用函数对匹配项的替换进行复杂的处理。如:re.sub(r's', lambda m: '[' + m.group(0) + ']', text, 0);将字符串中的空格' '替换为'[ ]'。

    re.split

    可以使用re.split来分割字符串,如:re.split(r's+', text);将字符串按空格分割成一个单词列表。

    re.findall

    re.findall可以获取字符串中所有匹配的字符串。如:re.findall(r'w*oow*', text);获取字符串中,包含'oo'的所有单词

    转载自:http://www.python8.org/a/fenleiwenzhang/yuyanjichu/2009/0901/150.html

     

  • 相关阅读:
    BDD
    linux 删除中文名称乱码的文件
    python代码调用linux命令
    linux 查看内存
    java学习day17--API-注解
    java学习day17--API-单例设计模式
    java学习day17--API-同步锁
    java学习day16--API-多线程创建两种方式
    java学习day16--API-多线程-->进程和线程
    java学习day15--API-Map-->HashMap
  • 原文地址:https://www.cnblogs.com/AbcFly/p/6242788.html
Copyright © 2020-2023  润新知