• 【Python3 爬虫】09_正则表达式(re.math()、re.search()、re.sub()、全局匹配函数)


    re.math()函数

    从源字符串的起始位置匹配一个模式

    语法:re.match(pattern, string, flag)

    第一个参数代表对应的正则表达式,第二个参数代表对应的源字符,第三个参数是可选参数,代表对应的标志位,可以放模式修正符等信息

    #-*- codingn:utf-8 -*-
    import re
    string = "ipythonajsoasaoso"
    pattern = ".python."
    result = re.match(pattern, string)
    result1 = re.match(pattern, string).span()
    print("结果1:%s" % result)  
    print(result1)  # (0,8)

    image

    re.search()函数

    扫描整个字符串进行匹配
    语法:re.search(pattern, string, flag)

    #-*- codingn:utf-8 -*-
    import re
    string = "helloipythonajsoasaoso"
    pattern = ".python."
    result1 = re.match(pattern, string)
    result2 = re.search(pattern, string)
    print("结果1:%s" % result1)
    print("结果2:%s" % result2)

    image

    全局匹配函数

    将符合模式的全部内容都匹配出来

    (1)使用re.compile()对正则表达式进行预编译
    (2)编译后使用findall()根据正则表达式从原字符串中将匹配的解决全部找出

    #-*- codingn:utf-8 -*-
    import re
    string = "helloipythonajsoasaospythono"
    pattern = re.compile(".python.") #预编译
    result = pattern.findall(string) #找出符合模式的所有结果
    print("结果1:%s" % result)
    

    image

    re.sub()函数

    根据正则表达式来实现替换某些字符串
    re.sub(pattern, rep, string, max)
    第一个参数对应的正则表达式,第二个参数为要替换成的字符串,第三个参数为源字符串,第四个参数为可选项,代表最多替换的次数,如果忽略不写,则会将符合模式的结果全部替换。

    #-*- codingn:utf-8 -*-
    import re
    string = "bnsdBBjsdkBBlsBBdkBBs"
    pattern = "BB"
    result1 = re.sub(pattern,"**",string)  #全部替换
    result2 = re.sub(pattern,"**",string,1)  #最多替换1次
    result3 = re.sub(pattern,"**",string,2)  #最多替换2次
    
    print("结果1:%s" % result1)
    print("结果2:%s" % result2)
    print("结果3:%s" % result3)
    image
  • 相关阅读:
    windows10上安装 .NET Framework 3.5
    Mac上安装Tomcat服务器
    实验室中搭建Spark集群和PyCUDA开发环境
    训练实录
    Hello World
    存储管理
    java脚本实现selenium架构下的复选框、上传文件的操作
    java脚本,selenium工具,自动发QQ邮件
    用java脚本,selenium2.0工具,切换窗口经验总结
    六、排队论模型
  • 原文地址:https://www.cnblogs.com/OliverQin/p/8657540.html
Copyright © 2020-2023  润新知