• Python正则表达式


    Python正则表达式

    原子是正则表达式中最基本的组成单位,每个正则表达式至少包含一个原子。常见原子类型有普通字符作为原子、非打印字符作为原子、通用字符作为原子、原子表。使用时需要调用re模块。

    一、普通字符作为原子

         Eg:     import re

    string=”taoyunjioayu”

    pat=”yun”

                  rst=re.search(pat,string)

                  print(rst)

    二、非打印字符作原子

    Eg:   换行符     制表符

             import re

             string=```taoyunjiaoyu```

             pat=” ”

             rst=re.search(pat,string)

             print(rst)

    三、通用字符作为原子

         w:代表任何一个字母、数字、下划线

         W:代表任何一个非字母、数字、下划线

         d:代表一个十进制数字

         D:代表除十进制数字外的任何

         s:空白字符

         S:除空白字符

    四、原子表

         几个原子放在[ ]内组成了原子表。原子表内的各个原子是平等的。表示从原子表中任意的提取一个原子出来。

    Eg:[sdk] 

             表示从string中提取s,d,k原子中的任何一个出来。

       string=”djfhdkgsdk”

         pat=”kg[sdk]”

         rst=re.seach(pat,string)

         print(rst)

         运行结果:kgs

    五、元字符

    所谓的元字符,就是在正则表达式中具有一些特殊意义的字符,比如重复N次前面的字符。

    (1)   .  :匹配除换行符以外任意字符(称为“通配符”)

    (2) ..  :模糊匹配

    (3)  ^ :匹配开始位置

    (4)  $ : 匹配结束位置

    (5)  * :重复匹配

    (6) ? :匹配出现0、1次

    (7) +:匹配出现1次到多次

    (8) {n}:恰好出现n次

    (9) {n,m}:最少出现n次,最多出现m次

    (10)          | :模式选择符或

    (11) ( ) :模式单元

    *等价于{0,正无穷}      +等价于{1,}     ?等价于{0,1}

    六、模式修正符

         Eg: rst=”re.search(pat,string,re.I)”

             注:pat为正则表达式;string为数据源;I为模式修正符

         (1)I 匹配时忽略大小写

         (2)M 多行匹配

         (3)L 本地化匹配识别

         (4)U unicode的匹配

         (5)S 让 . 匹配包括换行符

    七、正则表达式函数

          1.re.match:从头开始匹配

         2.re.search:任意地方都可匹配,只能匹配一次(匹配成功一次后则不再进行后面的匹配,而是直接输出结果)

         3、全局匹配函数:re.compile(正则表达式).findall(数据)

         4、re.sub( ):用于字符串的替换

             re.sub(正则表达式,替换为的内容,源数据)

  • 相关阅读:
    Hello,world的几种写法!
    浮动与清除浮动
    css中表格的table-layout属性特殊用法
    CSS之照片集效果
    CSS之transition过渡练习
    CSS之过渡简单应用—日落西山
    CSS之立方体绘画步骤
    CSS之立体球体
    transform
    Vue.sync修饰符与this.$emit('update:xxx', newXXX)
  • 原文地址:https://www.cnblogs.com/xshan/p/7756376.html
Copyright © 2020-2023  润新知