• re模块(正则表达式)


    一:什么是正则?

     正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方法。或者说:正则就是用来描述一类事物的规则。(在Python中)它内嵌在Python中,并通过 re 模块实现。正则表达式模式被编译成一系列的字节码,然后由用 C 编写的匹配引擎执行。

    生活中处处都是正则:

    比如我们描述:4条腿

      你可能会想到的是四条腿的动物或者桌子,椅子等

    继续描述:4条腿,活的

          就只剩下四条腿的动物这一类了

    二:常用匹配模式(元字符)

    1585741727132

    运行:

    print(re.findall('w','aAbc123_*()-='))
    print(re.findall('W','aAbc123_*()-= '))
    print(re.findall('s','aA bc 12f3_*()-= '))
    print(re.findall('S','aA bc 12f3_*()-= '))
    print(re.findall('d','aA bc 12f3_*()-= '))
    print(re.findall('D','aA bc 12f3_*()-= '))
    print(re.findall('D','aA bc 12f3_*()-= '))
    print(re.findall('Aalex',' alexis alex sb'))

    终端:

    ['a', 'A', 'b', 'c', '1', '2', '3', '_']
    ['*', '(', ')', '-', '=', ' ']
    [' ', ' ', ' ', 'x0c', ' ']
    ['a', 'A', 'b', 'c', '1', '2', '3', '_', '*', '(', ')', '-', '=']
    ['1', '2', '3']
    ['a', 'A', ' ', 'b', 'c', ' ', ' ', 'x0c', '_', '*', '(', ')', '-', '=', ' ']
    ['a', 'A', ' ', 'b', 'c', ' ', ' ', 'x0c', '_', '*', '(', ')', '-', '=', ' ']
    []

    重复匹配:| . | * | ? | .* | .*? | + | {n,m} |

    1、.:匹配除了 之外任意一个字符,指定re.DOTALL之后才能匹配换行符

    print(re.findall('a.b','a1b a2b a b abbbb a
    b a	b a*b'))
    # ['a1b', 'a2b', 'a b', 'abb', 'a b', 'a*b']
    print(re.findall('a.b','a1b a2b a b abbbb a
    b a	b a*b',re.DOTALL))
    # ['a1b', 'a2b', 'a b', 'abb', 'a b', 'a b', 'a*b']

    2、*:左侧字符重复0次或无穷次,性格贪婪

    print(re.findall('ab*','a ab abb abbbbbbbb bbbbbbbb'))
    # ['a', 'ab', 'abb', 'abbbbbbbb']

    3、+:左侧字符重复1次或无穷次,性格贪婪

    print(re.findall('ab+','a ab abb abbbbbbbb bbbbbbbb'))
    # ['ab', 'abb', 'abbbbbbbb']

    4、?:左侧字符重复0次或1次,性格贪婪

    print(re.findall('ab?', 'a ab abb abbbbbbbb bbbbbbbb'))
    # ['a', 'ab', 'ab', 'ab']

    5、{n,m}:左侧字符重复n次到m次,性格贪婪(自定)

    {0,} => *
    {1,} => +
    {0,1} => ?
    {n}单独一个n代表只出现n次,多一次不行少一次也不行
    print(re.findall('ab{2,5}', 'a ab abb abbb abbbb abbbbbbbb bbbbbbbb'))
    # ['abb', 'abbb', 'abbbb', 'abbbbb']

    6、[]匹配指定字符一个

    运行:

    print(re.findall('adb','a1111111b a3b a4b a9b aXb a b a
    b',re.DOTALL))
    print(re.findall('a[501234]b','a1111111b a3b a4b a9b aXb a b a b',re.DOTALL))
    print(re.findall('a[0-5]b','a1111111b a3b a1b a0b a4b a9b aXb a b a b',re.DOTALL))
    print(re.findall('a[0-9a-zA-Z]b','a1111111b axb a3b a1b a0b a4b a9b aXb a b a b',re.DOTALL))
    print(re.findall('a[^0-9a-zA-Z]b','a1111111b axb a3b a1b a0b a4b a9b aXb a b a b',re.DOTALL))
    print(re.findall('a-b','a-b aXb a b a b',re.DOTALL))
    print(re.findall('a[-0-9 ]b','a-b a0b a1b a8b aXb a b a b',re.DOTALL))

    终端:

    ['a3b', 'a4b', 'a9b']
    ['a3b', 'a4b']
    ['a3b', 'a1b', 'a0b', 'a4b']
    ['axb', 'a3b', 'a1b', 'a0b', 'a4b', 'a9b', 'aXb']
    ['a b', 'a b']
    ['a-b']
    ['a-b', 'a0b', 'a1b', 'a8b', 'a b']

  • 相关阅读:
    手机京东页面页面主体和头部搜索
    《转》冯森林:手机淘宝中的那些Web技术(2014年)
    轮播图片如何随着窗口的大小改变而改变
    移动WEB开发基础入门
    MVC的项目部署成应用程序或虚拟目录路径的问题
    jqgrid传入的json数据,赋值了但是没有在表格上显示
    在JavaScript中对HTML进行反转义
    Node.js 创建第一个应用
    Node.js 安装配置
    对ASP.NET程序员非常有用的85个工具
  • 原文地址:https://www.cnblogs.com/bailongcaptain/p/12615231.html
Copyright © 2020-2023  润新知