• 正则表达式笔记


    首先,推荐一个在线的正则网站,可用作学习与测试。支持php、pecl、js、python、golang. https://regex101.com/

    本文记录一些我不熟悉的正则表达式:

    1. id=([^;]+)(?:;|$)
      解析:
      1. ([^;]+)         指的是匹配除了";"以外的任意字符1次或者多次。对应的语法:  [^xyz]  负值字符集合。匹配未包含的任意字符。例如,“[^abc]”可以匹配“plain”中的“plin”。
      2. (?:;|$)          指的是匹配“;”或者“$”,并且不获取匹配。  对应的语法:(?:pattern)     非获取匹配,匹配pattern但不获取匹配结果,不进行存储供以后使用。这在使用或字符“(|)”来组合一个模式的各个部分时很有用。例如“industr(?:y|ies)”就是一个比“industry|industries”更简略的表达式。
    2. (pattern) 、(?:pattern)、(?=pattern)、(?!pattern)、(?<=pattern)、(?<!pattern)
       (pattern)
      匹配pattern并获取这一匹配。所获取的匹配可以从产生的Matches集合得到,在VBScript中使用SubMatches集合,在JScript中则使用$0…$9属性。要匹配圆括号字符,请使用“(”或“)”。
      (?:pattern)
      非获取匹配,匹配pattern但不获取匹配结果,不进行存储供以后使用。这在使用或字符“(|)”来组合一个模式的各个部分时很有用。例如“industr(?:y|ies)”就是一个比“industry|industries”更简略的表达式。
      (?=pattern)
      非获取匹配,正向肯定预查,在任何匹配pattern的字符串开始处匹配查找字符串,该匹配不需要获取供以后使用。例如,“Windows(?=95|98|NT|2000)”能匹配“Windows2000”中的“Windows”,但不能匹配“Windows3.1”中的“Windows”。预查不消耗字符,也就是说,在一个匹配发生后,在最后一次匹配之后立即开始下一次匹配的搜索,而不是从包含预查的字符之后开始。
      (?!pattern)
      非获取匹配,正向否定预查,在任何不匹配pattern的字符串开始处匹配查找字符串,该匹配不需要获取供以后使用。例如“Windows(?!95|98|NT|2000)”能匹配“Windows3.1”中的“Windows”,但不能匹配“Windows2000”中的“Windows”。
      (?<=pattern)
      非获取匹配,反向肯定预查,与正向肯定预查类似,只是方向相反。例如,“(?<=95|98|NT|2000)Windows”能匹配“2000Windows”中的“Windows”,但不能匹配“3.1Windows”中的“Windows”。
      (?<!pattern)
      非获取匹配,反向否定预查,与正向否定预查类似,只是方向相反。例如“(?<!95|98|NT|2000)Windows”能匹配“3.1Windows”中的“Windows”,但不能匹配“2000Windows”中的“Windows”。这个地方不正确,有问题
      此处用或任意一项都不能超过2位,如“(?<!95|98|NT|20)Windows正确,“(?<!95|980|NT|20)Windows 报错,若是单独使用则无限制,如(?<!2000)Windows 正确匹配
    3. ^(www.)?(?<domain>.+)$    命名捕获(PECL)

      例如:  www.baidu.com
      与上面的正则表达式完全匹配,并且捕获组group 1 是“www”.
      有名捕获组domain 是“baidu.com”。之后就可以用$domain来使用捕获到的内容
      The PCRE library supports named captures using the following syntax:

      ?<name> Perl 5.10 compatible syntax, supported since PCRE-7.0
      ?'name' Perl 5.10 compatible syntax, supported since PCRE-7.0
      ?P<name> Python compatible syntax, supported since PCRE-4.0
    4. ([a-z])1+
      匹配aaabbaaac中的相同的连续字符串,如aaa,bb,aaa,c
    5. 未完待续
  • 相关阅读:
    05docker仓库---搭建本地仓库
    04docker容器操作
    03docker镜像
    02docker核心概念
    01docker基本概念
    find命令
    docker中ubuntu源更新慢加速 换为国内源 Debian10源
    计划任务 at & crond tbc
    mysql mysqladmin常用命令
    mariadb10安装
  • 原文地址:https://www.cnblogs.com/jade640/p/6821749.html
Copyright © 2020-2023  润新知