• 正则表达式


    正则表达式 - JavaScript描述

    概述

    正则表达式是被用来匹配字符串中的字符组合的模式。在JavaScript中,正则表达式也是对象

    创建正则表达式

    var re = /abc/; // 使用对象字面量
    var re = new RegExp('ab+c'); // 调用构造函数
    

    上面两种方法都可以用来创建正则表达式。如果正则表达式固定不变,建议使用第1种方法创建,这样性能会高一些。如果事先不知道要创建什么样的正则表达式则使用第2种方法。第1种方法的斜杠,第2中方法的单引号或者双引号,均是1种固定写法。

    正则表达式的模式

    使用简单的模式

    简单模式就是使用一些简单的字符,直接进行匹配。比如/abc/会成功匹配"Hi, do you know your abc's?""The latest airplane designs evolved from slabcraft."但是不会匹配"Grab crab"

    特殊字符

    一些复杂的正则表达式匹配,需要用到一些特殊字符,在JavaScript中这些特殊字符及其功能如下。默认量词匹配模式为贪婪模式,也就是匹配尽可能多的字符。

    字符 含义
    转义字符
    ^ 匹配输入的开始
    $ 匹配输入的结束
    * 匹配前一个表达式0次,或者多次。等价于{0, }
    + 匹配前一个表达式1次,或者多次。等价于{1, }
    ? 匹配前一个表达式0次或者1次。等价于{0, 1}
    . (小数点)匹配除了换行符( )之外的任何单个字符。
    (x) 匹配 'x' 并且记住匹配项。使用$1、$2可以拿到括号中的内容。
    x|y 匹配x或者y
    {n} n是一个正整数,匹配了前面一个字符刚好发生了n次。
    {n, m} n 和 m 都是正整数。匹配前面的字符至少n次,最多m次。
    [xyz] 一个字符集合。匹配方括号的中任意字符。可以使用破折号(-)来指定一个字符范围。
    [^xyz] 一个反向字符集。也就是说, 它匹配任何没有包含在方括号中的字符。
     匹配一个词的边界。(匹配一个单个的单词)
    d 匹配一个数字。等价于[0-9]
    D 匹配一个非数字。等价于[^0-9]
    匹配一个换行符。
    s 匹配一个空白字符,包括空格、制表符、换页符和换行符。
    S 匹配一个非空白字符。
    w 匹配一个单字字符(字母、数字或者下划线)。等价于[A-Za-z0-9_]。
    W 匹配一个非单字字符。

    详细介绍

    在正则表达式中出现有3种可能性。第1种,在非特殊字符之前加入代表其后字符不能当做普通字符来使用,具有特殊功能。第2种,在特殊字符之前加入代表将其后特殊字符的功能移除,使其变成普通字符而能够正常被匹配。第3种,使用new RegExp('pattern')时,需要对进行2次转义,因为在字符串里面也是1个转义字符。

    ^

    匹配输入的开始。例如/^A/.test('an A')匹配失败,而/^A/.test('An E')匹配成功。

    $

    匹配输入的结束。/t$/.test('eater')匹配失败,而/t$/.test('eat')匹配成功。

    *

    匹配前一个表达式0次或多次,等价于{0,}。例如:/bo*/.test('bx');/bo*/.test('booo');都能匹配成功,可以理解为只要字母b出现就匹配成功。

    +

    匹配前一个表达式1次或多次,等价与{1,}。/a+/.test('a');/a+/.test('aaaww');能匹配成功,而/a+/.test('qww');则匹配失败,也就是说a至少要出现1次才能匹配成功。

    ?

    匹配前面1个表达式0次或者1次,等价于{0,1}。例如:/e?le?/匹配"angel"中的'el',和"angle"中的'le'以及"oslo"中的'l'。

    如果紧跟在任何量词* + ? {}的后面,将会使量词变为非贪婪模式(匹配尽可能少的字符),和默认的贪婪模式正好相反。例如,对 "123abc" 应用 /d+/ 将会返回 "123",如果使用 /d+?/,那么就只会匹配到 "1"。

    .

    小数点将匹配除换行符之外的任何单个字符。例如:/.n/将会匹配 "nay, anapple is on the tree" 中的 'an' 和 'on',但是不会匹配 'nay'。

    (x)

    匹配 'x' 并且记住匹配项,括号被称为 捕获括号。示例:/Chapter (d+).d*/将会匹配"Open Chapter 4.3, paragraph 6"中的'4'并记住。

    x|y

    匹配'x'或'y'。示例:/green|red/匹配"green apple"中的'green'和"red apple"中的'red'。

    {n}

    n是一个正整数,匹配前面一个字符刚好发生了n次。示例:/a{2}/不会匹配"candy"中的'a',但是会匹配"caandy"中所有的a,以及"caaaandy"中前2个a。

    {n,m}

    n和m都是正整数,并且n<=m。匹配至少n次,最多m次。示例:/a{1,3}/匹配"cndy"失败,匹配"candy"结果为'a',匹配"caaaaaaandy"结果为'aaa'。

    [xyz]

    字符集合。将匹配在中括号中的任意字符,包括转义序列,特殊字符例如* .将被认为是普通字符,因此不必对它们进行转义,不过转义也是可以的。可以使用破折号(-)来指定一个字符范围。

    例如,[abcd] 和[a-d]是一样的。他们都匹配"brisket"中得'b',也都匹配"city"中的'c'。/[a-z.]+/ 和/[w.]+/都匹配"test.i.ng"中得所有字符。

    [^xyz]

    一个反向字符集。匹配任何没有包含在方括号中的字符。例如,[^abc] 和 [^a-c] 是一样的。

    

    匹配一个词的边界。

    示例:/m/匹配"moon"中得'm'

    /oo/并不匹配"moon"中得'oo',因为'oo'被一个词汇字符'n'紧跟着。

    /oon/匹配"moon"中得'oon',因为'oon'是这个字符串的结束部分。这样他没有被一个词汇字符紧跟着。

    B

    匹配一个非单词边界。他匹配一个前后字符都是相同类型的位置:都是单词或者都不是单词。一个字符串的开始和结尾都被认为是非单词。

    例如,/B../匹配"noonday"中得'oo', 而/yB./匹配"possibly yesterday"中得'ye'

    d

    匹配一个数字。等价于[0-9]。

    例如, /d/ 或者 /[0-9]/ 匹配"B2 is the suite number."中的'2'。

    D

    匹配一个非数字字符。等价于[^0-9]。

    例如, /D/ 或者 /[^0-9]/ 匹配"B2 is the suite number."中的'B' 。

    s

    匹配一个空白字符,包括空格、制表符、换页符、和换行符。

    例如, /sw*/ 匹配"foo bar."中的' bar'。

    S

    匹配一个非空白字符。例如, /Sw*/ 匹配"foo bar."中的'foo'。

    w

    匹配一个单字字符(字母、数字或者下划线)。等价于[A-Za-z0-9_]。

    示例:/w/ 匹配 "apple," 中的 'a',"$5.28,"中的 '5' 和 "3D." 中的 '3'。

    W

    匹配1个非单字字符,等价于[^A-Za-z0-9_]。

    示例:例如, /W/ 或者 /[^A-Za-z0-9_]/ 匹配 "50%." 中的 '%'。

    使用正则表达式

    正则表达式可以被用于RegExp的exec和test方法以及String的match、replace、search和split方法。

    RegExp.prototype.test()

    概述
    test() 方法执行一个检索,用来查看正则表达式与指定的字符串是否匹配。返回 true 或 false。
    语法
    regexObj.test(str)
    示例
    /hel/.test("hello world");
    参考链接
    https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Reference/Global_Objects/RegExp/test

    String.prototype.match()

    概述
    当一个字符串与正则表达式匹配时,match方法会提取匹配项,并返回一个数组。否则返回null。

    语法

    str.match(regexp);
    

    参数 - regexp是一个正则表达式对象。
    返回值 - 1个包含了整个匹配结果以及任何括号捕获的匹配结果数组对象。如果没有匹配项,则返回null。

    描述
    如果正则表达式没有g标志,则返回的数组对象拥有input属性,表示被解析的原始字符串,还拥有index属性,表示匹配结果在原字符串中的索引。

    如果正则表达式包含g标志,则返回的数组对象中不会有index和input属性。

    示例

    // 简单示例
    
    console.log( "ab".match(/ab/) ); 
    // ["ab", index: 0, input: "ab"]
    
    console.log( "ab".match(/a(b)/) ); 
    // ["ab", "b", index: 0, input: "ab"]
    
    console.log( "ab".match(/a(b)/g) ); 
    // ["ab"]
    
    // 复杂示例
    var str = 'For more information, see Chapter 3.4.5.1';
    var re = /see (chapter d+(.d)*)/i;
    var found = str.match(re);
    
    console.log(found);
    
    // logs [ 'see Chapter 3.4.5.1',
    //        'Chapter 3.4.5.1',
    //        '.1',
    //        index: 22,
    //        input: 'For more information, see Chapter 3.4.5.1' ]
    
    // 'see Chapter 3.4.5.1' 是整个匹配。
    // 'Chapter 3.4.5.1' 被'(chapter d+(.d)*)'捕获。
    // '.1' 是被'(.d)'捕获的最后一个值。
    // 'index' 属性(22) 是整个匹配从零开始的索引。
    // 'input' 属性是被解析的原始字符串。
    

    参考链接
    https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Reference/Global_Objects/String/match

    使用括号的子字符串匹配

    在正则表达式的模式中使用括号,可以把括号里面的内容"记住"。在脚本中可以按顺序依次使用$1、$2表示
    第一个和第二个括号里面的内容。下面的例子说明了如何使用括号的子字符串匹配。

    	var re = /(w+)s(w+)/;
    	var str = "Hello World";
    	var newstr = str.replace(re, "$2AND$1");
    	console.log(newstr); // → WorldANDHello
    

    通过标志进行高级搜索

    正则表达式一共有4个标志。这里只介绍最常用最主要的两个gi。分别表示全局搜索和不区分大小写搜索。
    默认的搜索是区分大小写的。下面的例子展示了标志的使用方法。

    包含标志的正则表达式语法如下:

    var re = /pattern/flags; // or
    var re = new RegExp("pattern", "flags");
    
    	var str = "I am a boy. She is a girl";
    	/A/.test(str); // → false
    	/a/i.test(str); // → true
    	
    	str.match(/a/); // → ["a"]
    	str.match(/a/g); // → ["a", "a", "a"]
    

    常用正则表达式

    1. 中文字符 [u4e00-u9fa5]
    2. Email地址 w[-w.+]*@([A-Za-z0-9][-A-Za-z0-9]+.)+[A-Za-z]{2,14}
    3. 手机 [0-9]{11}

    参考资料

    1. mdn Regular Expressions
    2. 图形化JS正则表达式工具(需梯子)
    3. 站长之家->正则测试
  • 相关阅读:
    zookeeper记录2(选举模式和ZooKeeper的集群安装)
    端口复用技术简单了解;重用端口;socket复用端口
    java线程池如何合理配置核心线程数?(转)
    数据库锁机制(转)
    mysql左连接锁表_不得不会的mysql锁(转)
    POI: calculated end index (4361) is out of allowable range (4339..4358)
    jdbcTemplate事务管理
    springboot 访问静态资源
    springboot集成持久化框架
    第六章 FreeBSD之配置日期和时间
  • 原文地址:https://www.cnblogs.com/asheng2016/p/7401391.html
Copyright © 2020-2023  润新知