浅谈js中的正则表达式

浅谈js中的正则表达式
很多时候多会被正则表达式搞的晕头转向，最近抽出时间对正则表达式进行了系统的学习，整理如下：

正则表达式的创建

两种方法，一种是直接写，由包含在斜杠之间的模式组成；另一种是调用RegExp对象的构造函数。

两种方法的创建代码如下：
```
// 直接创建
const regex1 = /ab+c/;
const regex2 = /^[a-zA-Z]+[0-9]*W?_$/gi;

// 调用构造函数
const regex3 = new RegExp('ab+c');
const regex4 = new RegExp(/^[a-zA-Z]+[0-9]*W?_$/, "gi");
const regex5 = new RegExp('^[a-zA-Z]+[0-9]*W?_$', 'gi');
```
可以看出，调用RegExp构造函数创建正则表达式时，第一个参数可以是字符串，也可以是直接创建的正则表达式。

需要注意的是：RegExp实例继承的toLocaleString()和toString)()方法都会返回正则表达式的字面量，与创建正则表达式的方式无关

例如：
```
const ncname = '[a-zA-Z_][\w\-\.]*';
const qnameCapture = '((?:' + ncname + '\:)?' + ncname + ')';
const startTagOpen = new RegExp('^<' + qnameCapture);
startTagOpen.toString();        // '/^<((?:[a-zA-Z_][w-.]*:)?[a-zA-Z_][w-.]*)/'
```
正则表达式中的特殊字符

(反斜杠)

1.在非特殊字符前加反斜杠表示下一个字符是特殊的；

2.将其后的特殊字符转译为字面量；

注意：在使用RegExp构造函数时要将转译，因为在字符串里也是转译字符

^

1.匹配输入的开始；

2.在[]中的第一位时表示反向字符集；

例子：
```
/^A/.exec('an A')        // null
/^A/.exec('An E')        // ["A", index: 0, input: "An E"]
```
$

匹配输入的结束
```
/t$/.exec('eater')        // null
/t$/.exec('eat')          // ["t", index: 2, input: "eat"]
```
*, +, .(小数点)

*：匹配前一个表达式0次或多次。等价于 {0,}；

+：匹配前面一个表达式1次或者多次。等价于 {1,}；

.：匹配除换行符之外的任何单个字符；

? (问号)

1.匹配前面一个表达式0次或者1次。等价于 {0,1}；
2.如果紧跟在任何量词 * + ? {} 的后面，将会使量词变为非贪婪的（匹配尽量少的字符），和缺省使用的贪婪模式正好相反；
3.运用于先行断言

例子：
```
/d+/.exec('123abc')        　　　// ["123", index: 0, input: "123abc"]
/d+?/.exec('123abc')            // ["1", index: 0, input: "123abc"]
```
(x)

匹配 'x' 并且记住匹配项，括号表示捕获括号；

例子：
```
/(foo) (bar) 1 2/.test('bar foo bar foo');   // false
/(bar) (foo) 1 2/.test('bar foo bar foo');   // true
/(bar) (foo) 1 2/.test('bar foo');           // false
/(bar) (foo) 1 2/.test('bar foo foo bar');   // false
/(bar) (foo) 2 1/.test('bar foo foo bar');   // true

'bar foo bar foo'.replace( /(bar) (foo)/, '$2 $1' );    // "foo bar bar foo"
```
模式 /(foo) (bar) 1 2/ 中的 '(foo)' 和 '(bar)' 匹配并记住字符串 "foo bar foo bar" 中前两个单词。模式中的 1 和 2 匹配字符串的后两个单词。

注意：1、2、是用在正则表达式的匹配环节，在正则表达式的替换环节，则要使用像 $1、$2、$n 这样的语法。例如，'bar foo'.replace( /(...) (...)/, '$2 $1' )。

(?:x)

匹配 'x' 但是不记住匹配项，这种叫作非捕获括号；

例子：
```
'foo'.match(/foo{1,2}/)                // ["foo", index: 0, input: "foo"]
'foo'.match(/(?:foo){1,2}/)            // ["foo", index: 0, input: "foo"]
'foofoo'.match(/(?:foo){1,2}/)         // ["foofoo", index: 0, input: "foofoo"]
'foofoo'.match(/foo{1,2}/)             // ["foo", index: 0, input: "foofoo"]
```
使用场景：示例表达式 /(?:foo){1,2}/。如果表达式是 /foo{1,2}/，{1,2}将只对 ‘foo’ 的最后一个字符 ’o‘ 生效。如果使用非捕获括号，则{1,2}会匹配整个 ‘foo’ 单词。

x(?=y), x(?!y), x|y

x(?=y)：匹配'x'仅仅当'x'后面跟着'y'；

x(?!y)：匹配'x'仅仅当'x'后面不跟着'y'；

x|y: 匹配x或y

这两种匹配的结果都不包含y

例子：
```
'JackSprat'.match(/Jack(?=Sprat)/)            // ["Jack", index: 0, input: "JackSprat"]
'JackWprat'.match(/Jack(?=Sprat)/)            // null
'JackWprat'.match(/Jack(?=Sprat|Wprat)/)    // ["Jack", index: 0, input: "JackWprat"]
/d+(?!.)/.exec("3.141")        // ["141", index: 2, input: "3.141"]
```
{n}, {n,m}:

{n}：匹配了前面一个字符刚好发生了n次；

{n,m}：匹配前面的字符至少n次，最多m次。如果 n 或者 m 的值是0，这个值被忽略；

例子：
```
    /a{2}/.exec('candy')         // null
    /a{2}/.exec('caandy')        // ["aa", index: 1, input: "caandy"]
    /a{2}/.exec('caaandy')       // ["aa", index: 1, input: "caaandy"]

    /a{1,3}/.exec('candy')       // ["a", index: 1, input: "candy"]
    /a{1,3}/.exec('caandy')      // ["aa", index: 1, input: "caandy"]
    /a{1,3}/.exec('caaandy')     // ["aaa", index: 1, input: "caaandy"]
    /a{1,3}/.exec('caaaandy')    // ["aaa", index: 1, input: "caaaandy"]
    
```
[xyz], [^xyz]

[xyz]：一个字符集合。匹配方括号的中任意字符;

[^xyz]：一个反向字符集。匹配任何没有包含在方括号中的字符；

这两种匹配都可以使用破折号（-）来指定一个字符范围，特殊符号在字符集中没有了特殊意义。

例：
```
function escapeRegExp(string){
    return string.replace(/([.*+?^=!:${}()|[]/\])/g, "\$&"); 
    //$&表示整个被匹配的字符串
}
```
例子中的.*+?^=!:${}()都表示字面量，并没有特殊意义。

其他

：匹配一个词的边界。一个匹配的词的边界并不包含在匹配的内容中。换句话说，一个匹配的词的边界的内容的长度是0；

B：匹配一个非单词边界；

例子：
```
    /m/.exec('moon')            　　　　　  　// ["m", index: 0, input: "moon"]
    /m/.exec('san moon')      　　　　　　    // ["m", index: 4, input: "san moon"]
    /oo/.exec('moon')           　　　　　　  // null
    /B../.exec('noonday')                    // ["oo", index: 1, input: "noonday"]
    /yB../.exec('possibly yesterday')        // /yB../.exec('possibly yesterday')
```
d：匹配一个数字，等价于[0-9]；

D：匹配一个非数字字符，等价于[^0-9]；

f：匹配一个换页符 (U+000C)；

：匹配一个换行符 (U+000A)；

：匹配一个回车符 (U+000D)；

s：匹配一个空白字符，包括空格、制表符、换页符和换行符，等价于[ f vu00a0u1680u180eu2000-u200au2028u2029u202fu205fu3000ufeff]；

S：匹配一个非空白字符，等价于[^ f vu00a0u1680u180eu2000-u200au2028u2029u202fu205fu3000ufeff]；

w：匹配一个单字字符（字母、数字或者下划线），等价于[A-Za-z0-9_]；

W：匹配一个非单字字符，等价于[^A-Za-z0-9_]；

正则表达式标志

g：全局搜索；

i：不区分大小写；

m：多行搜索；

正则表达式使用

RegExp有exec()和test()方法；

exec匹配的结果为：匹配结果、捕获结果，index和input。

test匹配的结果为true或false，效率比exec要高。

String有match()，replace()，search()，split()方法；

match匹配的结果同RegExp的exec，replace根据正则表达式替换，search查找所以位置，split根据正则表达式分割字符串。

其中，当replace有function时，参数说明如下：

* 匹配项
* 记忆项（括号里面的项）
* ...
* 匹配的index
* input输入项
相关阅读:
SSM学习（三）--集成spring mvc
SSM学习（二）mybatis和spring的集成
 SSM学习（一）搭建基础框架
 (转）Maven依赖的jar包下载不了、jar更新不了的解决办法
 maven安装配置及使用maven创建一个web项目
 JavaWeb -- Servlet+JSP+JavaBean(MVC)模式
 JavaWeb -- JSP+JavaBean模式
 JavaWeb -- Jsp 和 JavaBean
JavaScript -- 练习 window 流氓广告
 上网代理
原文地址：https://www.cnblogs.com/WeiRuifeng/p/7070711.html

浅谈js中的正则表达式

正则表达式的创建

正则表达式中的特殊字符

(反斜杠)

^

$

*, +, .(小数点)

? (问号)

(x)

(?:x)

x(?=y), x(?!y), x|y

{n}, {n,m}:

[xyz], [^xyz]

其他

正则表达式标志

正则表达式使用