JavaScript正则表达式的用法
- 正则表达式是一种可以用于模式匹配和替换的强大工具,在很多语言中都可以应用。JavaScript对正则表达式提供了很好的支持, Javascript中有一个正则表达式对象RegExp。该对象提供了大量的属性和方法来处理正则表达式,同时,String对象也提供了相关的方法来处理正则表达式,在Web应用中,经常使用正则表达式来验证用户输入的信息,例如在用户注册过程中,验证输入的Email地址是否合法。以下我们就介绍一下正则表达式的基本用法。
JavaScript正则表达式的基本用法
- 正则表达式的作用主要有三:
-
- 验证数字是否符合特定模式;
- 利用正则表达式找到特定文本而后删除或者替换文本;
- 按模式匹配在字符串中查找查找匹配子字符串。
- Javascript中使用正则表达式的方法有二:
- 一是使用RegExp对象
-
- 其基本语法为:var rx=new RegExp(pattern[,flags]);,其中参数pattern是一个字符串,表示要使用的正则表达式模式,参数flag为一个可选的字符串,表示如何应用模式的标志,多种标志可以组合使用。
- 主要有三种模:g;全文查找出现的所有模式;i:忽略大小写;m:多行查找;
- 二是使用正则表达式直接量 var rx=/pattern/flags;
-
- pattern表示使用的正则表达式模式,flag如何应用的标记同上;
- 模式字符串组成
-
- 正则表达式就是有普通字符以及特殊字符(称为元字符)组成的文字模式。元字符前面的字符称为前导符,元字符按功能又分为限定符、定位符等类别,下面对常用的元字符进行列表说明。
常见元字符 | |
元字符 | 说明 |
\s | 匹配单个空格,包括tab键和换行符 |
\S | 匹配出单个空格符之外的所有字符,\S与\s互为逆运算 |
\d | 匹配从0~9的数字 |
\w | 匹配字母,数字或者下划线字符 |
\W | 匹配所有与\w不匹配的字符,\W与\s互为逆运算 |
\cx | 匹配由x指明的控制字符。例如,\cZ匹配一个Control-Z。x的值必须为A~Z或者a~z之一。否则,将c视为一个愿意的'c'字符 |
\f | 匹配一个换页符,等价与\x0c和\cL |
\n | 匹配一个换行符,等价于\x0a和\cJ |
\r | 匹配一个回车符,等价于\x0d和\cM |
\t | 匹配一个制表符,等价于\x09和\cI |
\v | 匹配一个垂直制表符。等价于\x0b和\cK |
. | 用于匹配除换行符之外的所有字符 |
限定符说明 | |
限定符 | 说明 |
* | 匹配前导字符出现零次或者多次 |
+ | 匹配前导字符出现一次或者多次 |
? | 匹配前导字符出现零次或者一次 |
{n} | 匹配前导字符出现n次,n>=0; |
{n,} | 匹配前导字符至少出现n次,n>=0; |
{n,m} | 匹配前导字符至少出现n次,最多出现m次;m>n>=0; |
定位符说明 | |
定位符 | 说明 |
^ | 匹配模式必须出现在目标字符串开头 |
$ | 匹配模式必须出现在目标的结尾 |
\b | 匹配模式必须出现在目标字符串的开头或者结尾的两个边界之一 |
\B | 匹配对象必须位于目标字符串的开头和结尾的两个边界之内,即匹配对象既不能作为目标字符串的开头,也不能作为目标字符串的结尾 |
- 正则表达式匹配模式的范围指定符
-
- []限定的模式指定了其中一个字符的出现的可能。如/[A-Z]/表示匹配从A到Z的任何一个字符;/[A-Za-z]/表示匹配从A到Z或者从a-z的任何一个字符;
- ()限定的模式指定()里包含的内容必须同时出现在对象中。如/(abc)[0-9]/意思是目标字符串中出现的abc1,abc2...abc9中9个中的任何一个,而不是ab1,a2等;
- “|”类似于逻辑运算中的“或”运算,如:/sb|sbb|6/表示与目标对象中的"sb","sbb","6"中任何一个相匹配;
- 当^符出现在[]中时,表示取否定运算。如:/[^A-G]/表示与目标对象中除了A-G之外的字符相匹配;
- 字符转义与优先级顺序
-
在匹配模式需要使用元字符时,需要使用转移字符“\+元字符”表示,如查找“12*”模式,我们可以使用/12\*/表示;构造玩正则表达式以后,就可以像使用数学表达式一样来求值。正则表达式在匹配过程中是按照从左向右的顺序进行的,其操作符具有一定的优先级顺序
优先级顺序 | ||
优先级 | 操作符 | 说明 |
1 | \ | 转义符 |
2 | (),(?:),(?=),[] | 圆括号和方括号 |
3 | *,+,?,{n},{n,},{n,m} | 限定符 |
4 | ^,$,\anyMatchcharacter | 位置顺序 |
5 | | | 或操作 |
正则对象表达式对象
- RegExp对象的属性与方法
RegExp对象的静态属性 | |
属性 | 说明 |
index | 只读属性,返回字符串中第一次与模式相匹配的子字符串的开始位置,初始值为-1; |
input | 只读属性,返回当前被正则表达式模式作用的字符串,可以简写为“$_”,初始值为空字符串; |
lastIndex | 只读属性,返回被查找字符串中下一次成功匹配的子字符串的开始位置,其初始位置为-1,其值会随着匹配的不同而被修改; |
lastMatch | 只读属性,返回正则表达式在搜索过程中最后匹配的字符,可以简写为:“$&”; |
lastParen | 只读属性,返回正则表达式在查找过程中最后用园括号括起来的子匹配; |
leftContext | 只读属性,返回被搜索字符串中从开始位置到最后匹配之前为之间的字符,可以简写为"$^"; |
rightContext | 只读属性,返回被搜索字符串中从最后一个匹配位置开始到字符串结尾之间的字符,可以简写为"$'"; |
$1-$9 | 代表$1,$2...$9等9个只读属性,返回9个在模式匹配期间找到的,最近保存的部分; |
RegExp对象的实例属性 | |
global | 只读属性,布尔值,表示创建RegExp时是否设置了g标志,如果设置了则返回true,否则返回false; |
ignoreCase | 只读属性,布尔值,表示创建RegExp时是否设置了i标志,如果设置了则返回true,否则返回false; |
multiline | 只读属性,布尔值,表示创建RegExp时是否设置了m标志,如果设置了则返回true,否则返回false; |
source | 只读属性,字符串型,返回正则表达式模式字符串; |
RegExp对象的方法 | |
exec() | RegExp对象的exec()方法是与正则表达式匹配的强大方法,语法格式为:array=reObj.exec(str); |
test() | RegExp对像的Test()方法用于在给定的字符串中测试正则表达式是否匹配,其基本语法为:var passed=reObj.text(str);如果匹配则返回true,否则返回false |
compile() | RegExp对象的compile()方法用于将正则表达式编译为内部格式,从而执行得更快,其基本语法为:reObj.compile(pattern[,flag]); |
String对象的4个正则表达式用法
String对象的4个正则表达式方法 | |
search() | 用于查找特定子字符串,其基本语法为var str=strObj.search(re);方法返回第一个与正则表达式匹配的子字符串; |
replace() | 用于检索与替换操作,其基本语法格式为:strObj.replace(re,str);如果re不是正则表达式,则表示普通字符串替换; |
match() | 使用正则表达式模式对字符串进行查找,使用方法为var array=strObj.match(re);返回三个属性:1)input包含整个被查找字符串,2)index包含了整个被查找字符串中的匹配的子字符串的位置,lastindex属性包含了最后一次匹配字符串的位置; |
split() | 可以使用正则表达式做参数作为分割字符标志分割字符串; |