- 英文句点符号:匹配单个任意字符。eg:表达式t.o 可以匹配:tno,t#o,teo等等。不可以匹配:tnno,to,Tno,t正o 等等。
- 方括号:只有方括号里面指定的字符才参与匹配,也只能匹配单个字符。eg:表达式:t[abcd]n 只可以匹配:tan,tbn,tcn,tdn。不可以匹配:thn,tabn,tn等。
3. | 符号。相当与“或”,可以匹配指定的字符,但是也只能选择其中一项进行匹配。eg:表达式:t(a|b|c|dd)n 只可以匹配:tan,tbn,tcn,tddn。不可以匹配taan,tn,tabcn
- 表示匹配次数的符号:{n,}表示至少N次。eg:表达式:[0—9]{ 3 } — [0-9]{ 2 } — [0-9]{ 3 } 的匹配格式为:999—99—999 。因为“—”符号在正则表达式中有特殊的含义,它表示一个范围,所以在前面加转义字符“”。
- ^符号:表示否。^符号被称为“否”符号,如果用在方括号内,“^“表示不想匹配的字符。eg:表达式:[^x] 第一个字符不能是x
6.圆括号,和空白符号。“s”是空白符号,只可以匹配一个空格、制表符、回车符、换页符,不可以匹配自己输入的多个空格。()是分组号,可以用ORO API提取处出值,后面将详细讨论。
7.正则表达式的一些快捷符号:
d表示[0—9], D表示[^0—9], w表示[0—9A—Z_a—z],W表示[^0—9A—Z_a—z], s^_^表示[
f], S表示[^
f]
8. 一些常用的正则表达式:
Java:(([a-z]|_)(\w*)){6,20}匹配以字母或下划线开头,字母数字下划线结尾的字符串
JavaScript:/^(-?)(d+)$/匹配数字。/^w+$/匹配字母数字下划线。
.+ 一个或多个字符
/0 第一次匹配的字符串
- java类中使用正则表达式:
eg1: Pattern p = Pattern.compile("t.n"); Matcher m = p.matcher(“ton”); if(m.matches()){ return true; } eg2:boolean bool=Pattern.matches (“t.n”,”ton”); //如果一个正则表达式要重复利用,用第一种,如果只匹配一次,第二种是最佳选择。
- 反斜线字符(‘’)用于转义字符,同时还可以引用非转义字符(不包括非转义字母)
因此‘\’表示‘’,‘{’表示{。 但是‘y’就是错的,因为在不表示转义构造的 任何字母字符前 使用反斜线都是错误的。
根据 Java Language Specification 的要求,Java 源代码的字符串中的反斜线被解释为 Unicode 转义或其他字符转义。因此必须在字符串字面值中使用两个反斜线,表示正则表达式受到保护,不被 Java 字节码编译器解释。例如,当解释为正则表达式时,字符串字面值 "" 与单个退格字符匹配,而 "\b" 与单词边界匹配。字符串字面值 "(hello)" 是非法的,将导致编译时错误;要与字符串 (hello) 匹配,必须使用字符串字面值 "\(hello\)"。 注意:‘’是一个字符而‘\b’是两个字符
- Pattern类
11.1 8种模式:比如启用多行模式,启用unix模式等。eg1: int CASE_INSENSITIVE表示启用不区分大小写的模式。
11.2 4个静态方法
两个单例模式构造器: Pattern compile(String regex); Pattern compile(String regex,int flags)flags为八种模式的一种 eg2: Pattern p=Pattern.compile("[a-z]\s[a-z]"); Matcher m=p.matcher("b c"); if(m.matches()) Sysout(1111); else Sysout(2222); //输出结果为1111; 一个匹配方法,一个返回String的字面值模式方法: boolean matches(String regex,CharSequence input);//input与regex匹配返回true。 String quote(String s);//返回指定String的字面值。 eg3: boolean bool=Pattern.matches("[a-z] [a-z]",”b c”); //结果为true Sysout(Pattern.quote(“a_#/tb”)); //输出结果为 “Qa_# b”E
11.3 6个普通方法
返回此模式的匹配器: Matcher matcher(CharSequence input); 返回此模式的标志: int flags(); 返回此模式的regex: String pattern(); 两个字符串切割方法:
String[] split(CharSequence input); String[] split(CharSequence input,int limit); limit为返回字符串的个数,如果等于0,返回所有 拆分的字符串,如果大于拆分字符串的实际个数,返回实际个数。 toString方法:String toString(); eg4: Pattern p=Pattern.compile("[,;\s]"); String str="wo,ai;ni haha"; String[] strs=p.split(str); for(String s : strs){ Sysout(s);//输出 “wo” “ai” “ni” “haha” } strs=p.split(str,2) for(String s : strs){ Sysout(s);//输出 “wo” “ai;ni haha” } Strs=p.split(str,0) for(String s : strs){ Sysout(s);//输出 “wo” “ai” “ni” “haha” }
附录:
js中常用的正则:
var reg = /^d{11}$/; /^ 开始 $/ 结束 d 表示匹配数字 {} 大括号里面写有几位数字,里面加逗号表示或者关系
写完要用正则去测对象,如reg.test(被测的对象名),返回boolean类。
下面以邮箱校验举例:
var reg = /^w+@w+.w{2,3}(.w{2,3})?$/; 加号表示出现一次或多次,不是连字符!小括号里的内容是选择出现,后面要加问号! 身份证:var reg = /^d{15}$|^d{18}$|^d{17}(X|x)$/; |表示或者 手机号:var reg = /^(182|135)d{8}$/; 电话区号:var reg = /^d{3}-d{7,8}$/;