Oracle 10g正则表达式提高了SQL灵活性。有效的解决了数据有效性,重复词的辨认,无关的空白检测,或者分解多个正则组成的字符串等问题。
Oracle 10g支持正则表达式的四个新函数分别,它们使用POSIX正则表达式代替了老的百分号(%)和通配符(_)字符。
1. REGEXP_LINK: 与LIKE的功能相似
2. REGEXP_INSTR:与INSTR的功能相似:返回字符的个数
3. REGEXP_SUBSTR:与SUBSTR的功能相似:截取字符串
4. REGEXP_REPLACE:与REPLACE的功能相似
在新的函数中使用正则表达式来代替通配符'%'和'_'。
正则表达式由标准的元字符(metacharacters)所构成:
'^' - 匹配输入字符串的开始位置,在方括号表达式中使用,此是它表示不接受字符集合
'$' - 匹配输入字符串的结尾位置。如果设置了Regexp对象的Multiline属性,则$也匹配'n'或'r'
'.' - 匹配除换行符n之外的任何单字符
'?' - 匹配前面的子表达式零次或一次
'+' - 匹配前面的子表达式一次或多次
'*' - 匹配前面的子表达式零次或多次
'|' - 指明两项之间的一个选择。例子'^([a-z]+|[0-9]+)$'表示所有小写字母或数字组合成的字符串
'()' - 标记一个子表达式的开始和结束位置。
'[]' - 标记一个中括号表达式
'{m,n}' - 一个精确地出现次数范围,m=<出现次数<=n, '{m}'表示出现m次,'{m,}'表示至少出现m次
num - 匹配num, 其中num是一个正整数。对所获取的匹配的引用。
字符簇:
[[:alpha:]] 任何字母
[[:digit:]]任何数字
[[:alnum:]]任何字母和数字
[[:space:]]任何白字符
[[:upper:]]任何大写字母
[[:lower:]]任何小写字母
[[:punct:]] 任何标点符号
[[:xdigit:]]任何16进制的数字,相当于[0-9a-fA-F]