Visual Studio 中使用的正则表达式 说明
2013-10-11 21:10:12| 分类: VB和VBA知识|举报|字号 订阅
参考:详解Visual Studio正则替换大法
http://developer.51cto.com/art/200908/141835.htm
Visual Studio 中使用的正则表达式 说明
正则表达式是查找和替换文本模式的简洁和灵活的表示法。Visual Studio 中使用的正则表达式是 Visual C++ 6.0中使用的、具有简化语法的表达式的超集。
在“查找”、“在文件中查找”或“在文件中替换”对话框中,可使用下列正则表达式来改进和扩展搜索。
注意 在将下列任何表达式用作搜索条件的一部分之前,必须在“查找”、“在文件中查找”和“在文件中替换”对话框中选择“使用”复选框。
可使用下列表达式匹配搜索字符串中的字符或数字:
表达式 |
语法 |
说明 |
任一字符 |
. |
匹配除换行符外的任何一个字符。 |
最多 0 项或更多 |
* |
匹配前面表达式的 0 个或更多搜索项。 |
最多一项或更多 |
+ |
匹配前面表达式的至少一个搜索项。 |
最少 0 项或更多 |
@ |
匹配前面表达式的 0 个或更多搜索项,匹配尽可能少的字符。 |
最少一项或更多 |
# |
匹配前面表达式的一个或更多搜索项,匹配尽可能少的字符。 |
重复 n 次 |
^n |
匹配前面表达式的 n 个搜索项。例如,[0-9]^4 匹配任意 4 位数字的序列。 |
字符集 |
[] |
匹配 [] 内的任何一个字符。要指定字符的范围,请列出由短划线 (-) 分隔的起始字符和结束字符,如 [a-z] 中所示。 |
不在字符集中的字符 |
[^...] |
匹配跟在 ^ 之后的不在字符集中的任何字符。 |
行首 |
^ |
将匹配定位到行首。 |
行尾 |
$ |
将匹配定位到行尾。 |
词首 |
< |
仅当词在文本中的此位置开始时才匹配。 |
词尾 |
> |
仅当词在文本中的此位置结束时才匹配。 |
分组 |
() |
将子表达式分组。 |
或 |
| |
匹配 OR 符号 (|) 之前或之后的表达式。). 最常用在分组中。例如,(sponge|mud) bath 匹配“sponge bath”和“mud bath”。 |
转义符 |
|
匹配跟在反斜杠 () 后的字符。这使您可以查找在正则表达式表示法中使用的字符,如 { 和 ^。例如,^ 搜索 ^字符。 |
带标记的表达式 |
{} |
标记括号内的表达式所匹配的文本。 |
第 n 个带标记的文本 |
n |
在“查找”或“替换”表达式中,指示第 n 个带标记的表达式所匹配的文本,其中 n 是从 1 至 9 的数字。 在“替换”表达式中, 插入整个匹配的文本。 |
右对齐字段 |
(w,n) |
在“替换”表达式中,将字段中第 n 个带标记的表达式右对齐至少 w 字符宽。 |
左对齐字段 |
(-w,n) |
在“替换”表达式中,将字段中第 n 个带标记的表达式左对齐至少 w 字符宽。 |
禁止匹配 |
~(X) |
当 X 出现在表达式中的此位置时禁止匹配。例如,real~(ity) 匹配“realty”和“really”中的“real”,而不匹配“reality”中的“real”。 |
字母数字字符 |
:a |
匹配表达式 |
字母字符 |
:c |
匹配表达式 |
十进制数 |
:d |
匹配表达式 |
十六进制数 |
:h |
匹配表达式 |
标识符 |
:i |
匹配表达式 |
有理数 |
:n |
匹配表达式 |
带引号的字符串 |
:q |
匹配表达式 (("[^"]*")| ('[^']*')) |
字母字符串 |
:w |
匹配表达式 |
十进制整数 |
:z |
匹配表达式 |
转义符 |
e |
Unicode U+001B。 |
Bell |
g |
Unicode U+0007。 |
退格符 |
h |
Unicode U+0008。 |
换行符 |
|
匹配与平台无关的换行符。在“替换”表达式中,插入换行符。 |
制表符 |
|
匹配制表符,Unicode U+0009。 |
Unicode 字符 |
x#### 或 u#### |
匹配 Unicode 值给定的字符,其中 #### 是十六进制数。可以用 ISO 10646 代码点或两个提供代理项对的值的 Unicode 代码点指定基本多语种平面(即一个代理项)外的字符。 |
下表列出按标准 Unicode 字符属性进行匹配的语法。两个字母的缩写词与 Unicode 字符属性数据库中所列的一样。可将这些指定为字符集的一部分。例如,表达式 [:Nd:Nl:No] 匹配任何种类的数字。
表达式 |
语法 |
说明 |
大写字母 |
:Lu |
匹配任何一个大写字母。例如,:Luhe 匹配“The”但不匹配“the”。 |
小写字母 |
:Ll |
匹配任何一个小写字母。例如,:Llhe 匹配“the”但不匹配“The”。 |
词首大写字母 |
:Lt |
匹配将大写字母和小写字母结合的字符,例如,Nj 和Dz。 |
修饰符字母 |
:Lm |
匹配字母或标点符号,例如逗号、交叉重音符和双撇号,用于表示对前一字母的修饰。 |
其他字母 |
:Lo |
匹配其他字母,如哥特体字母 ahsa。 |
十进制数 |
:Nd |
匹配十进制数(如 0-9)和它们的双字节等效数。 |
字母数字 |
:Nl |
匹配字母数字,例如罗马数字和表意数字零。 |
其他数字 |
:No |
匹配其他数字,如旧斜体数字一。 |
开始标点符号 |
:Ps |
匹配开始标点符号,例如左方括号和左大括号。 |
结束标点符号 |
:Pe |
匹配结束标点符号,例如右方括号和右大括号。 |
左引号 |
:Pi |
匹配左双引号。 |
右引号 |
:Pf |
匹配单引号和右双引号。 |
破折号 |
:Pd |
匹配破折号标记。 |
连接符号 |
:Pc |
匹配下划线标记。 |
其他标点符号 |
:Po |
匹配逗号 (,)、?、"、!、@、#、%、&、*、、冒号(:)、分号 (;)、' 和 /。 |
空白分隔符 |
:Zs |
匹配空白。 |
行分隔符 |
:Zl |
匹配 Unicode 字符 U+2028。 |
段落分隔符 |
:Zp |
匹配 Unicode 字符 U+2029。 |
无间隔标记 |
:Mn |
匹配无间隔标记。 |
组合标记 |
:Mc |
匹配组合标记。 |
封闭标记 |
:Me |
匹配封闭标记。 |
数学符号 |
:Sm |
匹配 +、=、~、| 、< 和 >。 |
货币符号 |
:Sc |
匹配 $ 和其他货币符号。 |
修饰符号 |
:Sk |
匹配修饰符号,如抑扬音、抑音符号和长音符号。 |
其他符号 |
:So |
匹配其他符号,如版权符号、段落标记和度数符号。 |
其他控制 |
:Cc |
匹配行尾。 |
其他格式 |
:Cf |
格式化控制字符,例如双向控制字符。 |
代理项 |
:Cs |
匹配代理项对的一半。 |
其他私用 |
:Co |
匹配私用区域的任何字符。 |
其他未分配的字符 |
:Cn |
匹配未映射到 Unicode 字符的字符。 |
除标准 Unicode 字符属性外,还可以指定下列附加属性。可将这些属性指定为字符集的一部分。
表达式 |
语法 |
说明 |
Alpha |
:Al |
匹配任何一个字符。例如,:Alhe 匹配“The”、“then”、“reached”等单词。 |
数字 |
:Nu |
匹配任何一个数或数字。 |
标点符号 |
:Pu |
匹配任何一个标点符号,如 ?、@、' 等等。 |
空白 |
:Wh |
匹配所有类型的空格,包括印刷和表意文字的空格。 |
Bidi |
:Bi |
匹配诸如阿拉伯文和希伯来文这类从右向左书写的字符。 |
朝鲜文 |
:Ha |
匹配朝鲜文和组合朝鲜文字母。 |
平假名 |
:Hi |
匹配平假名字符。 |
片假名 |
:Ka |
匹配片假名字符。 |
表意文字/汉字/日文汉字 |
:Id |
匹配表意文字字符,如汉字和日文汉字 |