• SQL+ 正则表达式


    今儿个才知道SQL语句还可以搭配正则表达式作为查询条件,很是有用。

    REGEXP_LIKE(匹配)
    REGEXP_INSTR (包含)
    REGEXP_REPLACE(替换)
    REGEXP_SUBSTR(提取)

    表 1:定位元字符

    元字符 说明
    ^ 使表达式定位至一行的开头
    $ 使表达式定位至一行的末尾

    表 2:量词或重复操作符

    量词 说明
    * 匹配 0 次或更多次
    ? 匹配 0 次或 1 次
    + 匹配 1 次或更多次
    {m} 正好匹配 m 次
    {m,} 至少匹配 m 次
    {m, n} 至少匹配 m 次但不超过 n 次

    表 3:预定义的 POSIX 字符类

    字符类 说明
    [:alpha:] 字母字符
    [:lower:] 小写字母字符
    [:upper:] 大写字母字符
    [:digit:] 数字
    [:alnum:] 字母数字字符
    [:space:] 空白字符(禁止打印),如回车符、换行符、竖直制表符和换页符
    [:punct:] 标点字符
    [:cntrl:] 控制字符(禁止打印)
    [:print:] 可打印字符

    表 4:表达式的替换匹配和分组

    元字符 说明
    | 替换 分隔替换选项,通常与分组操作符 () 一起使用
    ( ) 分组 将子表达式分组为一个替换单元、量词单元或后向引用单元(参见“后向引用”部分)
    [char] 字符列表 表示一个字符列表;一个字符列表中的大多数元字符(除字符类、^  - 元字符之外)被理解为文字

    表 5:REGEXP_LIKE 操作符

    语法 说明
    REGEXP_LIKE(source_string, pattern
    [, match_parameter])
    source_string 支持字符数据类型(CHAR、VARCHAR2、CLOB、NCHAR、NVARCHAR2  NCLOB,但不包括 LONG)。pattern 参数是正则表达式的另一个名称。match_parameter 允许可选的参数(如处理换行符、保留多行格式化以及提供对区分大小写的控制)。

    表 6:REGEXP_INSTR 函数

    语法 说明
    REGEXP_INSTR(source_string, pattern
    [, start_position
    [, occurrence
    [, return_option
    [, match_parameter]]]])
    该函数查找 pattern ,并返回该模式的第一个位置。您可以随意指定您想要开始搜索的 start_position occurrence 参数默认为 1,除非您指定您要查找接下来出现的一个模式。return_option 的默认值为 0,它返回该模式的起始位置;值为 1 则返回符合匹配条件的下一个字符的起始位置。

    表 7: 5 位数字加 4 位邮政编码表达式的说明

    语法 说明
    必须匹配的空白
    [:digit:] POSIX 数字类
    ] 字符列表的结尾
    {5} 字符列表正好重复出现 5 次
    ( 子表达式的开头
    - 一个文字连字符,因为它不是一个字符列表内的范围元字符
    [ 字符列表的开头
    [:digit:] POSIX [:digit:]
    [ 字符列表的开头
    ] 字符列表的结尾
    {4} 字符列表正好重复出现 4 次
    ) 结束圆括号,结束子表达式
    ? ? 量词匹配分组的子表达式 0 或 1 次,从而使得 4 位代码可选
    $ 定位元字符,指示行尾

    表 8:REGEXP_SUBSTR 函数

    语法 说明
    REGEXP_SUBSTR(source_string, pattern
    [, position [, occurrence
    [, match_parameter]]])
    REGEXP_SUBSTR 函数返回匹配模式的子字符串。

    表 9: REGEXP_REPLACE 函数

    语法 说明
    REGEXP_REPLACE(source_string, pattern
    [, replace_string [, position
    [,occurrence, [match_parameter]]]])
    该函数用一个指定的 replace_string 来替换匹配的模式,从而允许复杂的“搜索并替换”操作。

    表 10:后向引用元字符

    元字符 说明
    digit 反斜线 紧跟着一个 1 到 9 之间的数字,反斜线匹配之前的用括号括起来的第 digit 个子表达式。
    (注意:反斜线在正则表达式中有另一种意义,取决于上下文,它还可能表示 Escape 字符。

    表 11:模式交换正则表达式的说明

    正则表达式项目 说明
    ( 第一个子表达式的开头
    . 匹配除换行符之外的任意单字符
    * 重复操作符,匹配之前的 . 元字符 0 到 n 次
    ) 第一个子表达式的结尾;匹配结果在 1
    中获取(在这个例子中,结果为 Ellen。)
    必须存在的空白
    ( 第二个子表达式的开头
    . 匹配除换行符之外的任意单个字符
    * 重复操作符,匹配之前的 . 元字符 0 到 n 次
    ) 第二个子表达式的结尾;匹配结果在 2
    中获取(在这个例子中,结果为 Hildi。)
    空白
    ( 第三个子表达式的开头
    . 匹配除换行符之外的任意单字符
    * 重复操作符,匹配之前的 . 元字符 0 到 n 次
    ) 第三个子表达式的结尾;匹配结果在 3
    中获取(在这个例子中,结果为 Smith。)

    表 12:社会保险号码正则表达式的说明

    正则表达式项目 说明
    ^ 行首字符(正则表达式在匹配之前不能有任何前导字符。)
    ( 开始子表达式并列出用 | 元字符分开的可替换选项
    [ 字符列表的开头
    [:digit:] POSIX 数字类
    ] 字符列表的结尾
    {3} 字符列表正好重复出现 3 次
    - 连字符
    [ 字符列表的开头
    [:digit:] POSIX 数字类
    ] 字符列表的结尾
    {2} 字符列表正好重复出现 2 次
    - 另一个连字符
    [ 字符列表的开头
    [:digit:] POSIX 数字类
    ] 字符列表的结尾
    {4} 字符列表正好重复出现 4 次
    | 替换元字符;结束第一个选项并开始下一个替换表达式
    [ 字符列表的开头
    [:digit:] POSIX 数字类
    ] 字符列表的结尾
    {9} 字符列表正好重复出现 9 次
    ) 结束圆括号,结束用于替换的子表达式组
    $ 定位元字符,指示行尾;没有额外的字符能够符合模式

    SELECT * FORM. tKHXX where REGEXP_LIKE(SJHM, '^[1]{1}[35]{1}[[:digit:]]{9}$'
    针对这个表达式解释一下
    ^ 表示开始
    $ 表示结束
    []内部为匹配范围
    {}里的内容表时个数,有几位

    手机号码的特点是以 1开头接着是3或5再加9位的数字 所以这么理解
    1开头 表达式为 ^[1]{1} 意为 开始1位里包含1
    3或5 表达式为 [35]{1}
    9位数字结束 为: [[:digit:]]{9}$ 这里[:digit:]为特殊写法,代表为数字 再加个结束符$.

    转载自:http://blog.itpub.net/352988/viewspace-702052/

  • 相关阅读:
    一些python练习题
    爬取某房源网数据
    练习1:定义 is_Even 函数,传一 int 参数,判断是否是偶数,return True;不是,return False
    pycharm中tkinter 不显示窗口
    保护眼睛颜色的RGB数值
    Python study----------class的实例化
    HTML----------STUDY
    Python study----------字典 popitem()
    Python study----------Python搜索路径
    Python study----------第三方module-----chardet(识别编码)
  • 原文地址:https://www.cnblogs.com/DiZhang/p/12545113.html
Copyright © 2020-2023  润新知