• ORACLE中CONNECT BY...START WITH...的使用


    源:
    https://docs.oracle.com/cd/B19306_01/server.102/b14200/queries003.htm
    http://www.cnblogs.com/baiyixianzi/archive/2012/08/30/plsql12.html

    http://jingyan.baidu.com/article/5d368d1e182bb93f60c05784.html

    http://m.blog.csdn.net/wang_yunj/article/details/51040029

    这里留个备份,方便以后查看。

     

    oracle connect by用法

    分类: oracle

    1、基本语法

    select * from table [start with condition1]
        connect by [prior] id=parentid

    一般用来查找存在父子关系的数据,也就是树形结构的数据;其返还的数据也能够明确的区分出每一层的数据。

    • start with condition1 是用来限制第一层的数据,或者叫根节点数据;以这部分数据为基础来查找第二层数据,然后以第二层数据查找第三层数据以此类推。

    • connect by [prior] id=parentid 这部分是用来指明oracle在查找数据时以怎样的一种关系去查找;比如说查找第二层的数据时用第一层数据的id去跟表里面记录的parentid字段进行匹配,如果这个条件成立那么查找出来的数据就是第二层数据,同理查找第三层第四层…等等都是按这样去匹配。

    prior还有一种用法:

    select * from table [start with condition1]
        connect by id= [prior] parentid
    • 这种用法就表示从下往上查找数据,可以理解为从叶子节点往上查找父级几点,用第一层数据的parentid去跟表记录里面的id进行匹配,匹配成功那么查找出来的就是第二层数据;上面的那种就是从父级节点往下查找叶子节点。

    其他特性

    1. level关键字,代表树形结构中的层级编号;第一层是数字1,第二层数字2,依次递增。
    2. CONNECT_BY_ROOT方法,能够获取第一层集结点结果集中的任意字段的值;例CONNECT_BY_ROOT(字段名)。

    2、下面来贴两个例子

    2.1 从根节点查找叶子节点

    select t.*, level, CONNECT_BY_ROOT(id)
      from tab_test t
     start with t.id = 0
    connect by prior t.id = t.fid;

    这里写图片描述

    2.2 从叶子节点查找上层节点

    --第一种,修改prior关键字位置
    select t.*, level, CONNECT_BY_ROOT(id)
      from tab_test t
     start with t.id = 4
    connect by t.id = prior t.fid;
    
    --第二种,prior关键字不动 调换后面的id=fid逻辑关系的顺序
    select t.*, level, CONNECT_BY_ROOT(id)
      from tab_test t
     start with t.id = 4
    connect by prior t.fid = t.id;

    这里写图片描述

    3、写几个平常用到的其他一些用法

    3.1 生成数字序列结果集

    • 使用rownum实现1到10的序列。
    select rownum from dual connect by rownum<=10;

    结果集如下: 
    这里写图片描述

    • 使用level实现1到10的序列。
    select level from dual connect by level<=10;

    结果集如下: 
    这里写图片描述


    3.2 查询当前时间往前的12周的开始时间、结束时间、第多少周

    select sysdate - (to_number(to_char(sysdate - 1, 'd')) - 1) -
           (rownum - 1) * 7 as startDate,
           sysdate + (7 - to_number(to_char(sysdate - 1, 'd'))) -
           (rownum - 1) * 7 as endDate,
           to_number(to_char(sysdate, 'iw')) - rownum + 1 as weekIndex
      from dual
    connect by level<= 12;--将level改成rownum可以实现同样的效果

    这里写图片描述

    • d 表示一星期中的第几天
    • iw 表示一年中的第几周

    3.3 字符串分割,由一行变为多行

    1. 比如说分割01#02#03#04这种有规律的字符串
    select REGEXP_SUBSTR('01#02#03#04', '[^#]+', 1, rownum) as newport 
        from dual connect by rownum <= REGEXP_COUNT('01#02#03#04', '[^#]+');

    这里写图片描述


    4、省略prior关键字时数据的返回策略

    构造一个结果集,其中包含两条数据;然后查询level为1,2,3层的数据。

    select t.*, level
      from (select 1 as num from dual
            union
            select 2 as num from dual
            ) t
    connect by level <= 3;

    这里写图片描述

    1. 从上面截图的结果可以看出来省略prior关键字时第1层的数据就是初始结果集,第2层的数据是初始结果集的两倍,第3层的数据是初始结果集的3倍;假设初始结果集的记录为n条,查询m层的记录,则返回的记录数就是:这里写图片描述 条记录。

    2. 在省略prior关键字对数据进行操作时需要特别注意,返回的数据不一定是你所期望的那样。


    5、下面再看看几个例子,针对多条结果集当省略prior关键字时怎样获得正确的返回结果

    5.1 有下面一个结果集 
    这里写图片描述

    想要实现1-5,20-30的数据递增返回1、2、3、4、5、20、21、22、23、24、25、26、27、28、29、30总共16条记录。

    SQL如下:

    with temp0 as (
       select t.range_num,
              REGEXP_SUBSTR(t.range_num, '[^-]+', 1, 1) minNum, --最小num
              REGEXP_SUBSTR(t.range_num, '[^-]+', 1, 2) maxNum --最大num
         from range_table t
    )
    
    select t1.range_num ,t2.lv 
           from temp0 t1 join (
             select level lv from dual 
                   CONNECT BY LEVEL <= (select max(maxNum) from temp0 )
              ) t2
              on (t2.lv >=t1.minNum and t2.lv <=t1.maxNum);

    这里写图片描述 
    上面的sql中是先求出range_num的最大值与最小值,然后利用connect by 特性生成数值序列结果集,最后让两个结果集关联得到需要的结果。


    5.2 再看稍微复杂的结果集,输出结果格式跟上面一样

    这里写图片描述

    SQL如下:

    with temp0 as (
      select b.range_num,
             REGEXP_SUBSTR(b.range_num, '[^,]+', 1, c.lv) as newport,
             REGEXP_SUBSTR(REGEXP_SUBSTR(b.range_num, '[^,]+', 1, c.lv), '[^-]+', 1, 1) as minNum,
             REGEXP_SUBSTR(REGEXP_SUBSTR(b.range_num, '[^,]+', 1, c.lv), '[^-]+', 1, 2) as maxNum
      from (select regexp_count(a.range_num, '[^,]+') AS cnt, 
                   range_num
              from range_table a) b
      join (select LEVEL lv from dual CONNECT BY LEVEL <= 50) c 
      --这里的50表示的是range_num通过,分割后的数量,这里写死了50也可以sql动态max出来
            on c.lv <= b.cnt
    )
    
    select t1.range_num,t2.lv 
        from temp0 t1 
        join (
           select level lv from dual 
             CONNECT BY LEVEL <= (
                 select max(to_number(maxNum)) from temp0 
             )
           ) t2 
        on ((t2.lv >=t1.minNum and t2.lv <=t1.maxNum));

    这里写图片描述

    一、语法 
    大致写法:select * from some_table [where 条件1] connect by [条件2] start with [条件3]; 
    其中 connect by 与 start with 语句摆放的先后顺序不影响查询的结果,[where 条件1]可以不需要。 
    [where 条件1]、[条件2]、[条件3]各自作用的范围都不相同: 
    
    [where 条件1]是在根据“connect by [条件2] start with [条件3]”选择出来的记录中进行过滤,是针对单条记录的过滤, 不会考虑树的结构; 
    
    [条件2]指定构造树的条件,以及对树分支的过滤条件,在这里执行的过滤会把符合条件的记录及其下的所有子节点都过滤掉; 
    
    [条件3]限定作为搜索起始点的条件,如果是自上而下的搜索则是限定作为根节点的条件,如果是自下而上的搜索则是限定作为叶子节点的条件; 
    
    示例: 
    假如有如下结构的表:some_table(id,p_id,name),其中p_id保存父记录的id。 
    select * from some_table t where t.id!=123 connect by prior t.p_id=t.id and t.p_id!=321 start with t.p_id=33 or t.p_id=66; 
    
    对prior的说明: 
        prior存在于[条件2]中,可以不要,不要的时候只能查找到符合“start with [条件3]”的记录,不会在寻找这些记录的子节点。要的时候有两种写法:connect by prior t.p_id=t.id 或 connect by t.p_id=prior t.id,前一种写法表示采用自上而下的搜索方式(先找父节点然后找子节点),后一种写法表示采用自下而上的搜索方式(先找叶子节点然后找父节点)。 
    
    二、执行原理 
    connect by...start with...的执行原理可以用以下一段程序的执行以及对存储过程RECURSE()的调用来说明: 
    
    /* 遍历表中的每条记录,对比是否满足start with后的条件,如果不满足则继续下一条, 
    如果满足则以该记录为根节点,然后调用RECURSE()递归寻找该节点下的子节点, 
    如此循环直到遍历完整个表的所有记录 。*/ 
    for rec in (select * from some_table) loop 
    if FULLFILLS_START_WITH_CONDITION(rec) then 
        RECURSE(rec, rec.child); 
    end if; 
    end loop; 
    
    /* 寻找子节点的存储过程*/ 
    procedure RECURSE (rec in MATCHES_SELECT_STMT, new_parent IN field_type) is 
    begin 
    APPEND_RESULT_LIST(rec); /*把记录加入结果集合中*/ 
    /*再次遍历表中的所有记录,对比是否满足connect by后的条件,如果不满足则继续下一条, 
    如果满足则再以该记录为根节点,然后调用RECURSE()继续递归寻找该节点下的子节点, 
    如此循环直到找至叶子节点。*/ 
    for rec_recurse in (select * from some_table) loop 
        if FULLFILLS_CONNECT_BY_CONDITION(rec_recurse.child, new_parent) then 
          RECURSE(rec_recurse,rec_recurse.child); 
        end if; 
    end loop; 
    end procedure RECURSE; 
    
    三、使用探讨 
        从上面的执行原理可以看到“connect by...start with...”构造树的方式是:(1)如果是自上而下方式,则把表中的每一条记录都作为根节点来生成树,所以表中有多少条记录就会构造出多少棵树。(2)如果是自下而上的搜索方式,则把表中的每一条记录都作为叶子节点来生成分支,所以表中有多少条记录就会生成多少条分支。 
        因此如果表中的记录不是严格遵照每条记录都只能有一个父记录的原则,那么就可能有部分记录会存在于多棵树中,那么在查找记录的时候就可能会出现找到多条重复记录的异常情况
    --1.Hierarchical Queries: START WITH and CONNECT BY PRIOR clauses 
    --Hierarchical Queries
    --START WITH and CONNECT BY PRIOR clauses.
    
    SELECT employee_id, manager_id, first_name, last_name
    FROM employee_jh
    START WITH employee_id = 1
    CONNECT BY PRIOR employee_id = manager_id;
    
    EMPLOYEE_ID MANAGER_ID FIRST_NAME LAST_NAME
    ----------- ---------- ---------- ----------
    
              1          0 James      Smith
              2          1 Ron        Johnson
              3          2 Fred       Hobbs
              5          2 Rob        Green
              4          1 Susan      Jones
              6          4 Jane       Brown
              9          6 Henry      Heyson
              7          4 John       Grey
              8          7 Jean       Blue
             10          1 Kevin      Black
             11         10 Keith      Long
             12         10 Frank      Howard
             13         10 Doreen     Penn
    
    13 rows selected.
    
    --2.Using a Subquery in a START WITH Clause
    SELECT LEVEL,
           LPAD(' ', 2 * LEVEL - 1) || first_name || ' ' || last_name AS employee
    FROM employee_jh
    START WITH employee_id = (SELECT employee_id FROM employee_jh WHERE first_name = 'Kevin' AND last_name = 'Black')
    CONNECT BY PRIOR employee_id = manager_id;
    
         LEVEL EMPLOYEE
    ---------- -------------------------
             1  Kevin Black
             2    Keith Long
             2    Frank Howard
             2    Doreen Penn
    
    --3.Including Other Conditions in a Hierarchical Query
    SELECT LEVEL,
           LPAD(' ', 2 * LEVEL - 1) || first_name || ' ' ||
           last_name AS employee, salary
    FROM employee_jh
    WHERE salary <= 50000
    START WITH employee_id = 1
    CONNECT BY PRIOR employee_id = manager_id;
    
         LEVEL EMPLOYEE                      SALARY
    ---------- ------------------------- ----------
             3      Rob Green                 40000
             3      Jane Brown                45000
             4        Henry Heyson            30000
             3      John Grey                 30000
             4        Jean Blue               29000
             3      Keith Long                50000
             3      Frank Howard              45000
             3      Doreen Penn               47000
    
    8 rows selected.



    select num1,num2,level 

    from carol_tmp 

    start with num2=1008 

    connect by  num2=prior num1 order by level desc;

    prior放的左右位置决定了检索是自底向上还是自顶向下.很明显以上的sql选择了自底向上,所以最终得到了根节点。

    select num1,num2,level 

    from carol_tmp 

    start with num2=1008 

    connect by prior  num2= num1 order by level desc;

    这次prior和num2放在了一起,他意思就是从num2开始寻找其下面最小的叶节点。

    复制代码
    --取所有下级(含自己)
    select depot_id,    --编号
    depot_parent_id        --父级编号
    from table1 a
    where a.sys_type=1
    start with a.depot_id=v_depot_id --参数,传入当前级别,查询所有下级(含自己)
    connect by nocycle prior a.depot_id=a.depot_parent_id;
    复制代码
  • 相关阅读:
    bzoj 1179[Apio2009]Atm (tarjan+spfa)
    tarjan讲解(用codevs1332(tarjan的裸题)讲解)
    spfa
    codevs 1021 玛丽卡(spfa)
    Redis-mac安装与使用
    心血来潮整理一下STL——string
    基础算法整理(1)——递归与递推
    一道水的不能再水的中国盒子问题——小试牛刀(3)
    论久违的八数码问题——小试牛刀(2)
    8皇后及其普及(N)——小试牛刀(1)
  • 原文地址:https://www.cnblogs.com/pejsidney/p/8040521.html
Copyright © 2020-2023  润新知