• SQL Server进阶(七)集合运算


    概述

    为什么使用集合运算:

      在集合运算中比联接查询和EXISTS/NOT EXISTS更方便

    并集运算(UNION

     并集:两个集合的并集是一个包含集合AB中所有元素的集合。

    在T-SQL中。UNION集合运算可以将两个输入查询的结果组合成一个结果集。需要注意的是:如果一个行在任何一个输入集合中出现,它也会在UNION运算的结果中出现。T-SQL支持以下两种选项:

    (1)UNION ALL:不会删除重复行

    -- union all
    select country, region, city from hr.Employees
    union all
    select country, region, city from sales.Customers; 

    (2)UNION:会删除重复行

    -- union
    select country, region from hr.Employees
    union
    select country, region from sales.Customers; 

    交集运算(INTERSECT)

     交集:两个集合(记为集合A和集合B)的交集是由既属于A,也属于B的所有元素组成的集合。

    在T-SQL中,INTERSECT集合运算对两个输入查询的结果取其交集,只返回在两个查询结果集中都出现的行。

      INTERSECT集合运算在逻辑上会首先删除两个输入集中的重复行,然后返回只在两个集合中中都出现的行。换句话说:如果一个行在两个输入集中都至少出现一次,那么交集返回的结果中将包含这一行。

      例如,下面返回既是雇员地址,又是客户地址的不同地址:

    -- intersect
    select country, region, city from hr.Employees
    intersect
    select country, region, city from sales.Customers;

    这里需要说的是,集合运算对行进行比较时,认为两个NULL值相等,所以就返回该行记录。

    差集运算(EXCEPT

     差集:两个集合(记为集合A和集合B)的由属于集合A,但不属于集合B的所有元素组成的集合。

     在T-SQL中,集合之差使用EXCEPT集合运算实现的。它对两个输入查询的结果集进行操作,反会出现在第一个结果集中,但不出现在第二个结果集中的所有行。

      EXCEPT结合运算在逻辑上首先删除两个输入集中的重复行,然后返回只在第一个集合中出现,在第二个结果集中不出现的所有行。换句话说:一个行能够被返回,仅当这个行在第一个输入的集合中至少出现过一次,而且在第二个集合中一次也没出现过。

      此外,相比UNION和INTERSECT,两个输入集合的顺序是会影响到最后返回结果的。

      例如,借助EXCEPT运算,我们可以方便地实现属于A但不属于B的场景,下面返回属于员工抵制,但不属于客户地址的地址记录:

    -- except 
    select country, region, city from hr.Employees
    except
    select country, region, city from sales.Customers;

    集合运算优先级

    SQL定义了集合运算之间的优先级:INTERSECT最高,UNION和EXCEPT相等。

      换句话说:首先会计算INTERSECT,然后按照从左至右的出现顺序依次处理优先级相同的运算。

    -- 集合运算的优先级
    select country, region, city from Production.Suppliers
    except
    select country, region, city from hr.Employees
    intersect
    select country, region, city from sales.Customers;

    上面这段SQL代码,因为INTERSECT优先级比EXCEPT高,所以首先进行INTERSECT交集运算。因此,这个查询的含义是:返回没有出现在员工地址和客户地址交集中的供应商地址。

    集合运算的优先级

    1.INTERSECT>UNION=EXCEPT

    2.首先计算INTERSECT,然后从左到右的出现顺序依次处理优先级的相同的运算。

    3.可以使用圆括号控制集合运算的优先级,它具有最高的优先级。

    在排序函数的OVER字句中使用 ORDER BY ( SELECT <常量> )可以告诉SQL Server不必在意行的顺序。

    使用表表达式避开不支持的逻辑查询处理

    集合运算查询本身并不持之除ORDER BY意外的其他逻辑查询处理阶段,但可以通过表表达式来避开这一限制。

      解决方案就是:首先根据包含集合运算的查询定义一个表表达式,然后在外部查询中对表表达式应用任何需要的逻辑查询处理。

      (1)例如,下面的查询返回每个国家中不同的员工地址或客户地址的数量:

    select country, COUNT(*) as numlocations
    from (select country, region, city from hr.Employees
          union
          select country, region, city from sales.Customers) as U
    group by country;

    (2)例如,下面的查询返回由员工地址为3或5的员工最近处理过的两个订单:、

    select empid,orderid,orderdate 
    from (select top (2) empid,orderid,orderdate 
        from sales.Orders
        where empid=3
        order by orderdate desc,orderid desc) as D1
    union all
    select empid,orderid,orderdate 
    from (select top (2) empid,orderid,orderdate 
        from sales.Orders
        where empid=5
        order by orderdate desc,orderid desc) as D2;
  • 相关阅读:
    Summer Vacation(贪心,优先队列)
    方格探索(双端队列)
    Dream Team(最小费用流)
    Lucky Numbers(枚举,计数)
    Coins Respawn(负环,最短路)
    Preorder and Inorder(先序遍历+中序遍历求二叉树)
    Virus Tree 2(树形DP)
    Cards(并查集、环上DP)
    Max GCD(贪心、枚举)
    倒垃圾(思维题)
  • 原文地址:https://www.cnblogs.com/cnki/p/9574845.html
Copyright © 2020-2023  润新知