sqlserver交集,差集的⽤法(集合运算)
概述
为什么使⽤集合运算:
在集合运算中⽐联接查询和EXISTS/NOT EXISTS更⽅便。
并集运算(UNION)
并集:两个集合的并集是⼀个包含集合A和B中所有元素的集合。
在T-SQL中。UNION集合运算可以将两个输⼊查询的结果组合成⼀个结果集。需要注意的是:如果⼀个⾏在任何⼀个输⼊集合中出现,它也会在UNION运算的结果中出现。T-SQL⽀持以下两种选项:
(1)UNION ALL:不会删除重复⾏
-- union all
select country, region, city from hr.Employees
union all
select country, region, city from sales.Customers;
(2)UNION:会删除重复⾏
-- union
select country, region from hr.Employees
union
select country, region from sales.Customers;
交集运算(INTERSECT)
交集:两个集合(记为集合A和集合B)的交集是由既属于A,也属于B的所有元素组成的集合。
在T-SQL中,INTERSECT集合运算对两个输⼊查询的结果取其交集,只返回在两个查询结果集中都出现的⾏。
INTERSECT集合运算在逻辑上会⾸先删除两个输⼊集中的重复⾏,然后返回只在两个集合中中都出现的⾏。换句话说:如果⼀个⾏在两个输⼊集中都⾄少出现⼀次,那么交集返回的结果中将包含这⼀⾏。
例如,下⾯返回既是雇员地址,⼜是客户地址的不同地址:
-- intersect
select country, region, city from hr.Employees
intersect
select country, region, city from sales.Customers;
这⾥需要说的是,集合运算对⾏进⾏⽐较时,认为两个NULL值相等,所以就返回该⾏记录。
差集运算(EXCEPT)
差集:两个集合(记为集合A和集合B)的由属于集合A,但不属于集合B的所有元素组成的集合。
在T-SQL中,集合之差使⽤EXCEPT集合运算实现的。它对两个输⼊查询的结果集进⾏操作,反会出现在第⼀个结果集中,但不出现在第⼆个结果集中的所有⾏。
EXCEPT结合运算在逻辑上⾸先删除两个输⼊集中的重复⾏,然后返回只在第⼀个集合中出现,在第⼆个结果集中不出现的所有⾏。换句话说:⼀个⾏能够被返回,仅当这个⾏在第⼀个输⼊的集合中⾄少出现过⼀次,⽽且在第⼆个集合中⼀次也没出现过。
此外,相⽐UNION和INTERSECT,两个输⼊集合的顺序是会影响到最后返回结果的。
例如,借助EXCEPT运算,我们可以⽅便地实现属于A但不属于B的场景,下⾯返回属于员⼯抵制,但不属于客户地址的地址记录:
-- except
select country, region, city from hr.Employees
except
select country, region, city from sales.Customers;
集合运算优先级
SQL定义了集合运算之间的优先级:INTERSECT最⾼,UNION和EXCEPT相等。
换句话说:⾸先会计算INTERSECT,然后按照从左⾄右的出现顺序依次处理优先级相同的运算。
-- 集合运算的优先级
select country, region, city from Production.Suppliers
except
select country, region, city from hr.Employees
intersect
select country, region, city from sales.Customers;
上⾯这段SQL代码,因为INTERSECT优先级⽐EXCEPT⾼,所以⾸先进⾏INTERSECT交集运算。因此,这个查询的含义是:返回没有出现在员⼯地址和客户地址交集中的供应商地址。
集合运算的优先级
1.INTERSECT>UNION=EXCEPT
2.⾸先计算INTERSECT,然后从左到右的出现顺序依次处理优先级的相同的运算。
3.可以使⽤圆括号控制集合运算的优先级,它具有最⾼的优先级。
在排序函数的OVER字句中使⽤ ORDER BY ( SELECT <;常量> )可以告诉SQL Server不必在意⾏的顺序。
使⽤表表达式避开不⽀持的逻辑查询处理
集合运算查询本⾝并不持之除ORDER BY意外的其他逻辑查询处理阶段,但可以通过表表达式来避开这⼀限制。
解决⽅案就是:⾸先根据包含集合运算的查询定义⼀个表表达式,然后在外部查询中对表表达式应⽤任何需要的逻辑查询处理。
(1)例如,下⾯的查询返回每个国家中不同的员⼯地址或客户地址的数量:
select country, COUNT(*) as numlocations
from (select country, region, city from hr.Employees
union
select country, region, city from sales.Customers) as U
group by country;
(2)例如,下⾯的查询返回由员⼯地址为3或5的员⼯最近处理过的两个订单:、
select empid,orderid,orderdate
from (select top (2) empid,orderid,orderdate
from sales.Orders
where empid=3
order by orderdate desc,orderid desc) as D1
union all
select empid,orderid,orderdate
from (select top (2) empid,orderid,orderdate
from sales.Orders
exists的用法where empid=5
order by orderdate desc,orderid desc) as D2;
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论