详解partitionby和groupby对⽐
今天⼤概弄懂了partition by和group by的区别联系。
1. group by是分组函数,partition by是分析函数(然后像sum()等是聚合函数);
2. 在执⾏顺序上,
以下是常⽤sql关键字的优先级
from > where > group by > having > order by
⽽partition by应⽤在以上关键字之后,实际上就是在执⾏完select之后,在所得结果集之上进⾏partition。
3.partition by相⽐较于group by,能够在保留全部数据的基础上,只对其中某些字段做分组排序(类似excel中的操作),⽽group by则只保留参与分组的字段和聚合函数的结果(类似excel中的pivot)。
partition by
group by
4.如果在partition结果上聚合,千万注意聚合函数是逐条累计运⾏结果的!⽽在group by后的结果集上使⽤聚合函数,会作⽤在分组下的所有记录上。
数据如下,
SQL1
,a.item,sum(a.num)
from table_temp a
group ,a.item
Result1
11条记录经group by后为10条,其中cc='cn' and item='8.1.1'对应的两条记录的num汇总成值3.
SQL2
,a.num, min(a.num) over (partition order by a.num asc) as amount
from table_temp a
group ,a.num;
,a.num, min(a.num) over (partition order by a.num desc) as amount
from table_temp a
group ,a.num;
Result2
两个sql的唯⼀区别在于a.num的排序上,但从结果红框中的数据对⽐可以看到amount值并不相同,且第⼆个结果集amount并不都是最⼩值1。
在这⾥就是要注意将聚合函数⽤在partition后的结果集上时,聚合函数是逐条累积计算值的!
其实partition by常同row_number() over⼀起使⽤,
select a.*, row_number() over (partition ,a.item order by a.num desc) as seq
group by的用法及原理详解from table_temp a
到此这篇关于详解partition by和group by对⽐的⽂章就介绍到这了,更多相关partition by和group by内容请搜索以前的⽂章或继续浏览下⾯的相关⽂章希望⼤家以后多多⽀持!
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论