Hive集合函数collect_set()collect_list()集合函数 collect_set() collect_list()
实验数据1
userid username
11101张三
11101李四
11101王五
11101赵六
11101张三
注意到张三出现了两次
-- 建表语句
create table temp.strategy_temp_20200813_function_test (
userid string,
username string
)row format delimited fields terminated by ',' STORED AS TEXTFILE
-- 查看
select * from temp.strategy_temp_20200813_function_test t
collect_set()
collect_set()通常⽤于列转⾏,将某⼀个列转换成为⼀⾏且去重。
-- 去重的合并
select userid, collect_set(username) username
from temp.strategy_temp_20200813_function_test t
group by userid
结果是
user_id username
11101["张三","李四",”王五","赵六"]
若要不去重,则需要使⽤collect_list(),若需要对合并内容排序则使⽤group_concat()
collect_list()
collect_list()通常⽤于列转⾏,将某⼀列合并后,转换成⼀⾏,不去重。
-- 去重的合并
select userid, collect_list(username) username
from temp.strategy_temp_20200813_function_test t
group by userid
结果是
python新手代码userid
user_id username
11101["张三","李四",”王五","赵六","张三"]

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。