linux通过awk命令实现分组统计(计数、求和)实现groupby功能awk实现分组统计
举例:
以下为待分析内容:
北京|少年|23
河北|少年|15
北京|青年|35
上海|少年|6
北京|中年|19
上海|青年|28
三列分别为地区、年龄段、去过城市个数
⼀、根据某列进⾏分组计数
根据地区统计⼈数
awk -F '|''{x[$1]++;} END{for(i in x) print(i ":" x[i])}'
结果如下:
上海:2
河北:1
北京:3
⼆、根据某列对另⼀列进⾏分组求和
根据年龄段统计去过城市个数
awk -F '|''{x[$2]+=$3;} END{for(i in x) print(i ":" x[i])}'
结果如下:
青年:63
中年:19
少年:44
三、根据限定条件进⾏分组计数或求和
统计北京地区的不同年龄段去过的城市个数
awk -F '|''{if($1=="北京") {x[$2]+=$3;}} END{for(i in x) print(i ":" x[i])}'
结果如下
青年:35
中年:19
groupby分组少年:23
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论