PythonGroupby分组聚合
01 ⽇常需求
今天我们继续对Python中pandas包进⾏学习。
在我们的⽇常⽣活中,常常会出现⼀些需求,⽐如:
各品种冬枣的平均⼤⼩是多少?
各班级学⽣的语⽂最⾼分是多少?
各品牌⼿机的最⾼最低价格是多少?
等等
在这些需求中,都出现了分组统计的影⼦,对于⼩数据量,我们可以⼿动计算或者进⼊excel表计算,但对于⼤数据量的分组运算,就需要Python出马了。
02 出镜率极⾼的gr o upby
在Python中,分组聚合函数是groupby,它的执⾏原理很简单:
1. 分拆,将数据按照规定的列进⾏拆分,⽐如按照班级名拆分
2. 应⽤,将拆分后的数据应⽤于某个指定函数,⽐如求平均值,这个函数可以是内置的,也可以是⾃定义的
groupby分组3. 汇总,将计算结果汇总在⼀起,作为最终结果
今天的练习主要针对groupby后的分组数据进⾏聚合,分为⼀下三点练习
1. 调⽤内置函数,如min(), max() mean()
2. 调⽤⾃定义函数,函数⾃定义好之后,使⽤agg()调⽤即可,可以调⽤多个函数,如agg([func1,func2]),func可以
是内置的,内置时需要加引号,agg()只能针对⼀维数组
3. 使⽤apply()可以调⽤更复杂的⾃定义函数,如排序、取前n个值等
03 练习代码
同样地,为了更好的排版和可视化效果,我将代码放在了github上,代码中详细讲解了groupby的运⾏规则和具体使⽤⽅法,欢迎朋友们点击查看交流。
练习代码
推荐电脑端查看哦
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论