pandas合并groupby_PandasGroupBy⽤法
Pandas GroupBy⽤法,现在,我们来深⼊分析GoupBy过程及其⼯作原理,它的操作模式由三个阶段组成:
分组:将数据集分成多个组
⽤函数处理:⽤函数处理每⼀个组
合并:把不同组得到的结果合并起来
第⼀阶段,也就是分组阶段,根据给定标准,把Series或DataFrame等数据结构中的数据分成不同的组,分组标准常与索引或某⼀列具体的元素相关。groupby是什么函数
第⼆阶段也称为“⽤函数处理”,使⽤函数处理或者执⾏由函数定义的计算,为每组数组⽣成单⼀的值。
第三阶段为合并,把来⾃每⼀组的结果汇集到⼀起,合并成⼀个新对象。
GroupBy 实例
Pandas 并没有使⽤三个函数来表⽰这个过程,⽽只使⽤了groupby()函数,它⽣成的GroupBy对象是整
个过程的核⼼。通过如下例⼦来帮助理解,⾸先定义⼀个既包含数值⼜包含字符串的DataFrame对象。
输出结果如下:
假如想使⽤Color列的组标签,计算price1列的均值,你可以先获取到price1列,然后调⽤groupby()函数,参数指定为color列。
输出结果如下:
得到的对象为GroupBy对象,刚进⾏的操作其实就是分组操作,把含有相同颜⾊的⾏分到同⼀个组中。
可以调⽤GroupBy对象的group属性,查看DataFrame各⾏的分组情况,每个组指定好它所包含的⾏,就可以对每组进⾏操作获取结果了。
输出结果如下:
等级分组
前⾯介绍了⽤⼀列元素作为键为数据分组,同理,也可以使⽤多列,也就是使⽤多个键,按照等级关系分组。如下例所⽰:
输出结果如下:
我们也可以按照多列数据或整个DataFrame把数据分成⼏组,如果你不想反复多次使⽤GroupBy对象,最⽅便的办法就是⼀次就把所有的分组依据和计算⽅法都指定好,⽆需定义任何中间变量,如下列所⽰:
输出结果如下:

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。