pandas groupby agg用法
groupby是什么函数 在 pandas 中,groupby 和 agg 是一对非常有用的函数,可以用于将数据按照某个或多个列进行分组,并对分组后的数据进行聚合操作。
首先,我们需要通过 groupby 函数来创建分组对象。该函数接受一个或多个列名作为参数,用于指定按照哪些列进行分组。例如,我们可以按照某一列的值来分组数据,如下所示:
```
grouped = df.groupby('column_name')
```
接下来,我们可以使用 agg 函数对分组后的数据进行聚合操作。agg 函数接受一个字典作为参数,字典的键代表要进行聚合的列名,而字典的值则代表对应列要进行的聚合操作。常用的聚合操作包括求和(sum)、均值(mean)、最大值(max)、最小值(min)等。以下是一些示例:
```
grouped.agg({'col1': 'sum', 'col2': 'mean', 'col3': 'max'})
```
除了使用预定义的聚合操作,我们还可以自定义聚合函数。例如,我们可以定义一个计算中位数的函数,并将其应用于某一列:
```
def median_func(x):
dian(x)
grouped.agg({'col1': median_func})
```
在聚合操作的过程中,还可以对分组后的数据进行筛选。例如,我们可以筛选出某一列
的最大值大于某个阈值的分组,如下所示:
```
grouped.filter(lambda x: x['col1'].max() > threshold)
```
最后,我们还可以对分组后的数据进行排序操作。通过使用 sort_values 函数,并指定要排序的列名和排序方式,可以实现按照某一列的值对数据进行排序。
```
grouped.sort_values(by='col1', ascending=False)
```
使用 groupby 和 agg 函数可以对数据进行灵活的分组和聚合操作,便于我们快速分析和汇总数据。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论