pandas学习笔记—agg()函数详解
⽬录
1、agg()函数定义
agg()函数是聚合函数,
DataFrame.agg(func,axis = 0,* args,** kwargs )
@@@func : 实现某种统计功能的函数,如果要不同列⽤求不同统计量,则⽤字典{‘⾏名/列名’,‘函数名’}指定。
2、举例
2.1 简单的列或⾏统计
import pandas as pd
import numpy as np
df1=pd.DataFrame({'age':[21,30,17,37,40,18,26],'weight':[120,100,132,140,94,89,123]})
df1
df1.agg('mean')
得到所有统计信息:
df1.describe()
按⾏统计:
df1.agg('mean',axis=1)
按⾏得到所有信息:
df1.T.describe()#先转置再统计
2.2 ⾃定义统计函数
举例:diff函数
def diff_max_min(x):
return x.max()- x.min()
df1.agg(diff_max_min,axis=1)
2.3 先groupby()再agg()
引⽤的例⼦:
df1=pd.DataFrame({'sex':list('FFMFMMF'),'smoker':list('YNYYNYY'),'age':[21,30,17,37,40,18,26],'weight':[120,100,132,140,94,89,123]}) df1
按“sex”和“smoker”进⾏分组,然后⽤agg()得到各分组的统计信息:
upby(['sex','smoker'])
grouped.agg('mean')
同样groupby之后也可以⾃定义的统计函数,此外describe()函数可以得到常见的各分组的统计信息:grouped.describe()

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。