Python的pandas的Dataframe使⽤groupby分组并求每组的统
计值
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(6, 4), index=list(range(6)), columns=list('abcd'))
df['d']=[1,2,2,1,1,2]
#这是依照d列为分组,d列中相同值的被分到⼀组
upby(df['d'])
此时的df2是⼀个ic.DataFrameGroupBy对象,for循环⼀下得到的是⼀个元组,第⼀个元素是分组的相同值,第⼆个则是⼀个Dataframe对象。
for k,dfi in df2:
print(k)
#下⾯这⾏是只取a/b/c三列数据,并把数据转为float,因为字符串不能计算。
dfii=dfi[['a', 'b', 'c']].astype('float')
print(dfii['a'].max())
print(dfii['b'].min())
groupby分组print(dfii['c'].sum())
独孤尚良dugushangliang——著
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论