函数upby参数as_index的意义
函数upby参数as_index的意义
含义:as_index决定了分组使⽤的属性是否成为新的表格的索引,默认是as_index=True,我的代码中常⽤:as_index=False.
使⽤作为索引只是会影响查询速度,⽽⼀般没有这样的需求。
as_index=True是常⽤的表格形式,⽽as_index=False除了表格有变化,显⽰也会不同。
⽂档
squeeze=False, observed=False,**kwargs)[source]
Group DataFrame or Series using a mapper or by a Series of columns.
groupby是什么函数A groupby operation involves some combination of splitting the object, applying a function,and combining the results. This can be used to group large am ounts of data and compute operations on th
ese groups.
Parameters:
sort :bool, default True
Sort group keys. Get better performance by turning this off. Note this does not influence the order of observations within each group. Groupby preser ves the order of rows within each group.
参考 ,来举个例⼦:
创建⼀个表格,有group_id,age,status三个属性。
import pandas as pd
test ={"group_id":[1,1,2,3,3,3,4,4],"age":[22,15,27,35,28,17,45,29],
"status":[1,2,3,4,5,6,7,8]}
df = pd.DataFrame(test)
df
group_id age status
0122
1115
2227
3335
4328
5317
6445
7429
as_index=True(默认)得到的是以group_id作为索引的DataFrame,这⾥我认为是在显⽰上索引名和属性名区分开,所以,group_id会
⽐age和status低⼀点。
as_index=False得到的表格就没有使⽤group_id作为索引。
补充使⽤双属性进⾏分组
as_index=True得到的是以group_id,age作为索引的DataFrame。
默认使⽤as_index=True的原因是将分组属性作为索引,这在之后的使⽤中能增加查询速度。
将属性A,B⼀起⽤于分组,也是同样的。
参考:
1. stackoverflow/questions/41236370/what-is-as-index-in-groupby-in-pandas
2. /pandas-docs/stable/reference/api/upby.html?
highlight=groupby#upby

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。