value_counts()函数value_counts函数⽤于统计dataframe或series中不同数或字符串出现的次数
ascending=True时,按升序排列.
normalize=True时,可计算出不同字符出现的频率,画柱状图统计时可以⽤到.
# trian中标签的⽐例
label_proportion = train['label'].value_counts(normalize=True).reset_index().sort_values(by=['index'])
# index label
# 5 1 0.029851
# 2 2 0.199005
# 0 3 0.298507
# 1 4 0.248756
# 3 5 0.149254
# 4 6 0.074627
df1= DataFrame( {"a":[3,4,5,6,2,3,4,4], "b":[2,4,5,6,5,4,3,4]} )
print(df1)
#dataframe要借助apply来应⽤value_counts()
print(df1.apply(pd.value_counts))
# map中括号内是series类型,key是a列的数,values是出现的次数
print(df1['a'].map(df1['a'].value_counts()))
print(df1['a'].value_counts()) #加括号时可直接统计出a列每个元素出现的次数value函数什么意思
a b
0 3 2
1 4 4
2 5 5
3 6 6
4 2 5
5 3 4
6 4 3
7 4 4
a b
2 1 1
3 2 1
4 3 3
5 1 2
6 1 1
0 2
1 3
2 1
3 1
4 1
5 2
6 3
7 3
Name: a, dtype: int64
输出
blog.csdn/qq_20412595/article/details/79921849
blog.csdn/qq_42665335/article/details/81177699
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论