Pandas中DataFrame使用groupby()分组查询--688IT编程网

Pandas中DataFrame使⽤groupby（）分组查询

import pandas as pd

from numpy.random import seed

from numpy.random import rand

from numpy.random import randint

import numpy as np

# randint(low, high, size)中size表⽰⽣成随机数的个数,⽣成的随机数是整数。

seed(42)

df = pd.DataFrame({'Weather': ['cold', 'hot', 'cold', 'hot', 'cold', 'hot', 'cold'],

'Food': ['soup', 'soup', 'icecream', 'chocolate', 'icecream', 'icecream', 'soup'],

'Price': 10*rand(7), 'Number': randint(1, 9, 7)})

# 通过数据分组遍历各组数据

weather_group = df.groupby('Weather')

i = 0

# name是指分类的名称，group是具体的值。

for name, group in weather_group:

i = i+1

print('Group', i, name)

print(group)

# 输出各组数据的第⼀⾏内容和第⼆⾏内容，以及各组的平均值

print(weather_group.first())

print(weather_group.last())

print(an())

# 针对多列进⾏分组

wf_group = df.groupby(['Weather', 'Food'])

print('WF Groups', ups)

# 可以通过agg()⽅法，对数据施加⼀系列的Numpy函数，agg()还是强啊。

print('WF Aggregated\n', wf_group.agg([np.min, np.median]))

Group 1 cold

Weather Food Price Number

0 cold soup 3.745401 8

2 cold icecream 7.319939 4

4 cold icecream 1.560186 8

6 cold soup 0.580836 6

Group 2 hot

Weather Food Price Number

1 hot soup 9.507143 5

3 hot chocolate 5.986585 8

5 hot icecream 1.559945 3

Food Price Number

Weather

cold soup 3.745401 8

hot soup 9.507143 5

Food Price Number

Weather

cold soup 0.580836 6

hot icecream 1.559945 3

Price Number

Weather

cold 3.301591 6.500000

groupby分组hot 5.684558 5.333333

WF Groups {('cold', 'icecream'): Int64Index([2, 4], dtype='int64'), ('cold', 'soup'): Int64Index([0, 6], dtype='int64'), ('hot', 'chocolate'): Int64Index([3], dtype='i nt64'), ('hot', 'icecream'): Int64Index([5], dtype='int64'), ('hot', 'soup'): Int64Index([1], dtype='int64')}

WF Aggregated

Price Number

amin median amin median

Weather Food

cold icecream 1.560186 4.440063 4 6

soup 0.580836 2.163119 6 7

hot chocolate 5.986585 5.986585 8 8

icecream 1.559945 1.559945 3 3

soup 9.507143 9.507143 5 5

688IT编程网

Pandas中DataFrame使用groupby()分组查询

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

Pandas中DataFrame使用groupby()分组查询

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式