python3关于groupby函数最简单的介绍和理解--688IT编程网

python3关于groupby函数最简单的介绍和理解⾸先我们先来看下⽹上最经典的解释

即对不同列进⾏在分类，标准是先拆分在组合（如果有操作⽐如sum则可以进⾏操作）

什么意思呢。就是我们读取⽂件不是有很多列吗，如果我按列就⾏分类，那么先把选取列⼀样的挑出来

然后在进⾏操作。具体的看下下⾯⼀个例⼦

这⾥我们的列名省略了其实是df_lumns = ['user_id','item_id','behavior_type','item_category']

import pandas as pdgroupby是什么函数

import numpy as np

path_df_part_1 = r'C:\Users\yang\Desktop\ceshi.csv' #时间11.22-11.27的数据

path_df = open(path_df_part_1, 'r')

try:

df_part_1 = pd.read_csv(path_df, index_col = False, parse_dates = [0])

df_lumns = ['user_id','item_id','behavior_type','item_category']

finally:

path_df.close()

df_part_1['cumcount'] = df_upby(['user_id', 'behavior_type']).cumcount()#

print(df_part_1)

这⾥我们选取了groupby(['user_id', 'behavior_type']

可能刚开始不懂啥意思基本意思就是我⽤这两列进⾏分类树结构看过吗这两个列就相当于树的节点其他的列

通过这个节点再进⾏分⽀。还是不懂？没关系来个最直⽩的意思就是所有数据只要['user_id', 'behavior_type']

这两个取值⼀样就是⼀个⼩类。如果这两个取值不⼀样则就不是⼀类。可能单纯的说搞不懂，我们加了⼀个cumcount辅助理解

上述程序运⾏结果为上⾯所⽰，那么我们解释下什么叫

只要['user_id', 'behavior_type'] 这两个取值⼀样就是⼀个⼩类

我们看上图0-3⾏选取的groupby没有变即['user_id', 'behavior_type'] 没变则⼀直计数

⽽3和4（横⾏标签）相⽐'behavior_type' 由1变成4了则我们刚开始说的只要有⼀个变就不是⼀类了所以重新计数

现在懂了吧最基本的就是可以选取我们需要的列进⾏分类⽐如我们统计所有⽤户不同操作类型进⾏了多少次

⾸先我们必须先把同样的⽤户分在⼀起然后再把相同操作分在⼀起所以我们选取groupby(['user_id', 'behavior_type']

进⾏分类，⽽不是在很⼤的数据中茫茫没有思路

688IT编程网

python3关于groupby函数最简单的介绍和理解

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

python3关于groupby函数最简单的介绍和理解

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式