Python使用panda处理CSV文件--688IT编程网

Python使⽤panda处理CSV⽂件最近项⽬中遇到⼀些需要处理CSV⽂件的地⽅，遇到⼀些问题，因此做⼀下总结。

1. 读取CSV

import pandas as pd

# 读取CSV⽂件，指定哪些列要被读取进来

data = pd.read_csv(filePath, usecols=['a','b'])

2. 选择最后N条数据

data = data.tail(N)

'''

假如选取了最后100条数据，⾏号从100开始，那这时候索引值就会从100开始，

因为在我处理数据的过程中需要加上⼀列，索引对不上的话会出错。使⽤reset_index来重置索引

'''

3. 拼接dataframe

#在原有的数据上加上⼀列, axis = 0 竖向拼接，axis = 1 横向拼接

data = pd.concat([data, data1], axis =1)

4. 根据某⼀列的值对dataframe进⾏分组

for i, g upby(['user']):

python怎么读csv数据g = g.sort_values(by="probability")

#删除item值重复的⾏

g = g.drop_duplicates(subset='item', keep='last', inplace=False)

发表评论

688IT编程网

Python使用panda处理CSV文件

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

Python使用panda处理CSV文件

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式