python用pd.read_csv()方法来读取csv文件,用DataFrame对象.t...--688IT编程网

python⽤pd.read_csv（）⽅法来读取csv⽂件，⽤DataFrame对象.t。。。

csv⽂件是⼀种⽤，和换⾏符区分数据记录和字段的⼀种⽂件结构，可以⽤excel表格编辑，也可以⽤记事本编辑，是⼀种类excel的数据存储⽂件，也可以看成是⼀种数据库.

⼀、⽤DataFrame对象.to_csv()⽅法来保存数据成csv⽂件

DataFrame 数据的保存和读取：

<_csv 写⼊到 csv ⽂件

<_json 写⼊到 json ⽂件

<_html 写⼊到 html ⽂件

<_excel 写⼊到 excel ⽂件

<_csv(path_or_buf=None, sep=', ', na_rep='', float_format=None, columns=None, header=True, index=True,

index_label=None, mode='w', encoding=None, compression=None, quoting=None, quotechar='"',

line_terminator='\n', chunksize=None, tupleize_cols=None, date_format=None, doublequote=True,

escapechar=None, decimal='.')

参数：

path_or_buf : ⽂件路径，如果没有指定则将会直接返回字符串的 json

sep : 输出⽂件的字段分隔符，默认为 “,”

na_rep : ⽤于替换空数据的字符串，默认为’’

float_format : 设置浮点数的格式（⼏位⼩数点）

columns : 要写的列

header : 是否保存列名，默认为 True ，保存

index : 是否保存索引，默认为 True ，保存

index_label : 索引的列标签名

⼆、pd.read_csv()⽅法来读取csv⽂件

pandas提供了pd.read_csv()⽅法可以读取其中的数据并且转换成DataFrame数据帧。python的强⼤之处就在于他可以把不同的数据库类型，⽐如txt/csv/.xls/.sql转换成统⼀的DataFrame格式然后进⾏统⼀的处理。真是做到了标准化。我们可以⽤以下代码来演⽰csv⽂件的读取操作。

import pandas as pd

data1 = pd.read_csv('rating.csv')

print(data1)

print("************取消第⼀⾏作为表头*************")

data2 = pd.read_csv('rating.csv',header=None)

print(data2)

print("************为各个字段取名**************")

data3 = pd.read_csv('rating.csv',names=['user_id','book_id','rating']) print(data3)

print("***********将某⼀字段设为索引***************")

data3 = pd.read_csv('rating.csv',

names=['user_id','book_id','rating'],

index_col ="user_id")

print(data3)

print("************⽤sep参数设置分隔符**************")

data4 = pd.read_csv('rating.csv',

names=['user_id','book_id','rating'],

sep=',')

print(data4)

print("************⾃动补全缺失数据为NaN**************")

data5 = pd.read_csv('data.csv',header=None)

print(data5)

输出结果如下：

12585

0240814

122605

2292965

3223183

42264

523153

62334

723015

************取消第⼀⾏作为表头*************

012

012585

1240814

222605

3292965

4223183

52264

623153

72334

823015

************为各个字段取名**************

user_id book_id rating

python怎么读取json文件012585

1240814

222605

3292965

4223183

52264

623153

72334

823015

***********将某⼀字段设为索引***************

book_id rating

user_id

12585

240814

22605

292965

223183

2264

23153

2334

23015

************⽤sep参数设置分隔符**************

user_id book_id rating

012585

1240814

222605

3292965

4223183

52264

623153

72334

823015

************⾃动补全缺失数据为NaN************** 01234

012.03 4.05

167.08 NaN 10

211 NaN 1314.015

[Finished in4.5s]

输出结果的具体解释参考代码中的注释。

688IT编程网

python用pd.read_csv()方法来读取csv文件,用DataFrame对象.t...

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

python用pd.read_csv()方法来读取csv文件,用DataFrame对象.t...

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式