pythonpandas解析(读取、写入)CSV文件--688IT编程网

pythonpandas解析（读取、写⼊）CSV⽂件

1. 使⽤ pandas 读取 CSV ⽂件

原始数据包含了公司员⼯的数据：

Name Hire Date Salary Sick Days remaining

Graham Chapman03/15/1450000.0010

John Cleese06/01/1565000.008

Eric Idle05/12/1445000.0010

Terry Jones11/01/1370000.003

Terry Gilliam08/12/1448000.007

Michael Palin05/23/1366000.008将 CSV ⽂件读⼊ pandas DataFrame 快速⽽直接：

import pandas

df = ad_csv('hrdata.csv')

print(df)

就这样简单：仅仅三⾏代码，⽽且其中只有⼀⾏真正有⽤。ad_csv() 打开、分析并读取提供的 CSV ⽂件，并将数据存储在DataFrame 中，打印 DataFrame 会产⽣以下输出：

以下是值得注意的⼏点：

⾸先，pandas 识别到 CSV 的第⼀⾏包含列名，并⾃动使⽤它们。

但是，pandas 也在 DataFrame 中使⽤从零开始的整数索引，那是因为没有告诉它我们的索引应该是什么。

此外，如果查看列的数据类型，会看到 pandas 已将 Salary and Sick Days 剩余列正确转换为数字，但 Hire Date 列仍然是 String，这在交互模式下很容易确认：

让我们⼀次解决这些问题，要使⽤其他列作为 DataFrame 的索引，添加 index_col 可选参数：

df2 = ad_csv('hrdata.csv', index_col='Name')

print(df2)

现在，Name 字段就是我们的 DataFrame 索引：

接下来，让我们修复「Hire Date」字段的数据类型。可以使⽤ parse_dates 可选参数强制pandas 将数据作为⽇期读取，该参数定义为要作为⽇期处理的列名列表：

df3 = ad_csv('hrdata.csv', index_col='Name', parse_dates=['Hire Date'])

print(df3)

注意输出的差异：

现在⽇期格式正确，可以在交互模式下轻松确认：

如果 CSV ⽂件的第⼀⾏中没有列名，则可以使⽤ names 可选参数来提供列名的列表。如果要覆盖第⼀⾏中提供的列名，也可以使⽤此选项。在这种情况下，还必须使⽤header = 0可选参数告诉 ad_csv()忽略现有列名：

df4 = ad_csv('hrdata.csv',

index_col='Employee',

parse_dates=['Hired'],

header=0,

names=['Employee', 'Hired','Salary', 'Sick Days'])

print(df4)

请注意，由于列名称已更改，因此还必须更改index_col和parse_dates可选参数中指定的列，现在这会产⽣以下输出：

2. 使⽤ pandas 写⼊ CSV ⽂件

当然，如果⽆法将数据从 pandas 中输出，那 pandas 可能没有多⼤好处。将 DataFrame 写⼊CSV ⽂件就像读取⼀个⽂件⼀样简单。下⾯让我们将带有新列名称的数据写⼊新的 CSV ⽂件：

df5 = ad_csv('hrdata.csv',

index_col='Employee',

parse_dates=['Hired'],

header=0,

names=['Employee', 'Hired', 'Salary', 'Sick Days'])

<_csv('hrdata_modified.csv')

此代码与上述读取代码之间的唯⼀区别是 print(df) 替换为 df.to_csv()，新的 CSV ⽂件如下所⽰：python怎么读csv数据

参考

688IT编程网

pythonpandas解析(读取、写入)CSV文件

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林特征选择原理

自动驾驶系统中的随机森林算法解析

随机森林算法及其在生物信息学中的应用

监督学习中的随机森林算法解析(六)

随机森林算法在数据分析中的应用

机器学习——随机森林,RandomForestClassifier参数含义详解

随机森林的算法

随机森林算法作用

监督学习中的随机森林算法解析(十)

随机森林算法案例

随机森林案例

二分类问题常用的模型

绘制ssd框架训练流程

一种基于信息熵和DTW的多维时间序列相似性度量算法

SVM训练过程范文

如何使用支持向量机进行股票预测与交易分析

二分类交叉熵损失函数binary

tinybert_训练中文文本分类模型_概述说明

基于门控可形变卷积和分层Transformer的图像修复模型及其应用

人工智能开发技术的测试和评估方法

最新文章

基于随机森林的数据分类算法改进

人工智能中的智能识别与分类技术

基于人工智能技术的随机森林算法在医疗数据挖掘中的应用

随机森林回归模型的建模步骤

r语言随机森林预测模型校准曲线

《2024年随机森林算法优化研究》范文

标签列表