pandas常⽤操作详解——数据读取函数read_csv()及导出函数to_csv()
read_csv()函数基本介绍:
功能:读取csv⽂件,构造DataFrame
常⽤参数详解:
filepath_or_buffer:待读取⽂件所在路径
sep:指定分隔符,默认以','分隔
header:将⾏号⽤作列名,且是数据的开头。
header=0表⽰第⼀⾏是数据⽽不是⽂件的第⼀⾏。因为当skip_blank_lines=True时,这个参数忽略注释⾏和空⾏。
header=None,即指认为原始⽂件数据没有列索引,这样read_csv为其⾃动加上列索引{从0开始}
encoding:指定字符集类型,默认为'utf-8';当数据读⼊or导出时中⽂字符出现编码错误时,可以试试'GB18030'or'utf-8-sig'
index_col:int类型值,序列,FALSE(默认 None)
  将真实的某列当做index(列的数⽬,甚⾄列名)
  index_col为指定数据中那⼀列作为Dataframe的⾏索引,也可以可指定多列,形成层次索引,默认为None,即不指定⾏索引,这样系统会⾃动加上⾏索引。
names:⾃定义列名,默认为None
python怎么读csv数据
举例说明:
#举例
ad_csv(r'C:\Users\Miles\Desktop\for-wh\line-1相同位置不同时刻\case1-1-line')
#将nodenumber作为索引
ad_csv(r'C:\Users\Miles\Desktop\for王浩\line-1相同位置不同时刻\case1-1-line',index_col='nodenumber')
#header的默认值为0,即将数据第⼀⾏作为列名;header=None时,认为数据中没有列名,pandas⾃动设置了列名
ad_csv(r'C:\Users\Miles\Desktop\for王浩\line-1相同位置不同时刻\case1-1-line',header=None)
'1.⾃定义列名'
#1.在read_csv中定义参数names,若原数据中⽆列名,需定义header=None,否则第⼀⾏数据将缺失掉
ad_csv(r'C:\Users\Miles\Desktop\for王浩\line-1相同位置不同时刻\case1-1-line',header=None,names=['num','X','Y','air'])
#2.读取数据之后重新命名列名,只是多了⼀⾏语句
ad_csv(r'C:\Users\Miles\Desktop\for王浩\line-1相同位置不同时刻\case1-1-line')
to_csv()函数介绍:
功能:将处理好的数据导出⾄指定⽂件夹
#to_csv的参数同样很多,但常⽤的就那么两三个
.to_csv(path_or_buf=None, sep=', ', na_rep='', float_format=None, columns=None,
header=True, index=True, index_label=None, mode='w', encoding=None, compression=None,
quoting=None, quotechar='"', line_terminator='\n', chunksize=None, tupleize_cols=None,
date_format=None, doublequote=True, escapechar=None, decimal='.')
常⽤参数解释:
path_or_buf:输出路径
encoding:字符串的编码,python3默认为'UTF-8',要是⼤家发现导出中⽂字符出错的话,可以试试'GB-18030'or'utf-8-fig' index:布尔值,默认为True;当index=None时,⾏索引不会写⼊导出的⽂件
float_format:字符串,默认为None;可以指定输出浮点数的格式,如'%.2f'为保留两位⼩数
<_csv(output_path,index=False)

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。