pandas处理excel⽂件之read_excel篇
pandas读取excel⽂件
p = pd.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=None, squeeze=False,dtype=None, engine=None,converters=None, true_values=None, false_values=None,skiprows=None, nrows=None, na_values=None, parse_dates=False,date_parser=None, thousands=None, comment=None, skipfooter=0,convert_float=True, **kwds)
pandas读取后返回DataFrame类
python怎么读入excelio:⽂件路径,python3以上格式如:C:\\Users\\sjyyz\\file\\pd2.xls
sheet_name : 读取⼯作表名称,默认为0,代表第⼀个⼯作表。sheet_name=[0,'⼈员信息‘,Sheet4],如果读取多个⼯作表,则显⽰表格的字典。
header=(n):取哪⼀⾏作为表头或者列名,可以是多⾏
names=['id','name'....]:长度必须与列长⼀致,主要是⽤来修改列名或是没有列明的⽂件
index_col = ['id'../]:⽤作索引的列
usecols = [A:C/0,1,3]:需要读取的列
squeeze=True/False: squeeze为True时,返回Series,反之返回DataFrame。
converters={'Name': str, 'Age': int} :强制规定列数据类型,pandas默认将⽂本类的数据读取为整型,⽤来保留以⽂本形式存储的数字。
skiprows=n/[a,b,c]:跳过特定⾏(前⼏⾏或者特定⾏a+1,b+1,c+1)
dtype={'id':str}#当python从excel读取数据是NAN时,⾃动会将它设置为float
import pandas as pd
books = pd.read_excel("C:\\Users\\sjyyz\\file\\books.xls",skiprows=3,usecols='c:f',dtype={'id':str})
print(books.index)
for i in books.index:
books['id'].at[i] = i+1
#当python从excel读取数据是NAN时,⾃动会将它设置为float,注意NAN不能强制转换成int
print(books['id'])
结果
0 NaN
1 NaN
2 NaN
3 NaN
4 NaN
5 NaN
6 NaN
7 NaN
8 NaN
9 NaN
10 NaN
11 NaN
12 NaN
13 NaN
14 NaN
15 NaN
16 NaN
17 NaN
18 NaN
19 NaN
Name: date, dtype: float64
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论