pandas处理excel⽂件之read_excel篇
pandas读取excel⽂件
p = pd.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=None, squeeze=False,dtype=None, engine=None,converters=None, true_values=None, false_values=None,skiprows=None, nrows=None, na_values=None, parse_dates=False,date_parser=None, thousands=None, comment=None, skipfooter=0,convert_float=True, **kwds)
pandas读取后返回DataFrame类
python怎么读入excel
io:⽂件路径,python3以上格式如:C:\\Users\\sjyyz\\file\\pd2.xls
sheet_name : 读取⼯作表名称,默认为0,代表第⼀个⼯作表。sheet_name=[0,'⼈员信息‘,Sheet4],如果读取多个⼯作表,则显⽰表格的字典。
header=(n):取哪⼀⾏作为表头或者列名,可以是多⾏
names=['id','name'....]:长度必须与列长⼀致,主要是⽤来修改列名或是没有列明的⽂件
index_col = ['id'../]:⽤作索引的列
usecols = [A:C/0,1,3]:需要读取的列
squeeze=True/False: squeeze为True时,返回Series,反之返回DataFrame。
converters={'Name': str, 'Age': int} :强制规定列数据类型,pandas默认将⽂本类的数据读取为整型,⽤来保留以⽂本形式存储的数字。
skiprows=n/[a,b,c]:跳过特定⾏(前⼏⾏或者特定⾏a+1,b+1,c+1)
dtype={'id':str}#当python从excel读取数据是NAN时,⾃动会将它设置为float
import pandas as pd
books = pd.read_excel("C:\\Users\\sjyyz\\file\\books.xls",skiprows=3,usecols='c:f',dtype={'id':str})
print(books.index)
for i in books.index:
books['id'].at[i] = i+1
#当python从excel读取数据是NAN时,⾃动会将它设置为float,注意NAN不能强制转换成int
print(books['id'])
结果
0    NaN
1    NaN
2    NaN
3    NaN
4    NaN
5    NaN
6    NaN
7    NaN
8    NaN
9    NaN
10  NaN
11  NaN
12  NaN
13  NaN
14  NaN
15  NaN
16  NaN
17  NaN
18  NaN
19  NaN
Name: date, dtype: float64

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。