python之电⼦表格的读取(read_excel函数)
python之电⼦表格的读取(read_excel函数)
对于xls与xlsx的表格数据,⽤read_excel函数
该函数的⽤法及参数含义如下:
read_exce ( io,sheet_name=0,header=0,skiprows=None,skip_footer=0,
index_col=None,names=None,parse_cols=None,parse_dates=False,
na_values=None,throusands=None,convert_float=True)
参数含义:
io:⽂件路径
sheet_name:指定表格的第⼏个sheet,默认第⼀个,可以传递整数也可以传递sheet的名称
header:是否需要将数据集的第⼀⾏⽤作表头,默认⽤作
skiprows:指定需要跳过原数据集中的起始⾏数
skip_footer:指定需要跳过原数据集中的末尾⾏数
names:如果原数据集中没有变量,可以通过该参数在数据读取时给数据框添加具体的表头
index_col:指定哪些列⽤作数据框的⾏索引(标签)
parse_cols:为True时,则尝试解析数据框中的⾏索引;为列表,则尝试解析对应的⽇期列;参数为嵌套列表,则将某些列合并为⽇期列;如果参数为字典,则解析对应的列(即字典中的值),并⽣成新的变量名(即字典中的键)
converters:通过字典的形式,指定哪些列需要转换成什么形式
na_values:指定原数据中哪些特殊值代表了缺失值
throusands:指定原数据集中的千分位符
parse_dates:该参数在函数内不再⽣效
convert_float:默认将所有的数值型变量转换位浮点型变量
注意:
1. 不要将sheet_name写成sheetname,否则将提⽰错误:
TypeError: read_excel() got an unexpected keyword argument 'sheetname’
2. 当⼀个表格有多个sheet,⽤sheet_name传递整数时,默认0表⽰第⼀个sheet(计算机语⾔都是从0开始计数),所以若想读取第⼆
个sheet时,应该赋值1⽽不是2。
例如:当要读取的表格有且只有两个sheet时,你赋值2的话将提⽰错误:
TypeError: read_excel() got an unexpected keyword argument ‘sheetname’。
只有两个sheet,⽽你要读取第三个sheet,这就为难它了。
案例
待读取的数据如上图,要求:添加适当的表头;指定“未知”的值为缺失值;0开头的0部分不能省略,代码如下:
ad_excel(r'D:\Desktop\⼯作簿1.xlsx',
header=None,
names=['编号','⽇期','⾷物','价格','来源'],
python怎么读入excel
converters={0:str},
na_values='未知')
data  #返回数据
完成的效果如上图所⽰。
参考书籍《数据分析从⼊门到进阶》(机械⼯业出版社)感谢阅读与参考

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。