pythonopenpyxl使⽤⽅法详解
openpyxl特点
openpyxl(可读写excel表)专门处理Excel2007及以上版本产⽣的xlsx⽂件,xls和xlsx之间转换容易注意:如果⽂字编码是“gb2312” 读取后就会显⽰乱码,请先转成Unicode
1、openpyxl 读写单元格时,单元格的坐标位置起始值是(1,1),即下标最⼩值为1,否则报错!
tableTitle = ['userName', 'Phone', 'age', 'Remark']
# 维护表头
# if row < 1 or column < 1:
# raise ValueError("Row or column values must be at least 1")
# 如上,openpyxl 的⾸⾏、⾸列是(1,1)⽽不是(0,0),如果坐标输⼊含有⼩于1的值,提⽰:Row or column values must be at least 1,即最⼩值为1.
for col in range(len(tableTitle)):
c = col + 1
2、openpyxl ⽀持直接横纵坐标访问,如
ws['A4'] = 4 #直接赋值
openpyxl操作excel
Excel⽂件三个对象
workbook:⼯作簿,⼀个excel⽂件包含多个sheet。
sheet:⼯作表,⼀个workbook有多个,表名识别,如“sheet1”,“sheet2”等。
cell:单元格,存储数据对象
1、新建表
A workbook⾄少创建⼀个worksheet.
通过openpyxl.workbook.Workbook.active()得到worksheet
wb = Workbook(encoding='UTF-8')
ws = wb.active
注意:
该⽅法使⽤_active_sheet_index属性, 默认会设置0,也就是第⼀个worksheet。除⾮⼿动修改,否则使⽤active⽅法得到都是第⼀个worksheet。
你也可以创建worksheets,通过 openpyxl.ate_sheet() ⽅法:
ws = wb.create_sheet("Mysheet") #插⼊到最后(default)
#或者
ws = wb.create_sheet("Mysheet", 0) #插⼊到最开始的位置
创建的sheet的名称会⾃动创建,按照sheet,sheet1,sheet2⾃动增长,通过title属性可以修改其名称。
ws.title = "New Title"
ws = wb.create_sheet(title="Pip")
默认的sheet的tab是⽩⾊的,可以通过 RRGGBB颜⾊来修改sheet_properties.tabColor属性从⽽修改sheet tab按钮的颜⾊:
ws.sheet_properties.tabColor = "1072BA"
当你设置了sheet的名称,可以将其看成workbook中的⼀个key。也可以使⽤openpyxl._sheet_by_name() ⽅法
单元格赋值
#设定单元格的值,三种⽅式
ws['A4'] = 4 #write
逐⾏写
ws.append(iterable)
#添加⼀⾏到当前sheet的最底部(即逐⾏追加从第⼀⾏开始) iterable必须是list,tuple,dict,range,generator类型的。 1,如果是list,将list从头到尾顺序添加。 2,如果是dict,按照相应的键添加相应的键值。 ws.append([‘This is A1', ‘This is B1', ‘This is C1'])
ws.append({‘A' : ‘This is A1', ‘C' : ‘This is C1'})
ws.append({1 : ‘This is A1', 3 : ‘This is C1'})
2、读表操作
#打开⽂件:
from openpyxl import load_workbook
excel=load_workbook('E:/test.xlsx')
#获取sheet:
table = _sheet_by_name('Sheet1') #通过表名获取
#获取⾏数和列数:
rows=table.max_row #获取⾏数
cols=table.max_column #获取列数
#获取单元格值:
ll(row=row,column=col).value #获取表格内容,是从第⼀⾏第⼀列是从1开始的,注意不要丢掉 .value
#通过名字
ws = wb["frequency"]
#等同于 ws2 = wb.get_sheet_by_name('frequency')
#不知道名字⽤index
sheet_names = wb.get_sheet_names()
ws = wb.get_sheet_by_name(sheet_names[index])# index为0为第⼀张表
#或者
ws =wb.active
# 等同于 ws = wb.get_active_sheet() #通过_active_sheet_index设定读取的表,默认0读第⼀个表
#活动表表名
<_active_sheet().title
单元格使⽤
c = ws['A4']
d = ws.cell(row = 4, column = 2) #⾏列读写
逐⾏读取
#逐⾏读
ws.iter_rows(range_string=None, row_offset=0, column_offset=0): range-string(string)-单元格的范围:例如('A1:C4') row_offset-添加⾏ column_offset-添加列 # 返回⼀个⽣成器, 注意取值时要⽤value,例如:
for row in ws.iter_rows('A1:C2'):
for cell in row:
print cell
#读指定⾏、指定列:
ws#row是可迭代的
lumns#column是可迭代的
#打印第n⾏数据
print rows[n]#不需要⽤.value
print columns[n]#不需要⽤.value
显⽰有多少张表
<_sheet_names()
#显⽰表名,表⾏数,表列数
print ws.title
print ws.max_row
print ws.max_column
公式计算formulae
ws["A1"] = "=SUM(1, 1)"
ws["A1"] = "=SUM(B1:C1)"
3、操作实例
#-*-coding:utf-8-*-
# Time:2017/9/21 19:02
# Author:YangYangJun
from openpyxl import Workbook
l import load_workbook
import os
import time
def writeExcel():
# 获取⽂件路径
excelPath = os.path.wd(), 'ExcelData')
print "****"
print excelPath
# 定义⽂件名称
# invalid mode ('wb') or filename: 'Excel2017-09-21_20:15:57.xlsx' 这种⽅式明明⽂件,会提⽰保存失败,⽆效的⽂件名。
# nameTime = time.strftime('%Y-%m-%d_%H:%M:%S')
nameTime = time.strftime('%Y-%m-%d_%H-%M-%S')
excelName = 'Excel' + nameTime + '.xlsx'
ExcelFullName= os.path.join(excelPath,excelName)
print ExcelFullName
wb = Workbook()
ws = wb.active
tableTitle = ['userName', 'Phone', 'age', 'Remark']
# 维护表头
# if row < 1 or column < 1:
# raise ValueError("Row or column values must be at least 1")
# 如上,openpyxl 的⾸⾏、⾸列是(1,1)⽽不是(0,0),如果坐标输⼊含有⼩于1的值,提⽰:Row or column values must be at least 1,即最⼩值为1. for col in range(len(tableTitle)):
c = col + 1
# 数据表基本信息
tableValues = [['张学友', 152********, 18, '测试数据!'], ['李雷', 152********, 19, '测试数据!'],['Marry', 152********, 28, '测试数据!']]
for row in range(len(tableValues)):
ws.append(tableValues[row])
#wb.save(ExcelFullName)
wb.save(filename=ExcelFullName)
return ExcelFullName
def readExcel(ExcelFullName):
wb = load_workbook(ExcelFullName)
#wb = load_workbook(filename=ExcelFullName)
# 获取当前活跃的worksheet,默认就是第⼀个worksheet
#ws = wb.active
# 当然也可以使⽤下⾯的⽅法
# 获取所有表格(worksheet)的名字
sheets = wb.get_sheet_names()
print sheets
# # 第⼀个表格的名称
sheet_first = sheets[0]
# # 获取特定的worksheet
#
ws = wb.get_sheet_by_name(sheet_first)
print "***"
print sheet_first
print ws.title
print "^^^"
# 获取表格所有⾏和列,两者都是可迭代的
rows = ws.rows
print rows
columns = ws.columns
# 迭代所有的⾏
for row in rows:
line = [col.value for col in row]
print line
# 通过坐标读取值
print ws['A1'].value # A表⽰列,1表⽰⾏
ll(row=1, column=1).value
if __name__ == '__main__':
ExcelFullName = writeExcel()
readExcel(ExcelFullName)
# 显⽰表名,表⾏数,表列数
print "Work Sheet Titile:", ws.title
print "Work Sheet Rows:", ws.max_row
print "Work Sheet Cols:", ws.max_column
正则匹配多行以上就是本⽂的全部内容,希望对⼤家的学习有所帮助,也希望⼤家多多⽀持。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论