python保存excel文件列宽自适应解决方案--688IT编程网

python保存excel⽂件列宽⾃适应解决⽅案

背景

python使⽤pandas库或其他⼯具处理excel⽂件有⼀个很尴尬的问题，就是保存成的excel⽂件⼏乎没有⼀点排版，⽐如这样的:

每⼀列都是⼀样宽，有些列内容太长会直接溢出单元格，很不美观。少量的表格还可以耐⼼的⼿动调整列宽，处理的表格多了就显得很⿇烦。所以我想了⼀种办法解决这个问题。

思路

这个问题的关键在于获得每⼀列应有的列宽，并调整它。通常只需要获得每⼀列内容的最⼤长度就可以达到⽬标。这⾥的长度不应该是字符串的长度，⽽是⼀串字符在excel表格中占的长度。经过观察可以发现，⼀个汉字的“长度”约为2，⼀个字母或数字的长度为1。由于⼤部分内容都是由汉字字母数字构成的，所以知道这点就⾜够完成我的程序了，这⾥使⽤了ord函数获得字符的ASCII值简单地判断⼀下是不是汉字。

核⼼代码：

for elem in str_list:

elem_split =list(elem)

length =0

for c in elem_split:

if ord(c)<=256:

length +=1

else:

length +=2

len_list.append(length)

完整实现

当然仅仅调整列宽还是不够的，我还希望可以实现当字符串过长时实现⾃动换⾏、合并单元格、涂⾊等功能，所以最终我将其封装成了⼀个类，根据不同的需求可实现各种功能。

包括：保存⽂件时列宽⾃适应、添加sheet⽽不是覆盖原xlsx⽂件、合并相同内容的单元格等

2020-04-18代码更新

# -*- coding:utf8 -*-

from openpyxl.styles import Alignment

from openpyxl.styles import PatternFill

from openpyxl.styles import Font

from openpyxl import Workbook, load_workbook

from os import remove, path

class XlsxSaver:

"""

⼀个将DataFrame转换成格式化excel的⼯具

"""

def__init__(self, df_in, filename='a.xlsx', sheet_name='Sheet1'):

"""

df_in : 从⼀个DataFrame对象获取表格内容

filename : ⽂件名

sheet_name : 表名

"""

self.filename = filename # 保存的xlsx⽂件的名字

self.user_def =[]# 储存由⽤户⾃定义的列的列名，这些列不再参与⾃动计算列宽

ists(filename):

# 如果⽂件存在，就直接打开，添加Sheet

self.wb = load_workbook(filename)

self.sheet = ate_sheet(sheet_name)

else:

# 如果⽂件不存在，就创建表格

self.wb = Workbook()

self.sheet = self.wb.active

self.sheet.title = sheet_name

# 将df的内容复制给sheet

self.df = py()

self.sheet.append(list(lumns))

for row in range(0,len(list(self.df.index))):

for col in range(0,len(list(lumns))):

ll(row+2, col+1).value = self.df.iloc[row, col]# 注意：sheet⾏列从1开始计数

def remove_file(self):

remove(self.filename)

def set_sheet_name(self, sheet_name):

self.sheet.title = sheet_name

def set_filename(self, filename):

self.filename = filename

def get_maxlength(self, series_in, col):

"""

获取⼀个类型为object的Series中的最⼤占位长度，⽤于确定导出的xlsx⽂件的列宽

col : 表头，也参与⽐较，解决有时候表头过长的问题

"""

series = series_in.fillna('-')# 填充空值，防⽌出现nan

str_list =list(series)

len_list =[]

for elem in str_list +[col]:

elem_split =list(elem)

length =0

for c in elem_split:

if ord(c)<=256:

length +=1

length +=2

len_list.append(length)

return max(len_list)

def__auto_width(self):

cols_list =list(lumns)# 获取列名

for i in range(0,len(cols_list)):

col = cols_list[i]

if col in self.user_def:

continue

ll(1, i+1).font = Font(bold=True)# 加粗表头

letter =chr(i+65)# 由ASCII值获得对应的列字母

max_len = _maxlength(self.df[col].astype(str), col)

if max_len <=12:

lumn_dimensions[letter].width =12

elif max_len <=50:

lumn_dimensions[letter].width = max_len +2

else:

lumn_dimensions[letter].width =50

for cell in self.sheet[letter]:

cell.alignment = Alignment(wrap_text=True)

def set_width(self, col_name, width):

# 提供调整列宽的接⼝

index =list(lumns).index(col_name)

letter =chr(index+65)

lumn_dimensions[letter].width = width

self.user_def.append(col_name)

def set_color(self, col_name, color, rule):

# 提供设置颜⾊的接⼝，rule：规则函数

index =list(lumns).index(col_name)

letter =chr(index+65)

for cell in self.sheet[letter]:

if rule(cell.value):

cell.fill = PatternFill(fill_type="solid", start_color=color, end_color=color)

def set_center_alignment(self, col_name):

index =list(lumns).index(col_name)

letter =chr(index+65)

for cell in self.sheet[letter]:

cell.alignment = Alignment(wrap_text=True, horizontal='center')

def save(self):

# ⾃动调整列宽，并保存

self.__auto_width()

self.wb.save(self.filename)

def set_merge(self, col_name):

self.user_def.append(col_name)# 设置为⾃定义列

# 设置⼀列合并单元格

index =list(lumns).index(col_name)

letter =chr(index+65)

i =1

while True:

if i >= self.sheet.max_row:

# 结束条件：单元格到底

break

cell = self.sheet[letter+str(i)]

j = i+1# 第⼀步指向下⼀个单元格

while True:

# 这个过程对j进⾏试探，最终j指向的单元格是与i连续相同的最后⼀个

cell_next = self.sheet[letter+str(j)]

if cell_next.value != cell.value:

break

else:

j +=1

if j > self.sheet.max_row:

j -=1

break

if j-i >=1and cell.value !=''and cell.value:

getsavefilename

# 如果有连续两格以上的单元格内容相同，进⾏融合

msg ='%s%d:%s%d'%(letter,i,letter,j)

_cells(msg)

# 控制⼀下格式

self.sheet[letter+str(i)].alignment = Alignment(horizontal='center',

vertical='top',

wrap_text=True)

i = j+1# 继续指向下个单元格

使⽤⽰例

df = pd.read_sql(SQL, conn) # 从数据库获取⼀张表

xlsx = XlsxSaver(df, 'output.xlsx', 'sheet1') # 初始化⼀个对象, 设定保存后的⽂件名和表名xlsx.set_width('col1', 30) # ⼿动指定某列列宽

xlsx.set_merge('col2') # 设定col2列⾃动合并相邻相同的单元格

xlsx.save() # 储存, 此时除了col2列被⼿动指定了列宽，其他列都执⾏⾃适应的列宽

注: 如果对格式没有特别的要求的话没必要这么⼤费周章了，可以使⽤以下函数

def save_as_excel(df,xlsx_name='a.xlsx',sheet_name='sheet1',startrow=0,startcol=0):

"""

功能是保存⼀个df对象为excel⽂件(xlsx)

df：要保存的dataFrame对象

xlsx_name：要保存的名字，注意加上后缀

sheet_name：要保存的表的名字

"""

writer=pd.ExcelWriter(xlsx_name)

<_excel(writer,sheet_name = sheet_name,startrow=startrow,startcol=startcol,index=False) writer.save()#需要加上这⼀⾏，否则⽆法⽣成⽂件

688IT编程网

python保存excel文件列宽自适应解决方案

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

python保存excel文件列宽自适应解决方案

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式