python中docx模块的使⽤_python使⽤docx模块读写docx⽂件
的⽅法与do。。。
⼀,docx模块
Python可以利⽤python-docx模块处理word⽂档,处理⽅式是⾯向对象的。也就是说python-docx模块会把word⽂档,⽂档中的段落、⽂本、字体等都看做对象,对对象进⾏处理就是对word⽂档的内容处理。
⼆,相关概念
如果需要读取word⽂档中的⽂字(⼀般来说,程序也只需要认识word⽂档中的⽂字信息),需要先了解python-docx模块的⼏个概念。
1,Document对象,表⽰⼀个word⽂档。
2,Paragraph对象,表⽰word⽂档中的⼀个段落
3,Paragraph对象的text属性,表⽰段落中的⽂本内容。
三,模块的安装和导⼊
需要注意,python-docx模块安装需要在cmd命令⾏中输⼊pip install python-docx,如下图表⽰安装成功(最后那句英⽂Successfully installed,成功地安装完成)
注意在导⼊模块时,⽤的是import docx。
from docx import Document
um.text import WD_ALIGN_PARAGRAPH #设置对象居中、对齐等。
um.text import WD_TAB_ALIGNMENT,WD_TAB_LEADER #设置制表符等
from docx.shared import Inches #设置图像⼤⼩
from docx.shared import Pt #设置像素、缩进等
from docx.shared import RGBColor #设置字体颜⾊
from docx.shared import Length #设置宽度
四,读取word⽂本
#-*- conding:utf-8 -*-
import docx
file=docx.Document(r"F:\python从⼊门到放弃\7\2\wenjian.docx")
print('段落:'+str(len(file.paragraphs)))
#
# for para in file.paragraphs:
# )
for i in range(len(file.paragraphs)):
print("第"+str(i)+"段的内容是:"+file.paragraphs[i].text)
五,写word⽂本
#-*- conding:utf-8 -*-
import sys
from docx import Document
from docx.shared import Inches
def main():
# reload(sys)
# sys.setdefaultencoding('utf-8')
# 创建⽂档对象
document = Document()
# 设置⽂档标题,中⽂要⽤unicode字符串
document.add_heading(u'我的⼀个新⽂档',0)
# 往⽂档中添加段落
p = document.add_paragraph('This is a paragraph having some ')
p.add_run('bold ').bold = True
p.add_run('and some ')
p.add_run('italic.').italic = True
# 添加⼀级标题
document.add_heading(u'⼀级标题, level = 1',level = 1)
document.add_paragraph('Intense quote',style = 'IntenseQuote')
# 添加⽆序列表
document.add_paragraph('first item in unordered list',style = 'ListBullet')
# 添加有序列表
document.add_paragraph('first item in ordered list',style = 'ListNumber') document.add_paragraph('second item in ordered list',style = 'ListNumber') document.add_paragraph('third item in ordered list',style = 'ListNumber')
# 添加图⽚,并指定宽度
document.add_picture('cat.png',width = Inches(2.25))
# 添加表格: 1⾏3列
table = document.add_table(rows = 1,cols = 3)
# 获取第⼀⾏的单元格列表对象
hdr_cells = ws[0].cells
# 为每⼀个单元格赋值
# 注:值都要为字符串类型
hdr_cells[0].text = 'Name'
hdr_cells[1].text = 'Age'
hdr_cells[2].text = 'Tel'
# 为表格添加⼀⾏
new_cells = table.add_row().cells
new_cells[0].text = 'Tom'
new_cells[1].text = '19'
new_cells[2].text = '12345678'
# 添加分页符
document.add_page_break()
# 往新的⼀页中添加段落
p = document.add_paragraph('This is a paragraph in new page.')
# 保存⽂档
document.save('demo1.doc')
if __name__ == '__main__':
main()
六,读取表格
#-*- conding:utf-8 -*-
import docx
doc = docx.Document('wenjian.docx')
for table in doc.tables: # 遍历所有表格
print('----table------')
for row ws: # 遍历表格的所有⾏
# row_str = '\t'.join([ for cell lls]) # ⼀⾏数据
# print row_str
for cell lls:
, '\t',)
print() #换⾏
七,添加段落
document=docx.Document() # 创建⼀个空⽩⽂档
document.styles['Normal'].font.name = '宋体' # 设置西⽂字体
document.styles['Normal']._element.rPr.rFonts.set(qn('w:eastAsia'), '宋体') # 设置中⽂字体p = document.add_paragraph()# 添加⼀个段落
p.paragraph_format.alignment = WD_ALIGN_PARAGRAPH.JUSTIFY#设置对齐⽅式
p.paragraph_format.line_spacing_rule = WD_LINE_SPACING.ONE_POINT_FIVE#设置⾏间距p.paragraph_format.space_after = Pt(0)#设置段后间距
run = p.add_run('content')#延长段落
b = RGBColor(255, 0, 0)#设置字体颜⾊run.font.size = Pt(22) # 设置字号
run.font.bold = True #设置下划线
⼋,docx模块其它常⽤⽅法
字号与磅值的关系
字号
磅值
⼋号
5
七号
5.5
⼩六
6.5
六号
7.5
⼩五
9
五号
10.5
⼩四
12
四号
14
⼩三
15
三号
16
⼩⼆
18
⼆号
22
⼩⼀
24
⼀号
26
⼩初
36
初号
42
新增页眉
section=document.sections[0]
header=section.header
bt1=header.paragraphs[0]
<='此处是页眉1'
新增头信息
t1=document.add_paragraph('此处Tetle信息','Title')
新增段落 及 向前插⼊段落
p1=document.add_paragraph('新增段落P1')
pin1=p1.insert_paragraph_before('在p1前插⼊段落pin1')
段落⾥设置参数样式 或 指定.style来设置参数
p2=document.add_paragraph('新增段落p2并设置style类型',style='ListBullet')
p3=document.add_paragraph('新增段落p3并指定style类型')
p3.style='ListBullet'
添加标题 可设置标题级别1-9
h1=document.add_heading('此处默认标题1')
h2=document.add_heading('此处添加标题2',level=2)
h3=document.add_heading('此处添加标题3',level=3)python中文文档
设置字体
通过.add_run来设置字体: 加粗、斜体、⼤⼩、颜⾊、下划线
paragraph=document.add_paragraph()
r1=paragraph.add_run('通过.bold=True来设置粗体')
r1.bold=True
r1.style='Emphasis'
r2=paragraph.add_run('也可以')
r3=paragraph.add_run('\n通过.italic=True来设置斜体,\n通过.font.size来设置字体⼤⼩,\n通过.b=RGBColor来设置字体颜⾊')
r3.italic=True
r3.font.size=Pt(20)

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。