python读取word中的文字格式_尝试使用Python解析xml格式的docx文档以打...--688IT编程网

python读取word中的⽂字格式_尝试使⽤Python解析xml格式

的docx⽂档以打印粗体字

我有⼀个word docx⽂件，我想打印粗体在xml格式的⽂档中查看我要打印的单词似乎具有以下属性。在

Print this Sentence

特别是指定⽂本为粗体的w:rsidRPr="00510F21"属性。下⾯是更多的XML⽂档，让我们更好地了解它的结构。在

^{pr2}$

在做了⼀些研究并尝试使⽤pythondocx库来实现这⼀点之后，我决定尝试使⽤lxml。我得到⼀个关于名称空间的错误，并试图添加该名称空间，但它返回⼀个空集。下⾯是⽂档中的⼀些命名空间内容。在

xmlns:wpc="schemas.microsoft/office/word/2010/wordprocessingCanvas"

xmlns:mo="schemas.microsoft/office/mac/office/2008/main"

xmlns:mc="/markup-compatibility/2006"

xmlns:mv="urn:schemas-microsoft-com:mac:vml"

xmlns:o="urn:schemas-microsoft-com:office:office"

xmlns:r="/officeDocument/2006/relationships"

xmlns:m="/officeDocument/2006/math"

xmlns:v="urn:schemas-microsoft-com:vml"

xmlns:wp14="schemas.microsoft/office/word/2010/wordprocessingDrawing"

xmlns:wp="/drawingml/2006/wordprocessingDrawing"

xmlns:w10="urn:schemas-microsoft-com:office:word"

xmlns:w="/wordprocessingml/2006/main"

xmlns:w14="schemas.microsoft/office/word/2010/wordml"

xmlns:w15="schemas.microsoft/office/word/2012/wordml"

xmlns:wpg="schemas.microsoft/office/word/2010/wordprocessingGroup"

xmlns:wpi="schemas.microsoft/office/word/2010/wordprocessingInk"

xmlns:wne="schemas.microsoft/office/word/2006/wordml"

xmlns:wps="schemas.microsoft/office/word/2010/wordprocessingShape"

mc:Ignorable="w14 w15 wp14">

python处理xml文件下⾯是我使⽤的代码。如果属性是w:rsidRPr="00510F21"，我想再次打印。在from lxml import etree

root = etree.parse("l")

namespaces = {'w':'/wordprocessingml/2006/main'}

wr_roots = root.findall('w:r', namespaces)

print wr_roots # prints empty set

for atype in wr_roots:

if w:rsidRPr == '00510F21':

('w:t'))

发表评论

688IT编程网

python读取word中的文字格式_尝试使用Python解析xml格式的docx文档以打...

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

m函数数字提取

jest断言方法大全

中兴ZXSEC US 管理员手册

keras系列(一):参数设置

Qt从QString中提取出数字

element input 金额千分位格式化

freemaker 参数解析正则

C#正则验证数字

form表单验证正则

scanf正则表达式用法

grafana value的正则表达式

Android平台浮点数运算应用

js-(JS正则表达式验证数字)

判断Python输入是否是整数,字符,或浮点数

c语言 sscanf 正则规则

从文本中提取数值技巧

js将整数转换成两位浮点数的方法

vue正则限制浮点数

8到20的结尾的正则

shell 正则表达式最后一行

最新文章

应用程序的安全检测方法、装置、电子设备和存储介质

VBA之正则表达式(1)--基础篇

代码编辑的辅助方法、装置及电子设备

SHELL查字符串中包含字符的命令

String方法中replace和replaceAll的区别详解(源码分析)

双字节符号正则

标签列表

688IT编程网

python读取word中的文字格式_尝试使用Python解析xml格式的docx文档以打...

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法 正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

m函数数字提取

jest断言方法大全

中兴ZXSEC US 管理员手册

keras系列(一):参数设置

Qt从QString中提取出数字

element input 金额千分位格式化

freemaker 参数解析正则

C#正则验证数字

form表单验证正则

scanf正则表达式用法

grafana value的正则表达式

Android平台浮点数运算应用

js-(JS正则表达式验证数字)

判断Python输入是否是整数,字符,或浮点数

c语言 sscanf 正则规则

从文本中提取数值技巧

js将整数转换成两位浮点数的方法

vue正则限制浮点数

8到20的结尾的正则

shell 正则表达式 最后一行

最新文章

应用程序的安全检测方法、装置、电子设备和存储介质

VBA之正则表达式(1)--基础篇

代码编辑的辅助方法、装置及电子设备

SHELL查字符串中包含字符的命令

String方法中replace和replaceAll的区别详解(源码分析)

双字节符号正则

标签列表

nginx map用法正则

shell 正则表达式最后一行