Python实现提取XML内容并保存到Excel中的方法--688IT编程网

Python实现提取XML内容并保存到Excel中的⽅法本⽂实例讲述了Python实现提取XML内容并保存到Excel中的⽅法。分享给⼤家供⼤家参考，具体如下：

最近做⼀个项⽬是解析XML⽂件，提取其中的chatid和lt、timestamp等信息，存到excel⾥。

1.解析xml，提取数据

使⽤python⾃带的xml.dom中的minidom（也可以⽤lxml）

xml⽂件如下：

minidom.parse()#解析⽂件，返回DOM对象

_get_documentElement()DOM是树形结构，获得了树形结构的根节点

getElementsByTagName()根据name查根⽬录下的⼦节点

getAttribute()获取DOM节点的属性的值

提取的代码如下：

class get_xml():

#加载获取xml的⽂档对象

def __init__(self,address):

#解析address⽂件，返回DOM对象，address为⽂件地址

self.doc = minidom.parse(address)

#DOM是树形结构，_get_documentElement()获得了树形结构的根节点

python处理xml文件< = self.doc._get_documentElement()

#.getElementsByTagName()，根据name查根⽬录下的⼦节点

self.httpSample_nodes = ElementsByTagName('httpSample')

def getxmldata(self):

data_list=[]

j = -1

responseData_node = ElementsByTagName("responseData")

for i in self.httpSample_nodes:

j = j+1

#getAttribute()，获取DOM节点的属性的值

Attribute("lb") == "发送信息":

a = 'chatId":"(.*?)"'

Attribute("lb") == "接收信息":

# a = "chatId%3A%22(.*?)%22"

a = "info%3A%22(.*?)%22"

if (i.getAttribute("lb") == "发送信息" Attribute("lb") == "接收信息") Attribute("rc") == "200":

try:

#使⽤re包⾥⾯的⽅法，通过正则表达式提取数据

b = re.search(a, responseData_node[j].firstChild.data)

if b is not None:

d = b.group(1)

print("d:",d)

data_list.append((d, i.getAttribute("ts"), i.getAttribute("lt"),i.getAttribute("lb")))

except:

pass

return data_list

2.存储为Excel，导出数据到Excel

⽤到的包openpyxl，openpyxl.workbook下的Workbook()⽤来在内存⾥创建⽂件，最后写进磁盘的

wb = load_workbook(filename = XXXX.xlsx)：读取Excel⽂件，⽂件地址为XXXX.xlsx

wb = Workbook()：创建⼀个Workbook对象

ew = ExcelWriter(workbook = wb)：新建⼀个excelWriter，最后⽤来保存

ws = wb.worksheets[0]：打开⼀个sheet，sheet位置是0，即第1个sheet

ew.save(filename = XXXX.xlsx)：将数据导出到本地，本地⽂件地址为XXXX.xlsx

⼀个导出Excel的例⼦如下：

import openpyxl

from openpyxl import writer,load_workbook

# Workbook⽤来在内存⾥创建⽂件最后写进磁盘的

from openpyxl.workbook import workbook, Workbook

from l import ExcelWriter

ll import get_column_letter

# if __name__ == "__main__":

def importexcel(match,dest_filename):

if(ists(dest_filename)):

wb = load_workbook(filename=dest_filename)

else:

wb = Workbook()

ew = ExcelWriter(workbook = wb)

#创建⼀个新sheet

# 打开已存在的第⼀个sheet，也可以⽤get_sheet_names获得所有的sheet的名字

ws = wb.worksheets[0]

ws.title = "聊聊发送接收请求"

l = 2

for i in match:

print(i,l)

l = l+1

ew.save(filename = dest_filename)

PS：这⾥再为⼤家提供⼏款关于xml操作的在线⼯具供⼤家参考使⽤：

更多关于Python相关内容感兴趣的读者可查看本站专题：《》、《》、《》、《》、《》及《》希望本⽂所述对⼤家Python程序设计有所帮助。

688IT编程网

Python实现提取XML内容并保存到Excel中的方法

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

Python实现提取XML内容并保存到Excel中的方法

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式