python将数据写⼊xml⽂件_python解析xml⽂件⽅式(解析、
更新、写⼊)
Overview
这篇博客内容将包括对XML⽂件的解析、追加新元素后写⼊到XML,以及更新原XML⽂件中某结点的值。使⽤的是python的
xml.dom.minidom包,详情可见其官⽅⽂档:xml.dom.minidom官⽅⽂档。全⽂都将围绕以下的l进⾏操作:
<?xml version="1.0" encoding="utf-8" ?>
Acme Inc.
12345
Regular customer since 1995
Star Wars Inc.
23456
A small but healthy company.
CDATA:在XML中,不会被解析器解析的部分数据。
声明:在本⽂中,结点和节点被视为了同⼀个概念,你可以在全⽂的任何地⽅替换它,我个⼈感觉区别不是很⼤,当然,你也可以看做是我的打字输⼊错误。
1. 解析XML⽂件
在解析XML时,所有的⽂本都是储存在⽂本节点中的,且该⽂本节点被视为元素结点的⼦结点,例如:2005,元素节点 ,拥有⼀个值为“2005” 的⽂本节点,“2005” 不是 元素的值,最常⽤的⽅法就是getElementsByTagName()⽅法了,获取到结点后再进⼀步根据⽂档结构解析即可。
具体的理论就不过多描述,配合上述XML⽂件和下⾯的代码,你将清楚的看到操作⽅法,下⾯的代码执⾏的⼯作是将所有的结点名称以及结点信息输出⼀下:
# -*- coding: utf-8 -*-
"""
@Author : LiuZhian
@Time : 2019/4/24 0024 上午 9:19
@Comment :
"""
from xml.dom.minidom import parse
def readXML():
domTree = parse("./l")
# ⽂档根元素
rootNode = domTree.documentElement
deName)
# 所有顾客
customers = ElementsByTagName("customer")
print("****所有顾客信息****")
for customer in customers:
if customer.hasAttribute("ID"):
print("ID:", Attribute("ID"))
# name 元素
name = ElementsByTagName("name")[0]
deName, ":", name.childNodes[0].data)
# phone 元素
phone = ElementsByTagName("phone")[0]
deName, ":", phone.childNodes[0].data)
# comments 元素
comments = ElementsByTagName("comments")[0]
deName, ":", comments.childNodes[0].data)
if __name__ == '__main__':
readXML()
2. 写⼊XML⽂件
在写⼊时,我觉得可分为两种⽅式:
新建⼀个全新的XML⽂件
在已有XML⽂件基础上追加⼀些元素信息
⾄于以上两种情况,其实创建元素结点的⽅法类似,你必须要做的都是先创建/得到⼀个DOM对象,再在DOM基础上创建new⼀个新的结点。
如果是第⼀种情况,你可以通过dom=minidom.Document()来创建;如果是第⼆种情况,直接可以通过解析已有XML⽂件来得到dom对象,例如dom = parse("./l")
在具体创建元素/⽂本结点时,你⼤致会写出像以下这样的“四部曲”代码:
①创建⼀个新元素结点createElement()
②创建⼀个⽂本节点createTextNode()
③将⽂本节点挂载元素结点上
④将元素结点挂载到其⽗元素上。
现在,我需要新建⼀个customer节点,信息如下:
kavin
32467
A small but healthy company.
代码如下:
def writeXML():
domTree = parse("./l")
# ⽂档根元素
rootNode = domTree.documentElement
# 新建⼀个customer节点
customer_node = ateElement("customer")
customer_node.setAttribute("ID", "C003")
# 创建name节点,并设置textValue
name_node = ateElement("name")
name_text_value = ateTextNode("kavin")
name_node.appendChild(name_text_value) # 把⽂本节点挂到name_node节点customer_node.appendChild(name_node)
# 创建phone节点,并设置textValue
phone_node = ateElement("phone")
phone_text_value = ateTextNode("32467")
phone_node.appendChild(phone_text_value) # 把⽂本节点挂到name_node节点customer_node.appendChild(phone_node)
# 创建comments节点,这⾥是CDATA
comments_node = ateElement("comments")
cdata_text_value = ateCDATASection("A small but healthy company.") comments_node.appendChild(cdata_text_value)
customer_node.appendChild(comments_node)
rootNode.appendChild(customer_node)
with open('l', 'w') as f:
# 缩进 - 换⾏ - 编码
domTree.writexml(f, addindent=' ', encoding='utf-8')
if __name__ == '__main__':
writeXML()
3. 更新XML⽂件
在更新XML时,只需先到对应的元素结点,然后将其下的⽂本结点或属性取值更新即可,然后保存到⽂件,具体我就不多说了,代码中我将思路都注释清楚了,如下:
def updateXML():
domTree = parse("./l")
# ⽂档根元素
rootNode = domTree.documentElement
names = ElementsByTagName("name")
for name in names:
if name.childNodes[0].data == "Acme Inc.":
# 获取到name节点的⽗节点
pn = name.parentNode
# ⽗节点的phone节点,其实也就是name的兄弟节点
# 可能有sibNode⽅法,我没试过,⼤家可以google⼀下
phone = pn.getElementsByTagName("phone")[0]
# 更新phone的取值
phone.childNodes[0].data = 99999
with open('l', 'w') as f:
# 缩进 - 换⾏ - 编码
domTree.writexml(f, addindent=' ', encoding='utf-8')
if __name__ == '__main__':
updateXML()
如有不对之处,还烦请指教~
补充知识:python 读取xml⽂件内容并完成修改
我就废话不多说了,还是直接看代码吧!
import os
ElementTree as ET
def changesku(inputpath):
listdir = os.listdir(inputpath)
for file in listdir:
python处理xml文件dswith('xml'):
file = os.path.join(inputpath,file)
tree = ET.parse(file)
root = t()
for object1 in root.findall('object'): #我要修改的元素在object⾥⾯,所以需要先到object
for sku in object1.findall('name'): #查想要修改的所有同种元素
if ( == '005'): #‘005'为原始的text
< = '008' #修改‘name'的标签值
tree.write(file,encoding='utf-8') #写进原始的xml⽂件,不然修改就⽆效,‘encoding = “utf - 8”'避免原始xml #中⽂字符乱码else:
pass
else:
pass
if __name__ == '__main__':
inputpath = 'D:\\easy\\hebing_xml' #这是xml⽂件的⽂件夹的绝对地址
changesku(inputpath)
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论