Python使用minidom读写xml的方法--688IT编程网

Python使⽤minidom读写xml的⽅法

本⽂实例讲述了Python使⽤minidom读写xml的⽅法。分享给⼤家供⼤家参考。具体分析如下：

⼀ python提供的xml⽀持

2种⼯业标准的xml解析⽅法-SAX和DOM。SAX（simple API for XML），是基于事件处理的，当XML⽂档顺序地读⼊时，每次遇到⼀个元素会触发相应的事件处理函数来处理。DOM（Document Object Model），通过构建⼀个树结构来表现整个xml ⽂档，⼀旦树被构建，可以通过DOM提供了接⼝来遍历树和提取相应的数据。

python还提供了python独特的xml解析⽅法，相⽐于SAX和DOM更容易使⽤和更加快速，此⽅法为ElementTree。

python的xml模块为：

1)xml.dom.minidom

2)xml.elementtree

3)xml.sax + xml.dom

⼆ xml实例：（l）

<?xml version="1.0" encoding="UTF-8" ?>

</employee>

<name>windows </name>

</employee>

</employees>

三使⽤xml.dom.minidom来读写xml

1）使⽤xml.dom.minidom来解析xml：

def TestMiniDom():

from xml.dom import minidom

doc = minidom.parse( "l" )

# get root element: <employees/>

root = doc.documentElement

# get all children elements: <employee/> <employee/>

employees = ElementsByTagName( "employee" )

for employee in employees:

print ( " ------------------------------------------- " )

# element name : employee

print (deName)

# element xml content : <employee><name>windows</name><age>20</age></employee>

# basically equal to toprettyxml functionpython处理xml文件

print (l())

nameNode = ElementsByTagName( "name" )[0]

print (nameNode.childNodes)

print (deName + ":" + nameNode.childNodes[0].nodeValue)

ageNode = ElementsByTagName( "age" )[0]

print (ageNode.childNodes)

print (deName + ":" + ageNode.childNodes[0].nodeValue)

print ( " ------------------------------------------- " )

for n in employee.childNodes:

print (n)

TestMiniDom()

2）使⽤xml.dom.minidom来⽣成xml:

def CreateXml():

import xml.dom.minidom

impl = xml.DOMImplementation()

dom = ateDocument(None, 'employees' , None)

root = dom.documentElement

employee = ateElement( 'employee' )

root.appendChild(employee)

nameE = ateElement( 'name' )

nameT = ateTextNode( 'linux' )

nameE.appendChild(nameT)

employee.appendChild(nameE)

ageE = ateElement( 'age' )

ageT = ateTextNode( '30' )

ageE.appendChild(ageT)

employee.appendChild(ageE)

f = open( 'l' , 'w')

dom.writexml(f, addindent = ' ' , newl = '\n' ,encoding = 'utf-8' )

f.close()

CreateXml()

3）使⽤xml.dom.minidom需要注意的

*使⽤parse()或createDocument()返回的为DOM对象；

*使⽤DOM的documentElement属性可以获得Root Element;

*DOM为树形结构，包含许多的nodes，其中element是node的⼀种，可以包含⼦elements，textNode也是node的⼀种，是最终的⼦节点；

*每个node都有nodeName，nodeValue，nodeType属性，nodeValue是结点的值，只对textNode有效。对于textNode，想得到它的⽂本内容可以使⽤: .data属性。

*nodeType是结点的类型，现在有以下：

'ATTRIBUTE_NODE''CDATA_SECTION_NODE''COMMENT_NODE''DOCUMENT_FRAGMENT_NODE'

'DOCUMENT_NODE''DOCUMENT_TYPE_NODE''ELEMENT_NODE''ENTITY_NODE''ENTITY_REFERENCE_NODE'

'NOTATION_NODE''PROCESSING_INSTRUCTION_NODE''TEXT_NODE'

*getElementsByTagName()可以根据名字来查⼦elements；

*childNodes返回所有的⼦Nodes，其中所有的⽂本均为textNode，包含元素间的‘\n\r'和空格均为textNode；

*writexml() 时addindent=' '表⽰⼦元素的缩进，newl='\n'表⽰元素间的换⾏，encoding='utf-8'表⽰⽣成的xml的编码格式（<? xml version="1.0" encoding="utf-8"?>）。

希望本⽂所述对⼤家的Python程序设计有所帮助。

688IT编程网

Python使用minidom读写xml的方法

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

Python使用minidom读写xml的方法

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式