(5)二次开发之XML格式数据解析--688IT编程网

（5）⼆次开发之XML格式数据解析

1、⾸先理解⼀下html

html的全名是：HyperText Transfer markup language 超级⽂本标记语⾔，html本质上是⼀门标记（符合）语⾔，在html⾥，这些标记是事先定义（规则）好的，并且赋予了其特定的含义。有⼀套固定的标记的集合。

⽹页⽂件的扩展名是 .html或者 .htm，都是可⾏的。

⽂档声明:<!doctype html> 这⾥的doctype不管是⼤⼩写都是可以的，并且兼容html4/html5。

html中的标记⼀般都是有开始标签和结束标签，例如:<html>...</html>、<body>...</body>等标签。但是也有⼀些标签是没有内容主体的，可以直接写成： 、<hr />.

在html⾥的所有标签都是有固定含义的，不能⾃⼰随便去定义，虽然有⼀些是⾃定义的标签，但是最终还是继承和使⽤html的固定标签。

编写html的时候使⽤的⼀些编辑器，例如：notepad++、editplus、hbuilder等。

2、理解XML

xml的全名是：Extensible Markup Language 可扩展标记语⾔，在xml⽂件⾥的所有标签都是可以⾃由定于的。

xml的扩展名为：.xml

xml⽂件头部信息为：<?xml version="1.0" ?>

xml⽂件有且只有⼀个跟节点

xml中的节点与节点之间可以允许嵌套

3、⼆次开发中使⽤XML的理解

由于协议数据传输其实就是采⽤xml格式进⾏传输，所以我们必须要了解xml的格式以及传输数据的解析和⽣成。

当A⽤户 -> 发送数据消息 -> 给B⽤户，中间需要服务器进⾏中转。例如：⽂本消息协议格式（该功能的数据传输是基于xml格式）

⽂本消息格式(⽤户发送给服务，服务器接收的格式)如下：　

1<xml>

2<ToUserName><![CDATA[toUser]]></ToUserName>

3<FromUserName><![CDATA[fromUser]]></FromUserName>

4<CreateTime>1348831860</CreateTime>

5<MsgType><![CDATA[text]]></MsgType>

6<Content><![CDATA[你好]]></Content>

7<MsgId>1234567890123456</MsgId>

8</xml>

如图解析：

根据上⾯的xml格式，<![CDATA[ ]]>这类型的数据是指字符数据，CDATA是由character（字符）和data（数据）的简称缩写。

每个⽤户是通过openid来加以区分的，⽽openid就是根据个⼈的号进⾏⼀定的加密算法锁构

成的，openid是由字母、数字、构成的⼀串字符串(该长度是28位)。在我们⾃⼰的服务器上收到的还是与原来的服务器所转发过来的xml格式串还是⼀致的。所以我们就需要在我们⾃⼰的服务器的程序⾥进⾏解析 xml格式串。

4、xml格式解析

⽬前在java⾥⾯对xml解析有4种⽅法：

1、DOM(Documemt Object Model)⽂档对象模型，Dom是⼀次性读取整个⽂档，如果xml⽂档⽐较⼤，节点⽐较多的情况下，解析的时候⽐较消耗资源、内存，性能⽐较低，不建议使⽤。

2、SAX(Simple API for XML)。使⽤SAX解析，是基于事件驱动⽅式来解析xml。解析器在读取xml⽂件根据读取的数据产⽣相应的事件，解析速度快，占⽤内存少，性能⽐较好。

3、DOM4J是第三⽅类库，对SAX解析进⾏了封装。

4、JDOM也是第三⽅类库，也是对SAX解析进⾏了封装。

DOM与SAX解析⽅式是java⾃带的，不需要第三⽅额外的jar包。⼆DOM4J和JDOM都是第三⽅开源的，使⽤的时候需要下载⽀持第三⽅⽀持的jar包。

5、声明⼀个xml⽂件使⽤4种⽅式进⾏解析

创建⼀个parseXml的java项⽬，将创建以⼀个l⽂件，

如图显⽰：

编辑xml⽂件：

1<?xml version="1.0" ?>

2

3<department>

4

5<employee number="001">

6

7<name>⼩海</name>

8<sex>男</sex>

9<profession>java开发</profession>

10<hobby>⾜球</hobby>

11</employee>

12<employee number="002">

13

14<name>婷菲</name>

15<sex>⼥</sex>

16<profession>C#开发</profession>

17<hobby>跑步</hobby>

18</employee>

19</department>

这⾥的xml⽂件放在（我本地的位置）：

/Users/wangxianhai/work_sts_01/parseXML/src/com/aixunma/l 6、声明XML⽂档内容信息的类

1package l;

3/**

4 * XML⽂档内容信息的对应的字段

5 * 类的描述:

6 * @Description: TODO

7 * @author⼩海

8 * @time:2017年4⽉29⽇下午6:04:00

使用dom4j解析xml文件9 * @Vesion: 1.0

10*/

11public class XmlParam {

13public static final String LABLE_EMPLOYEE = "employee"; // 员⼯标签

14public static final String LABLE_NAME = "name"; // 名称标签

15public static final String LABLE_SEX = "sex"; // 性别标签

16public static final String LABLE_PROFESSION = "profession"; // 职业标签17public static final String LABLE_HOBBY = "hobby"; // 爱好标签

19private int number;

20private String name;

21private String sex;

22private String profession;

23private String hobby;

25public int getNumber() {

26return number;

27 }

28public void setNumber(int number) {

29this.number = number;

30 }

31public String getName() {

32return name;

33 }

34public void setName(String name) {

35this.name = name;

36 }

37public String getSex() {

38return sex;

39 }

40public void setSex(String sex) {

41this.sex = sex;

42 }

43public String getProfession() {

44return profession;

45 }

46public void setProfession(String profession) {

47this.profession = profession;

48 }

49public String getHobby() {

50return hobby;

51 }

52public void setHobby(String hobby) {

53this.hobby = hobby;

54 }

55 @Override

56public String toString() {

57 StringBuilder builder = new StringBuilder();

58 builder.append("number=").append(number).append("\n")

59 .append("name=").append(name).append("\n")

60 .append("sex=").append(sex).append("\n")

61 .append("profession=").append(profession).append("\n")

62 .append("hobby=").append(hobby).append("\n");

String();

64 }

65 }

7、实现DOM⽅式解析xml

1package l;

3import java.io.File;

5import javax.security.auth.login.LoginException;

l.parsers.DocumentBuilder;

l.parsers.DocumentBuilderFactory;

9import org.apachemons.lang.StringUtils;

10import org.w3c.dom.Document;

11import org.w3c.dom.Element;

12import org.w3c.dom.Node;

13import org.w3c.dom.NodeList;

15/**

16 * 使⽤DOM解析xml⽂件

17 * 类的描述:

18 * @Description: TODO

19 * @author⼩海

20 * @time:2017年4⽉29⽇下午2:28:27

21 * @Vesion: 1.0

22*/

23public class DomPaeseXML {

24/**

25 * 解析xml⽂档内容

26 * @return

27 * @throws Exception

28*/

29public static String parseXMl() throws Exception {

31// 1、创建⼀个⽂档构建⼯⼚对象

32final DocumentBuilderFactory dbf = wInstance();

34// 2、通过⼯⼚对象创建⼀个⽂档构造器对象

35final DocumentBuilder db = wDocumentBuilder();

37// 3、声明xml⽂件在本地的路径，并且加载该xml⽂件

38final String path = "/Users/wangxianhai/work_sts_01/parseXML/src/com/aixunma/l"; 39final File file = new File(path);

41// 4、通过⽂档构造器解析⽂件加载的对象成⽂档对象

42final Document parse = db.parse(file);

44// 5、通过⽂档对象获取头部节点

45final Element headNode = DocumentElement();

47final StringBuilder builder = new StringBuilder();

49// 6、通过头节遍历下⾯的⼦节点列表

50final NodeList childNodes = ChildNodes();

51if (childNodes == null) {

52return "";

53 }

54 parseXmlToStr(childNodes, builder);

String();

56 }

58/**

59 * 将节点列表遍历⽣成字符串

60 * @param childNodes 节点列表

61 * @param builder 记录节点内容

62 * @return

63*/

64public static StringBuilder parseXmlToStr(NodeList childNodes, StringBuilder builder) {

65// 判断节点列表是否为空

66if (childNodes == null) {

67return builder;

68 }

70// 遍历节点列表

71for (int i = 0; i < Length(); i++) {

72// 获取⼦节点

73final Node iemt = childNodes.item(i);

74// 因为节点⼜好⼏种类型，需要判断属于ELEMENT_NODE类型的

75if (iemt != null && NodeType() == Node.ELEMENT_NODE) {

76// 节点的内容值

688IT编程网

(5)二次开发之XML格式数据解析

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

(5)二次开发之XML格式数据解析

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式