XML与JSON(超级详解)--688IT编程网

XML与JSON（超级详解）

XML与JSON

⽂章⽬录

前⾔

**⽰例：**背景：在鹅肠公众平台设计早期，因为开发团队是从鹅肠其他团队凑的。内部不同的⼦团队开发规范很不⼀致。很多⽼团队喜欢使⽤XML格式传输数据，很多新⼈团队过来的成员喜欢使⽤JSON作为传输格式。为了团队的稳定，当时并没有对格式进⾏特殊的规则定制，导致现在很多开发者对此怨声哀悼。

因为平台已经有了百万的开发者，再更改操作规范会导致⼤量⽣态问题的发⽣，所以到⽬前问题依旧存在，难以修缮。

⽽很多⼈在参与这次技术沙龙之前，对数据传输的格式不太在意。所以开发时如果前后端没有⼀个合理统⼀的数据规则，会有⼤量的不必要问题发⽣。所以⼀定要下定决⼼要掌握好JSON和XML技术。冲冲冲

以下是本篇⽂章正⽂内容，下⾯案例可供参考

⼀、XML简介

1.1、XML是什么？

可扩展标记语⾔（eXtensible Markup Language）。

特性:

1. xml具有平台⽆关性, 是⼀门独⽴的标记语⾔.

2. xml具有⾃我描述性

1.2、为什么学习XML

1. ⽹络数据传输.

2. 数据存储

3. 配置⽂件

1.3、XML⽂件

XML ⽂件是保存XML数据的⼀种⽅式

XML数据也可以以其他的⽅式存在（如在内存中构建XML数据）。

不要将XML语⾔狭隘地理解成XML⽂件。

1.4、XML语法格式

1. XML⽂档声明

<?xml version="1.0" encoding="UTF-8"?>

2. 标记 ( 元素 / 标签 / 节点)

XML⽂档，由⼀个个的标记组成.

语法:

开始标记(开放标记): <；标记名称>

结束标记(闭合标记): </标记名称>

标记名称: ⾃定义名称，必须遵循以下命名规则：

1.名称可以含字母、数字以及其他的字符

2.名称不能以数字或者标点符号开始

3.名称不能以字符 “xml”（或者 XML、Xml）开始

4.名称不能包含空格，不能包含冒号（:）

5.名称区分⼤⼩写

标记内容: 开始标记与结束标记之间，是标记的内容.

例如，我们通过标记，描述⼀个⼈名: <name>李伟杰</name>

3. ⼀个XML⽂档中, 必须有且且仅允许有⼀个根标记.

正例:<names> <name>张三</name>， <name>李四</name> </names>

反例:<name>李四</name>， <name>⿇⼦</name>

4. 标记可以嵌套, 但是不允许交叉.

正例：

</person>

反例：

18</age>

</person>

5. 标记的层级称呼 (⼦标记, ⽗标记 , 兄弟标记, 后代标记，祖先标记)

例如:

</person>

</person>

</persons>

name是person的⼦标记.也是person的后代标记

name是persons的后代标记.

name是length的兄弟标记.

person是name的⽗标记.

persons是name的祖先标记.

6. 标记名称允许重复

7. 标记除了开始和结束 , 还有属性.

标记中的属性, 在标记开始时描述, 由属性名和属性值组成.

格式:

在开始标记中, 描述属性.

可以包含0-n个属性, 每⼀个属性是⼀个键值对!

属性名不允许重复 , 键与值之间使⽤等号连接, 多个属性之间使⽤空格分割.

属性值必须被引号引住.

案例:

</person>

</person>

</persons>

8. 注释

注释不能写在⽂档⽂档声明前

注释不能嵌套注释

格式:

注释开始: <!--

注释结束: -->

最终案例：

<?xml version="1.0" ending="UTF-8"?>

<book>

<info>讲述了种植苹果的⾟酸故事</info>

</book>

<info>讲述了种植苹果的⾟酸故事</info>

</book>

1.5、语法进阶CDATA （了解）

CDATA

CDATA 是不应该由 XML 解析器解析的⽂本数据。

像 "<" 和 "&" 字符在 XML 元素中都是⾮法的。

"<" 会产⽣错误，因为解析器会把该字符解释为新元素的开始。

"&" 会产⽣错误，因为解析器会把该字符解释为字符实体的开始。

某些⽂本，⽐如 JavaScript 代码，包含⼤量 "<" 或 "&" 字符。为了避免错误，可以将脚本代码定义为 CDATA。 CDATA 部分中的所有内容都会被解析器忽略。

CDATA 部分由 "<![CDATA[" 开始，由 "]]>" 结束：

1.6、Java解析XML（掌握）

⾯试题

问: Java中有⼏种XML解析⽅式 ? 分别是什么 ? 有什么样的优缺点 ?

答: 四种.

1. SAX解析

解析⽅式是事件驱动机制 !

SAX解析器, 逐⾏读取XML⽂件解析 , 每当解析到⼀个标签的开始/结束/内容/属性时，触发事件.

我们可以编写程序在这些事件发⽣时, 进⾏相应的处理.

优点:

1. 分析能够⽴即开始，⽽不是等待所有的数据被处理

2. 逐⾏加载，节省内存.有助于解析⼤于系统内存的⽂档

3. 有时不必解析整个⽂档，它可以在某个条件得到满⾜时停⽌解析.

缺点:

1. 单向解析，⽆法定位⽂档层次，⽆法同时访问同⼀⽂档的不同部分数据(因为逐⾏解析, 当解析第n⾏是, 第n-1⾏已经被释放了, ⽆

法在进⾏操作了).

2. ⽆法得知事件发⽣时元素的层次, 只能⾃⼰维护节点的⽗/⼦关系.

3. 只读解析⽅式, ⽆法修改XML⽂档的内容.

2. DOM解析

是⽤与平台和语⾔⽆关的⽅式表⽰XML⽂档的官⽅W3C标准，分析该结构通常需要加载整个⽂档和内存中建⽴⽂档树模型.程序员可以通过操作⽂档树, 来完成数据的获取修改删除等.

优点:

1. ⽂档在内存中加载, 允许对数据和结构做出更改.

2. 访问是双向的，可以在任何时候在树中双向解析数据。

缺点:

1. ⽂档全部加载在内存中 , 消耗资源⼤.（可忽略不计）

3. JDOM解析

a. ⽬的是成为Java特定⽂档模型，它简化与XML的交互并且⽐使⽤DOM实现更快。由于是第⼀个Java特定模型，JDOM⼀直得到⼤

⼒推⼴和促进。

b. JDOM⽂档声明其⽬的是“使⽤20%（或更少）的精⼒解决80%（或更多）Java/XML问题” （根据学习曲线假定为20%）

优点:

1. 使⽤具体类⽽不是接⼝，简化了DOM的API。

2. ⼤量使⽤了Java集合类，⽅便了Java开发⼈员。

缺点:

1. 没有较好的灵活性。

2. 性能不是那么优异。js获取json的key和value

4. DOM4J解析

它是JDOM的⼀种智能分⽀。它合并了许多超出基本XML⽂档表⽰的功能，包括集成的XPath ⽀持、XML Schema⽀持以及⽤于⼤⽂档或流化⽂档的基于事件的处理。它还提供了构建⽂档表⽰的选项， DOM4J是⼀个⾮常优秀的Java XML API，具有性能优异、功能强⼤和极端易⽤使⽤的特点，同时它也是⼀个开放源代码的软件。如今你可以看到越来越多的Java软件都在使⽤DOM4J来读写XML。

⽬前许多开源项⽬中⼤量采⽤DOM4J , 例如:Hibernate

1.7、DOM4J解析XML （掌握）

步骤:

1. 引⼊jar⽂件 dom4j.jar

2. 创建⼀个指向XML⽂件的输⼊流

FileInputStream fis = new FileInputStream("xml⽂件的地址");

3. 创建⼀个XML读取⼯具对象

SAXReader sr = new SAXReader();

4. 使⽤读取⼯具对象, 读取XML⽂档的输⼊流 , 并得到⽂档对象

Document doc = sr.read(fis);

5. 通过⽂档对象, 获取XML⽂档中的根元素对象

Element root = RootElement();

1.7.1、⽂档对象 Document

指的是加载到内存的整个XML⽂档.

常⽤⽅法:

1. 通过⽂档对象, 获取XML⽂档中的根元素对象

Element root = RootElement();

2. 添加根节点

Element root = doc.addElement("根节点名称");

1.7.2、元素对象 Element

指的是XML⽂档中的单个节点.

常⽤⽅法:

1. 获取节点名称

String getName();

2. 获取节点内容

String getText();

3. 设置节点内容

String setText();

4. 根据⼦节点的名称 , 获取匹配名称的第⼀个⼦节点对象.

Element element(String ⼦节点名称);

5. 获取所有的⼦节点对象

List<Element> elements();

6. 获取节点的属性值

String attributeValue(String 属性名称);

7. 获取⼦节点的内容

String elementText(String ⼦节点名称);

8. 添加⼦节点

Element addElement(String ⼦节点名称);

9. 添加属性

void addAttribute(String 属性名,String 属性值);

1.7.3、解析本地⽂件案例:

//1. 获取⽂件的输⼊流

FileInputStream fis = new FileInputStream("C:\\code\\35\\code1\\day03_XML\\src\\l"); //2. 创建XML读取⼯具对象

SAXReader sr = new SAXReader();

//3. 通过读取⼯具, 读取XML⽂档的输⼊流 , 并得到⽂档对象

Document doc = sr.read(fis);

//4. 通过⽂档对象 , 获取⽂档的根节点对象

Element root = RootElement();

//5. 通过根节点, 获取所有⼦节点

List<Element> es = root.elements();

//6. 循环遍历三个book

for (Element e : es)

{

//1. 获取id属性值

String id = e.attributeValue("id");

//2. 获取⼦节点name , 并获取它的内容

String name = e.element("name").getText();

//3. 获取⼦节点info , 并获取它的内容

String info = e.element("info").getText();

System.out.println("id="+id+",name="+name+",info="+info);

}

1.7.4、解析⽹络⽂件案例:

688IT编程网

XML与JSON(超级详解)

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

XML与JSON(超级详解)

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式