XML语言在Web开发中的应用研究
摘要:扩展标记语言XML是一种简单的数据存储语言,使用一系列简单的标记描述数据,而这些标记可以用方便的方式建立,虽然XML 比二进制数据要占用更多的空间,但XML极其简单且易于掌握和使用。XML是Internet环境中跨平台的、依赖于内容的技术,是当前处理结构化文档信息的有力工具。
关键词:标记语言;XML;Web开发
0引言
XML是Extensible Markup Language的缩写,意为可扩展的标记语言。与HTML相似,XML是一种显示数据的标记语言,它能使数据通过网络无障碍地进行传输,并显示在用户的浏览器上。XML是一套定义语义标记的规则,这些标记将文档分成许多部件并对这些部件加以标识。它也是元标记语言,即定义了用于定义其它与特定领域有关的、语义的、结构化的标记语言的句法语言。
1XML语言概述
XML(Extensible Markup Language)即可扩展标记语言,它与HTML一样,都是SGML(Standard Generalized Markup Language,标准通用标记语言)。XML是Internet环境中跨平台的、依赖于内容的技术,是当前处理结构化文档信息的有力工具。扩展标记语言XML 是一种简单的数据存储语言,使用一
系列简单的标记描述数据,而这些标记可以用方便的方式建立,虽然XML比二进制数据要占用更多
的空间,但XML极其简单且易于掌握和使用。
1.1XML的特点
XML具有如下特点:①XML使用有意义的标记(TAG),具有语义;②XML是描述数据内容的语言,本身并不决定数据该如何显示,数据的显示由XSL决定;③XML可自定义标记,可由用户按需要增加标记,如数学标记语言MATHML、财经标记语言FPML、电子商务标记语言EBXML等;④XML对语法有严格的要求,所有XML 的文件都必须经过严格的“验证”过程才算完成,文件格式容易转换。xml技术的主要应用
1.2XML的优势
XML的优势体现在如下方面:
(1)数据检索。XML将语义标记作为搜索索引,在文件中截取关键部分,所有标记内的数据都可视为一个元素,而每一个元素都可以作为数据的索引。
(2)数据显示。XML将数据保存的格式与数据显示的方式分开,使得XML文件可以轻易地更换数据显示的方式,仅需改变XSL的设置,用户就可以将同一数据制作成HTML、PDF、WML(Wireless Mark
up Language)、HDML(Hand-Held Device Markup Language)等不同格式,供不同的硬件显示。
(3)数据交换。XML语法简单,可以被所有的机器解读,又可以在各种平台上使用,使得XML有潜力成为一种通行四海而皆准的标记语言。
1.3XML相关技术
DTD(Documentation Type Definition,文档类型定义):定义XML 文档中元素的结构和内容等。
XSD(XML Schema Definition,XML模式定义):同DTD,也是用于定义XML文档的结构和内容,不同的是它本身也是XML格式,因而更利于解析。
CSS(Cascading Style Sheets,级联样式表):定义XML文档和HTML文档的显示格式或样式。
XPath:用于在XML文档中定位查询的语言。
XSL(Extensible Stylesheet Language,可扩展样式语言):定义同CSS,用于定义XML文档的显示格式或样式,不同的是XSL是专门为XML而设计。
XLL(Extensible Linking Language,可扩展链接语言):包括XLink (XML Linking Language,XML
链接语言)定义一个文档如何与另一个文档的链接、XPointer(XML Pointer Language)定义XML文档各部分的寻址方案。
2XML语言语法
XML语言对格式有着严格的要求,主要包括格式良好和有效性两种要求。格式良好有利于XML文档被正确地分析和处理,这一要求是相对于HTML语法的混乱而提出的,它大大提高了XML的处理程序和处理XML数据的正确性和效率。XML文档满足格式良好的要求后,会对文档进行有效性确认。有效性是通过对DTD或Schema 的分析来判断。
2.1XML的声明
XML声明具有如下形式:
<?xml version="1.0" standalone="yes/no" encoding="UTF-8/gb2312"?>
XML标准规定声明必须放在文档的第一行。声明其实也是处理指令的一种,一般都具有以上形式。Version表示XML的版本号;standalone表示文档是否附带DTD文件,默认为no;encoding表示文档的编码方式,默认为“UTF-8”。
2.2处理指令PI
处理指令PI 的格式:<?处理指令名处理指令信息?>
如:
<?xml-stylesheet type="text/css" href="css文件位置"?> ---定义css文件
<?xml-stylesheet type="text/xsl" href="xsl文件位置"?> ---定义xsl文件包含附带XML文档的文件,以使XML解析器对相应的XML 文档作出正确的处理。
2.3DTD样式
定义和XML文档相关的DTD文档,以让改DTD文档对改XML 文档作出验证。
格式:<!DOCTYPE 根元素名SYSTEM/PUBLIC "dtd文件名">
2.4注释
格式:包含在<!-- 注释内容-->
在注释内容中不可包含-->字符,且注释也不可放在声明前或是标记中(<>中),并且注释也不能嵌套。
2.5元素、属性、文本
元素、属性、文本是XML文档中最主要的内容,它们用于存储和表现数据。
元素名和属性名可以包含字母、数字以及其它一些合法的字符,但不能以数字或下划线开头,且名称中不能包含空格或是任何形式的xml(大小写都不可)的字符开头。属性的值必须包含在双引号之间,复杂的属性值需要通过子元素来实现,即元素可以实现嵌套。HTML 会把多个相邻空格忽略为一个,而XML不处理空格,它会把空格保持原样显示出来。
2.6CDATA
CDATA是Character Data的简称,它用于直白地显示除"]] >"字符之外的任何字符。它的存在简化了对含有许多特殊字符的文字的写法。
格式:<![CDATA[ 要直接显示的内容]] >
2.7实体
实体相当于C语言中的宏定义。可以先定义一个实体,然后通过“&实体名;" 的形式来引用该实体。
3XML文档显示
在XML标准发布之后的短短数年内,XML技术已经渗入到了Internet应用的各个角落,不同应用领域的XML标准或XML文档对

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。