xml规范(1)
Extensible Markup Language (XML) 1.0
本文档是W3C建议XML 1.0的中文版,其中可能有错误和不妥之处。
英文版是唯一的正式版,位于:
http:///TR/1998/REC-xml-19980210
http:///TR/REC-xml/
本文档位于:
http://lightning.prohosting/~qqiu/xml/trans/REC-xml-19980210-cn.html
著作权声明位于:http:///Consortium/Legal/copyright-documents.html
Copyright ? 1998 W3C (MIT, INRIA, Keio ), All Rights Reserved. W3C liability, trademark, document use and software licensing rules apply.
REC-xml-19980210-cn
可扩展标记语言(XML) 1.0
W3C建议 1998年2月10日
本版本:
http:///TR/1998/REC-xml-19980210
http:///TR/l
http:///TR/1998/REC-xml-19980210.html
http:///TR/1998/REC-xml-19980210.pdf
http:///TR/1998/REC-xml-19980210.ps
最新版本:
http:///TR/REC-xml
上一版本:
http:///TR/PR-xml-971208
编者:
Tim Bray (Textuality and Netscape) <tbray@textuality>
Jean Paoli (Microsoft) <jeanpa@microsoft>
C. M. Sperberg-McQueen (University of Illinois at Chicago) <cmsmcq@uic.edu>
摘要
本 文档完整地描述了可扩展标记语言(Extensible Markup Language,XML),它是标准通用标记语言 (Standard Generic Markup Language,SGML)的一个子集。其目的在于使得在Web上能以现有超文本标记语言 (Hypertext Markup Language,HTML)的使用方式提供,接收和处理通用的SGML成为可能。XML的设计既考虑了实现的方便 性,同时也顾及了与SGML和HTML的互操作性。
本文档的状态
本文档已由W3C组织成员和其他相关各方审阅,并已被组织理事批准为W3C建议。这是一个稳定的文档,可以用作参考材料,也可以作为其他文档的正式参考文献。W3C在建议制定过程中的作用是吸引对本规范的注意并促进它的广泛使用。这能增强Web的功能和互操作性。
本 文档规定了一种用于World Wide Web的语法,此语法是通过取一个业已存在并已广泛使用的文本处理国际标准(标准通用标记语言,经增补和更正的 ISO 8879:1986(E))的子集而创建的。它是W3C XML行动组(XML Activity)的工作成果,关于XML行动组的详细信息可以 在http:///XML到。在http:///TR可以到现有W3C建议和其他技术文档的一个列表。
本规范中使用了[Berners-Lee等人]定义的一个术语URI,他们正在从事的的工作将更新[IETF RFC1738]和[IETF RFC1808]。
本规范的已知错误列表可以在http:///XML/xml-19980210-errata到。
请将本文档中的错误报告给。
可扩展标记语言(XML) 1.0
目录
1. 绪论
  1.1 开发者和开发目标
  1.2 术语
2. 文件
  2.1 规范的XML文件
  2.2 字符
  2.3 通用语法成分
  2.4 字符数据和标记
  2.5 注释
  2.6 处理指令
  2.7 CDATA段
  2.8 序和文件类型声明
  2.9 独立文件声明
  2.10 空白处理
  2.11 行尾处理
  2.12 语言标识
3. 逻辑结构
  3.1 起始标签,结束标签和空元素标签
  3.2 元素类型声明
    3.2.1 元素型内容
    3.2.2 混合型内容
  3.3 属性表声明
    3.3.1 属性类型
    3.3.2 属性的缺省值
    3.3.3 属性-值对的规范化
  3.4 条件段
4. 物理结构
  4.1 字符和实体引用
  4.2 实体声明
    4.2.1 内部实体
    4.2.2 外部实体
  4.3 已析实体
    4.3.1 文本声明
    4.3.2 规范的已析实体
    4.3.3 实体中的字符编码
  4.4 XML处理器对实体和引用的处理
    4.4.1 不被识别
    4.4.2 被包含
    4.4.3 进行验证时被包含
    4.4.4 被禁止
    4.4.5 被包含在常量中
    4.4.6 通知
    4.4.7 不处理
    4.4.8 作为PE被包含
  4.5 内部实体置换文本的构建
  4.6 预定义实体
  4.7 记法声明
  4.8 文件实体
5. 一致性
  5.1 进行验证和不进行验证的处理器
  5.2 使用XML处理器
6. 记法
附录
A. 参考文献
  A.1 正式参考文献
  A.2 其他参考文献
B. 字符的分类
C. XML和SGML(非正式)
D. 实体和字符引用的展开(非正式)
E. 确定型内容模型(非正式)
F. 字符编码的自动检测(非正式)
G. W3C XML工作组(非正式)
--------------------------------------------------------------------------------
1. 绪论
可 扩展标记语言,缩写为XML,描述了一类称为XML文件的数据对象,同时也部分地描述了处理这些数据对象的计算机程序的动作。XML是SGML(标准通用 标记语言[ISO 8879])针对应用的一个子集,或者说是SGML的一种受限形式。根据定义,XML文件是合乎规范的SGML文件。
XML 文件由称为实体的存储单元组成,实体可以包含已析数据或未析数据。已析数据由字符组成,其中一些字符组成字符数据,另一些字符组成标记。标记中包含了对文 件存储格式(storage layout)和逻辑结构的描述。XML提供了一种机制用于约束存储格式和逻辑结构。
称为XML处理器的软件模块用于读取XML文件,存取其中的内容和结构。XML处理器被设想为是为另一个称为应用的模块作处理。本规范从XML处理器应如何读取XML数据以及应向应用提供哪些信息的这两个方面,描述了要求XML处理器作出的动作。
1.1 开发者和开发目标
XML 由XML工作组(原先的SGML编辑审查委员会)开发,此工作组由World Wide Web Consortium(W3C)在1996年主持成立。 工作组由Sun Microsystems的Jon Bosak负责,同样由W3C组织的 XML SIG(Special Interest Group)(原先的SGML工作组)积极参与了XML工作组的工作。XML工作组的成员在附录中给 出。工作组与W3C的联系人是Dan Connolly。
XML的设计目标如下:
XML应该可以直接用于因特网(Internet)。
XML应该支持大量不同的应用。
XML应该与SGML兼容。
处理XML文件的程序应该容易编写。
XML中的可选项应无条件地保持最少,理想状况下应该为0个。
XML文件应该是人可以直接阅读的,应该是条理清楚的。
XML的设计应快速完成。
XML的设计应该是形式化的,简洁的。
XML文件应易于创建。
XML标记的简洁性是最后考虑的目标。
本 规范与其他相关的标准一起(Unicode和ISO/IEC 10646定义了字符集,Internet RFC1766定义了语言识别 码,ISO 639定义了语言名称代码,ISO 3166定义了国家名称代码),提供了理解XML版本1.0和构建相应计算机处理程序所需的所有信息。
在完整保留所有文本和法律注意事项的前提下,本版本的XML规范可以自由分发。
1.2 术语
用于描述 XML 文件的术语在此规范的正文中定义。在这些定义中以及描述一个XML处理器的动作时,使用了下表中的术语:
可以(may):允许合乎规范的文件和XML处理器按所描述的方式工作,但不要求必须如此。
必须(must):要求合乎规范的文件和XML处理器按所描述的方式工作; 否则它们出现错误。
错误(error):对本规范中的规则的违反; 其结果不确定。合乎规范的软件可以检测和报告错误,并可以从中恢复。
严重错误(fatal error):合乎规范的XML处理器必须检测到,并向应用报告的一类错误。在遇到严重错误之后,处理器可以继续处理数据以发现更多的错误并可以向应用报告这些错误。为了 支持错误的更正,处理器可以向应用提供文件中未经处理的数据(字符数据和标记的混合体)。但是,一旦检测到一个严重错误,处理器必须停止正常的处理(也就 是说,它必须停止以正常的方式向应用提供与文件逻辑结构有关的数据和信息)。xml标签大全
由用户选择(at user option):合乎规范的软件可以或者必须(取决于句子中的情态动词)按所描述的方式工作; 如果它满足这个条件,它必须同时提供用户一种手段,使得用户能够启用和禁用所描述的工作方式。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。