上海交通大学
硕士学位论文
网络上xml是什么意思
HTML转换到XML格式以及不同XML标准格式之间的转换
姓名:戴怡钧
申请学位级别:硕士
专业:计算机应用技术
指导教师:王永成
20030101
上海交通大学
学位论文原创性声明
本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中
已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。
学位论文作者签名:
日期:年月日
上海交通大学
学位论文版权使用授权书
本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权上海交通大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。
保密口,在一年解密后适用本授权书。
本学位论文属于
不保密口。
(请在以上方框内打“√”)
学位论文作者签名:指导教师签名:
日期:年月日日期:年月日
HTML转换到x札格式以及不尚XML标准格式之间的转换
摘要
当今是信息时代,信息如爆炸般地产生,由于Intemet的普及,更把信息带到全球。但这些信息不仅文种各异,而且格式杂乱纷繁。如何整理这些信息?如何使信息的表示尽可能地实现规范化,尽可能地容易处理?这已成为很多人关心的问题。早期,人们提供了HTML语言,它可以较好地表示网上的信息。但是,随着实践的拓广与深入,HTML的弊病逐日明显与突出。它已阻碍了信息在网上的进一步传播与加工。于是,开创一种更新更富于表达也更易于识别加工的网络信息表达格式,即XML,已成为时代的研发热点。为了统一规范,很多人都在研发XML的标准。标准不仅要受到权威单位的认可,更重要的是要得到广大用户的认同与使用。在这方面我国还相对滞后。为此,首先,我在导师的指导下,抓紧时机,抢先研发标准,以促进我国权威部门的先行,并做其参考;其次,
我们研究了如何完成HTML格式到XML格式的转化,如何在不同的XML格式间进行信息的转换等等问题,并取得了初步进展。在本文中,我将对它们进行逐一地汇报。
本文主要讲述了将HTML格式转化成XML格式,以及不同
XML标准格式之间转换的基本工作过程与关键技术。我们以新浪网新闻HTML作为测试数据,研究将其转化的具体工作方法。在此基础上,总结出把一般的HTML转换到XML格式的基本方法。
具体的工作分别为制定相应网上新闻信息的XML标准,把HTML转换成XML标准格式;机器辅助编写XSLT实现不同XML标准信息之间的转换。网上新闻信息的XML标准是根据网上新闻特点,参考其它主要新闻的XML标准制定的。根据新浪网的新闻内容组织格式与特点,总结出分析与提取出相应信息的规律。据此编写了程序,测试效果良好。比较结构相同但属于不同XML的标准的文档,我们编写的程序可以自动生成XSLT,以完成XML标准文档之间的转换。为此,我们实现了将新浪网上的HTML新闻中的有用信息转化到不同的XML标准文档。
总的来说,我的贡献在于:
第一,针对所要处理的信息选用或制定了相应的XML标准。根据要处理信息的特点,采用现有的XML标准或制定适用的)咖。标准。既要考虑到实用性,又要与其他主要现有标准兼容或能方便转换。
第二,转换HT札信息到制定的X/dL标准。主要是分析利用HTbtL中的格式信息、位置信息与内容,从中挖掘出规律,并编写程序将HTML信息转换到X地标准格式的文档。
第三,使用XSLT转换把我们的XML标准转换到其它的XML

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。