常见电子文档的格式
目前网上的电子文档的格式的非常的多,也比较繁,但是大致看来可以有以下几个格式:
1:TXT格式的,即文本文档,这种格式是一种通用格式,在什么环境下都能使用,比较方便,最大的好处在于它的文件的大小比较小,同一本书用它来保存所占的电脑的空间是最小的。
2:htm或HTML格式的 电子书,即超文本标记语言,是WWW的描述语言。设计HTML语言的目的是为了能把存放在一台电脑中的文本或图形与另一台电脑中的文本或图形方便地联系在一起,形成有机的整体,人们不用考虑具体信息是在当前电脑上还是在网络的其它电脑上。我们只需使用鼠标在某一文档中点取一个图标,Internet就会马上转到与此图标相关的内容上去,而这些信息可能存放在网络的另一台电脑中。 HTML文本是由HTML命令组成的描述性文本,HTML命令可以说明文字、图形、动画、声音、表格、链接等。HTML的结构包括头部(Head)、主体 (Body)两大部分,其中头部描述浏览器所需的信息,而主体则包含所要说明的具体内容。
关于HTM,实际上HTM与HTML没有本质意义的区别,只是为了满足DOS仅能识别8+3的文件名而已,因为一些老的系统(win32)不能识别四位文件名,所以某些网页服务器要求index.html最后一个l不能省略。MSIE能自动识别和打开这些文件,但编写网页地址的时候必须是完全对应的,也就是说index.htm和index.html是两个不同的文件,对应着不同的地址。值得一提的是UNIX系统中对大小写敏感,不吻合的话就可能报没有文件或者不到文件。
3:SHTM或SHTML:其实也是超文本标记语言,关于shtml,shtml是一种基于SSI技术的文件,也就是Server Side Include--SSI 服务器端包含指令,一些Web Server如果有SSI功能的话就会对shtml文件特殊招待,服务器会先扫一次shtml文件看没有特殊的SSI指令存在,如果有的话就按Web Server设定规则解释SSI指令,解释完后跟一般html一起调去客户端。
关于shtm,shtm与shtml的关系和htm与html的关系大致相似,这里就不多说了
在这里要总结一下了:html或htm与shtml或shtm的关系是什么
html或者htm是一种静态的页面格式,也就是说不需要服务器解析其中的脚本,或者说里面没有服务器端执行的脚本,而shtml或者shtm 由于它基于SSI技术,当有服务器端可执行脚本时被当作一种动态编程语言来看待,就如asp、jsp或者php一样。当shtml或者shtm中不包含服务器端可执行脚本时其作用和html或者htm是一样的。()
4:doc格式的:即WORD文档,这种格式的的书也不多,一般都是内部文件什么的,在这里也就不多说了。
5:RTF格式的:这种格式的书可能见的人也不太多,他是一种介于TXT与DOC之间的一种格式,RTF是RichTextFormat的缩写,意即多文本格式。这是一种类似DOC格式(Word文档)的文件,有很好的兼容性,使用Windows“附件”中的“写字板”就能打开并进行编辑。使用“写字板”打开一个RTF格式文件时,将看到文件的内容;如果要查看TRF格式文件的源代码,只要使用“记事本”将它打开就行了。这就是说,你完全可以像编辑HTML文件一样,使用“记事本”来编辑RTF格式文件。
对普通用户而言,RTF格式是一个很好的文件格式转换工具,用于在不同应用程序之间进行格式化文本文档的传送。
6:CHM格式的:CHM文件格式是微软1998年推出的基于HTML的帮助文件系统,它代替了早先的WinHelp帮助系统,能在Windows98或NT及以上版本的操作系统中直接运行。几乎所有的软件,现在都用CHM格式的文档制作软件帮助文件。另外,有很大一部分电子图书也是用CHM格式编译的。用它来做电子书的好处在于,他的目录非常好,可以有多级目录,使用起来是很方便的
7:EXE:这种格式的电子书现在是越来越多了,我的光盘里的书有一半是这个格式的,他是一种可执行文件,其特点和CMH来说差不多,不过就是做出的电子书,可以有北京音乐,这一点倒是非常好的。
8:PDF格式的:PDF(Portable Document Format)文件格式是Adobe公司开发的电子文件格式。这种文件格式与操作系统平台无关,也就是说,PDF文件不管是在Windows,Unix还是在苹果公司的Mac OS操作系统中都是通用的。这一特点使它成为在Internet上进行电子文档发行和数字化信息传播的理想文档格式。越来越多的电子图书、产品说明、公司文告、网络资料、开始使用PDF格式文件。PDF格式文件目前已成为数字化信息事实上的一个工业标准。
Adobe公司设计PDF文件格式的目的是为了支持跨平台上的,多媒体集成的信息出版和发布,尤其是提供对网络信息发布的支持。为了达到此目的, PDF具有许多其他电子文档格式无法相比的优点。PDF文件格式可以将文字、字型、格式、颜及独立于设备和分辨率的图形图像等封装在一个文件中。该格式文件还可以包含超文本链接、声音和动态影像等电子信息,支持特长文件,集成度和安全可靠性都较高。
PDF文件使用了工业标准的压缩算法,通常比PostScript文件小,易于传输与储存。它还是页独立的,一个PDF文件包含一个或多个“页”,可以单独处理各页,特别适合多处理器系统的工作。此外,一个PDF文件还包含文件中所使用的PDF格式版本,以及文件中一些重要结构的定位信息。正是由于 PDF文件的种种优点,它逐渐成为出版业中的新宠。
对普通读者而言,用PDF制作的电子书具有纸版书的质感和阅读效果,可以“逼真地”展现原书的原貌,而显示大小可任意调节,给读者提供了个性化的阅读方式。由于PDF文件可以不依赖操作系统的语言和字体及显示设备,阅读起来很方便。这些优点使读者能很快适应电子阅读与网上阅读,无疑有利于计算机与网络在日常生活中的普及。Adobe公司以PDF文件技术为核心,提供了一整套电子和网络出版解决方案,其中包括用于生成和阅读PDF
文件的商业软件 Acrobat和用于编辑制作PDF文件的Illustrator等。 Adobe还提供了用于阅读和打印亚洲文字,即中日韩文字所需的字型包。
下面再说一下电子书阅读器的专用格式吧:
9:EBA:是金蟾公司生产的电子书的专用格式pdb文件阅读器安卓
10:WOL:是津科公司生产的电子书,翰林电子书的专用格式
还有很多格式,lz什么时候在补充补充,比如Palm上的PDB、Mobipocket的Mobi和PRC格式等等
关于PDB格式,我来补充一下:
1) pdb格式的电子书:pdb是Palm DataBase的缩写,Palm OS所用文件的扩展名为.pdb
可以用以下附件来进行相关的txt2pdb,以及pdb2txt的转换。
2)PRC文件是palm系统的程序文件,大致相当于pC平台的exe文件
3)关于我上传得TLPDB软件的介绍如下:
1.内置高速内码转换引擎,支持BIG5<->GBK繁体,BIG5<->GBK简体,
日文SHIFTJ->GBK的内码转换。
2.支持对TXT,HTML,PDB,zTxt的批量转换和组合,并可以自动识别内码
3.支持对同一电子书同时以GBK和BIG5存盘
4.支持PDB,TXT和zTxt文件格式保存电子书。 zTxt测试中
5.自动编辑去空行
6.支持对WebCompiler,E书,CHM,微软LIT,PDF格式的自动解码
本功能调试中,我正在做一个理论上支持任何PC电子书解码的插件
7.与IE类(MyIE,Netcaptor等)浏览器集成,支持右键截取
8.支持多次截取,自动组合
9.绿软件,只有一个EXE,958K,
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论