电子文件专题讲座
一、  电子文件概述
随着信息技术的不断发展,办公自动化在各级各类国家机关、社会组织、企业、事业单位中日益普及,计算机辅助设计(CAD)和计算机辅助制造(CAM)应用于科研、工业领域,电子数据交换(EDI)、电子商务(EC)在国内外贸易中广泛应用,形成了大量的电子文件。
二、  电子文件的概念
电子文件(Electronic Records)是指在数字设备中产生,以数码形式存储于磁带、磁盘、光盘等载体,依赖计算机系统阅读、处理,并可在通信网络上传送的文件。   
完整的电子文件包括内容、背景和结构三要素。
国际档案界电子文件专家认为,完整的电子文件由文件内容信息与元数据组成,并形象化地将文件与元数据比作信的内容和信封,文件是用元数据封装起来的对象,元数据加上文件内容就构成了有证据作用的文件。
三、电子文件元数据的含义和作用
      1、元数据含义。信息技术界中的元数据有多种。电子文件元数据是关于文件的背景信息和结构,满足电子文件管理需求的特殊元数据。它是描述电子文件数据属性,并对其进行定位和管理、同时有助于数据检索的数据,是一种有效的信息资源组织和管理的工具,是一种编码体系。概言之,元数据是对文件的内容、背景、结构信息等进行描述动态扩展的电子目录。 
2、元数据的作用。可从三方面来认识:
(1)构建信息发现机制,即检索机制。元数据能够动态地获取电子文件管理的各项信息。面对海量信息资源管理,借助基于资源组织和发现的描述型元数据,快速发现并获取特定的信息单元。
(2)维护信息可识读性。元数据具有静态映射功能,可以完整地记录电子文件的原始状态,还能够系统地映射出电子文件的生成环境,数据产生的软硬件环境,数据结构,类型,打开方式等信息对象的附加相关信息,即保存元数据的元素项。只有在获取数据对象的同时也获取这些附加的说明信息,被检索到的数据单元才是可理解的、可读的。
(3)保障数字信息的真实性、凭证性。信息单元的变迁历史和操作记录的信息是管理元数据的元素项,元数据能够提示文件生成的行政管理环境,为数字信息单元真实性和凭证性提供了重要的佐证。
  四、电子文件的种类
      1、按电子文件的信息存在形式分类。可分以下8种文件:
(1)文本文件(Text),或称为字(表)处理文件,是指使用文字处理软件生成的,由字、词、数字或符号表达的文件。
(2)图形文件(Graphic)前端大文件上传解决方案
是指根据一定算法绘制的图表、曲线图,包括几何图形和把物理量如应力、强度等用图标表示的图形等等。
  (3)图像文件(Image)
是指使用数字设备采集或制作的静态画面,如用扫描仪扫描的各种原件画面,用数码相机拍
摄的照片等。
  (4)视频(影像)文件(Video)
是指使用视频捕获设备录入的数字影像或使用动画软件生成的二维、三维动画等各种动态画面,如数字影视片、动画片等。
  (5)音频(声音)文件(Audio)
是指用音频设备录入或用编曲软件生成的文件。
  (6)数据文件(Data)
又称为数据库文件。是指在事务处理系统中单独承担文件职责,或者作为文件的重要组成部分出现的数据库数据对象。
  (7)命令文件,亦称计算机程序(Program)
    是指为处理各种事务用计算机语言编写的程序,是一种计算机软件。它的形成过程一般是
由程序员编写“源程序”输入计算机,通过相应的编译程序编译后执行,有些还要经过连接程序才能执行。
  (8)多媒体文件(Multimedia),包含上述两种以上信息形式的文件为“多媒体文件”这种文件使用多媒体技术制作,具有较复杂的结构,必须使用多媒体计算机复现。
    2、按文件的功能分类。可分为主文件和支持性、辅助性、工具性文件。
主文件是指表达作者意图、行使职能的文件。支持性文件是指生成和运行主文件的软件,如文字处理软件、表格处理软件、图形软件,多媒体软件等。辅助性、工具性文件是指在制作、查主文件过程中起辅助、工具作用的文件,如计算机程序类文件(命令文件)往往附带若干辅助设计文件、图形文件,数据库往往附带若干辅助数据库和相应的索引文件、备注文件等。
    3、按文件的生成方式分类。可分为计算机系统中直接生成的原始文件和将纸质或其他载体(如胶片)文件重新录入生成的转换文件。
五、电子文件的特点
与以往各种形态的文件相比,电子文件的主要特点包括:
1、电子文件信息对硬软件及标准体系的依赖性。电子文件的制作、处理,以至归档后的全部管理活动都必须借助于计算机系统才能实现,不兼容的计算机和应用软件生成的文件在交换使用时会遇到很大困难。当生成一份文件的软件、运行该软件的操作系统和硬件更新换代以至与原系统不兼容时,需要保存老的系统,或者进行一系列适应新系统的转换、迁移工作,才能确保该份文件的可读性和可管理性。
在计算机系统处理文件,其正常的运作、管理都是建立在一套标准化体系之上的,如文件制作生成要有代码标准,其存储要有机读载体的格式标准、信息压缩存储的标准,其传输要有网络通讯协议标准,其查要有检索语言标准等。其严格程度和对系统的要求,是纸质文件运作的标准化体系远远达不到的。
2、电子文件信息内容与载体形式之间具有可分离性。电子文件的信息与其形式或载体不是牢固不可分割的,可以不以确定的格式存在和表示,相同的信息可以在表现时呈现多种形式、格式。由于这种特性,对电子文件归档的完整性要求是内容要件和形式要件“二维归档”。
    3、信息的不稳定性。造成电子文件信息发生变化的主要原因有:第一,信息可以脱离特定载体而存在,载体对它的“束缚”没有了,计算机系统中信息的相对独立性使人们对信息的增删更改十分方便,动态文档中的数据不断地被自动更新或补充。第二,电子文件载体性能的不稳定性有可能造成文件中信息的改变。第三、电子信息技术的发展,新的信息编码方案、存储格式、系统软件的不断出现更是对电子信息稳定性的巨大冲击,要求将原文件迁移到新的技术环境之中,迁移过程中信息的损失、变异也是不可避免的。
    4、信息的可重用性。一是存储起来的信息可以被反复调取、使用;二是对所存信息整体进行拆分,或提取信息的属性,并使之与具有某种共同属性的信息建立关联、组配使用;三是通过网络基础和协同系统(集技术),不同的人或设备可以同时对同一文件进行操作:四是通过数据挖掘等方式可以对结构化文件中蕴含的信息进行分析和调用,以发现数据资源库数据中的信息规律。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。