数字档案馆技术及应用
一、数字档案馆的特征和功能
数字档案馆是一个数字档案信息系统,它通过网络将分散异构的数字化档案信息联结,实现资源共享。
(一)数字档案馆的主要特征
(1)信息存储的数字化。数字化档案信息是数字档案馆的资源基础,它有两个来源:一是馆藏档案的数字化。主要体现为将存储于不同载体的模拟档案信息如纸质档案、声像档案信息等通过数字化处理转换成数字形式。二是直接接收归档的电子文件。电子文件是基于网络生成的原生数字信息。将这两个来源的数字化信息进行组织和管理,建立数据库系统。
(2)信息存取的网络化。网络是数字档案馆存在和运行的保障。数字档案馆赖以网络而生存,网络出现故障,数字档案馆的运作就要受到影响。是网络将用户端、Web服务器、检索系统、对象数据库等数字档案馆的各个组成部件连接,实现对数字档案信息的网上发布、查询和检索。
(3)信息资源的分布式管理。对各个分布式的数字对象资源进行收集、存储、发布和检索。它要求各个数字档案馆遵循统一的高层协议,对基于不同系统平台和应用软件产生的异构数字档案信息进行整合,建立一个全面的数字资源库,并提供统一的检索入口。
(二)数字档案馆的主要业务功能
(1)数字档案信息的收集和存储。通过数字化技术将现有的馆藏数字化,并通过在线和脱机方式接收各个立档单位归档的电子文件及其元数据。在此基础上,将不同格式和类型的数字化档案信息转换成统一格式,进行压缩处理和存储。
(2)数字档案信息的组织和管理。对数字化对象进行标引和著录,建立目录和索引,并对电子文件及元数据进行组织,分解出元数据和对象数据,集成为元数据库和对象数据库。
(3)数字档案信息的发布和查询。提供目录级和文件级查询服务,以及基于内容的多媒体信息检索服务。
(4)数字档案信息的安全和权限管理。由于档案本身的保密性,所以数字档案馆的安全和权限管理尤为重要。可利用身份认证、数据加密、数字水印、数字签名以及防火墙等技术实现对
用户身份的识别及权限控制,以及数字档案馆的安全管理。
数字档案馆是传统档案馆的未来发展趋势,但数字档案馆建设必须以传统档案馆为基础和依托。一方面,传统档案馆的实体馆藏是数字档案馆的资源基础;另一方面,数字档案馆是传统档案馆向网络空间的延伸。传统档案馆的资源在网络环境中可以被更多的人远程获取。此外,数字档案馆是收集和管理电子文件的重要方式。传统档案馆以纸质档案为主要管理对象,它的一套管理机制和方法适用于纸本文件而不适用于电子文件,而数字档案馆则可以实现电子文件的在线归档、组织和利用,完成对电子文件整个生命周期的控制。
二、数字档案馆关键技术
数字档案馆是以计算机硬、软件技术为基础,以网络通信技术为支撑,并辅以各种高新技术而建立的一种集成信息系统。数字档案馆在信息的收集、存储、组织、管理和利用的过程中,必须借助各种高新技术。具体包括:
(1)档案数字化过程中的主要技术:文字图像扫描技术、光学字符识别(OCR)、视音频捕捉、多媒体信息压缩等技术。对于音频、视频以及静态图像、活动影像等多媒体信息必须确定数
字化的规范格式。
(2)数字档案信息加工、组织和管理过程中的主要技术:应该以标准化方式对数字化资源进行加工和组织。在传统档案著录和标引的基础上,根据规范的元数据标准,抽取相应的元数据,并建立元数据集。在此过程中,需要采用多媒体信息标引技术、信息抽取技术、海量信息存储和组织技术、数据挖掘技术、数据集成技术、超大规模数据库技术等。
(3)数字档案信息发布和查询过程中的主要技术:多媒体数据压缩和传输技术、分布式资源与运行管理技术、图像与视频数据检索技术、基于内容的信息检索技术等。
(4)数字档案馆的安全和权限管理中的主要技术:防火墙技术、密钥技术、身份认证技术、数字签名技术、数字水印技术等。
需要指出的是,在数字档案馆的建设过程中,对于维护档案信息的真实性、完整性和可靠性,以及保密性方面有着很高的要求。如果档案在数字化和利用过程中丧失了其完整性和可靠性,那么数字图书馆存在的基础将会动摇。这需要在数字化过程中采用最佳技术尽量减少信息失真,并在信息传输和利用过程中采用各种安全保障技术。
三、数字档案馆的发展阶段
数字档案馆建设必须以档案馆业务工作自动化为基础,我国数字档案馆建设一般需要经历以下三个阶段:
web技术的三个关键技术第一个阶段:档案馆自动化阶段。实现档案实体管理和档案信息组织的自动化。具体包括:档案登记、借阅、催还以及库房管理等日常业务和实体管理的自动化,以及档案信息的自动分类、自动编目和自动标引,信息检索计算机化,建立内部局域网。
第二个阶段:单个数字档案馆建设阶段。主要包括馆藏数字化、档案网站建设,以及接收电子文件进馆并提供利用等内容。目前中国很多数字档案馆项目正处于这个阶段。而大规模接收电子文件进馆工作还没有真正展开。
第三个阶段:多个数字档案馆互联阶段。实现多个数字档案馆之间的互操作,以各个数字档案馆共同遵循的高层协议为基础,整合各个档案馆的资源并提供统一的检索入口。
我国大部分省级以上的综合档案馆,国家专业系统和大型企业的档案馆,以及有关高校的档案馆已经具有档案自动化的基础,馆藏数字化工作正在持续进行,目录型和全文型数据库也在纷
纷建立。全国90%以上的省市档案机构已经建立了档案网站,经国家档案局批准,中国档案报社主办的中国档案信息门户网站——“中国档案网”已经于2007年7月开通。
总体上,我国东部发达地区的数字档案馆建设处于第二阶段即单个数字档案馆建设阶段,而中西部地区的数字档案馆建设还处于由第一阶段向第二阶段的过渡期。
四、我国综合性数字档案馆的典型模式——深圳数字档案馆
深圳数字档案馆是中国建设的第一个综合性的数字档案馆,始建于2000年,工程分为3期,2002年完成了第1期目标,2008年1月第2期目标“深圳市市民中心电子文件接收管理系统”已经通过了专家鉴定。深圳数字档案馆在功能上属于电子政务系统,并把它作为政府信息的综合发布平台,主要完成以下几个方面的建设任务:
(1)基础设施的构建。建立档案馆内部网、与政府连接的政务网、与互联网连接的公众网三个层次,并实行三网物理隔离,形成三个相互独立的网络。
(2)档案信息资源建设。包括馆藏档案的数字化、各立档单位档案文件材料的接收、各种具有档案性质的专题信息资源库里的档案信息的采集,以及互联网上具有档案价值的信息的搜集。
(3)应用系统的开发。主要是建立信息的采集、管理、利用和维护模块。深圳数字档案馆应用系统的建设目标是建成一个可扩展的网络应用系统,其功能涵盖档案数字化加工、电子档案信息的采集、处理、存储、归档、组织、发布、利用及数字资源管理全过程。采用的关键技术包括:大量并发查询、数据仓库、数据挖掘、海量数据存储、网络安全、图像分类、智能检索、人工语言向自然语言转换、视频点播、虚拟现实技术,等等。深圳数字档案馆应用系统的功能如图所示。
深圳数字档案馆应用系统结构图
(4)标准规范建设。在数字档案馆建设过程中制定各类管理性、业务性和技术性标准规范。深圳数字档案馆的标准规范体系包括管理、业务、技术三个层面。管理性标准规范包括计算机安全法规与标准,数字档案馆工作人员、用户及设备管理规范,利用管理规定,以及数字档案馆信息资源合法性的确认等。业务性标准规范包括术语标准以及相关的电子文件和电子档案管理的标准、规范。技术性标准规范包括数字档案馆软硬件基础设施建设技术标准,软件系统工作平台技术标准,数据存储压缩格式规范,数据长期保存格式规范,数据加密算法规范,网络数据传输规范和数字水印标准等。目前深圳市档案馆已经完成了《公文归档与管理规则》、《电子文件元数据标准》、《电子文件生命周期表》、《通用电子文件保管期限表》等标准和规范的起草工作。
(5)人才队伍建设。深圳数字档案馆的人才队伍建设贯彻以管理型人才为基础,以复合型人才为重点的指导思想。根据数字档案馆业务工作的划分,所需人才的类型有:档案采集、处理与数据库加工人才;信息技术及计算机系统和网络设计与开发人才;档案信息分析、研究与咨询人才;数字档案馆理论与方法研究人才;数字档案馆系统运营与服务的管理人才。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论