开放源代码的数字资源管理系统
DSpace和Fedora的分析和比较
1 背景
我们对目前国际上流行的开放源代码的数
字资源管理系统进行了重点的分析和试用,尤其对目前流行的两种开放源代码数字资
源管理系统DSpace[1]和Fedora的体系结构、主要功能特点等做一些系统的分析和比较,希望能够为关注这些研究的单位和研究人
员提供一些借鉴和参考。
2 DSpace的分析
DSpace系统是MIT和HP实验室合作研究开发的为教育科研机构创建稳定的环境来长
期保存和获得原生数字材料,捕捉、存储、索引、保存以及传播数字财产的系统平台。2002年10月,该平台开始在MIT正式服务,2002年底,向全世界公开了基于BSD开放源代码许可协议的DSpace源码,目
前最新版
本为版。
DSpace的数据模型
DSpace中的数据组织倾向于反映使用DSpace系统的组织本身的结构。每个Dspace 系统被划分成一些数字空间(Communities),对应于大学的院系、实验室、研究中心等,这些依据不同的授权完成不同任务的组称作数字空间。在DSpace 中,这些数字空间可以组织成一个有继承关系的结构。
数字空间中包含数字馆藏(Collections),数字馆藏由一些相关的内容组成,一个数字馆藏可以出现在多个数字空间中。
免费平台源码资源网
数字馆藏由数字条目(Items)组成,数字条目是信息的基本存档元素。每一个数字条目由一个数字馆藏拥有,它可以出现在其他的数字馆藏中,但是只有唯一的所有者拥有馆藏。
数字条目被进一步划分为命名的数字流包(Bundles of Bitstreams)。数字流(BitStreams)是由比特位组成的一般的计
算机文件。具有密切联系的数字流可以组成数字流包。
每个数字流与一种数字流格式相关联。因为提供长期保存服务是DSpace服务的一个重要方面,所以获取用户提交的文件的特定格式是很重要的。在DSpace中,一个数字流格式是用来指向一个特定文件格式的唯
一方法。例如:对Microsoft Word 2000格式的数字流的解释是通过指向Microsoft Word 2000应用程序的引用来隐式地定义。数字流格式比MIME类型或者文件名后缀更能准确表达格式。例如:对Microsoft Word 2000格式的数字流的解释是通过指向Microsoft Word 2000应用程序的引用来定义的;而采用MIME类型的
Application/ms-word和文件名后缀的,doc 覆盖了Microsoft Word应用的多种版本,每种版本对应可能特性不同的数字流。
DSPace的体系结构
DSPace系统分为三层,每一层由一系列组件组成。
DSpace的体系结构
其中存储层(Storage Layer)负责对数字条目和关联的元数据进行存储,数字内容存储
在文件系统中,以数字流和数字流包的形式与条目相关联,条目中可以包含不同类型的文件。业务逻辑层(Business Logic Layer)由处理DSpace系统各个独立功能的一系列组件组成,如:浏览、检索、用户/组管理和授权、工作流管理、内容管理等。应用层(Application Layer)提供终端用户交互和接口功能,基于Web的用户界面,批量数据导入工具,OAI元数据供应等。考虑到长期保存的需要,DSpace提供对CNRI句柄的支持,保证给每个数字条目一个全球唯一的标识符。
DSpace的主要功能特点
(1)DSpace中的元数据支持
DSpace中的存档内容具有3种元数据。
①描述元数据
每个数字条目对应有一个Qualified Dublin Core描述元数据记录。Qualified Dublin Core之外的其他关于数字条目的描述元数据可以以序列化的数字流的形式存在。数字空间和数字馆藏具备一些简单的描述元数据,存在于系数据库中。
②管理元数据
包括技术元数据,数字化过程元数据和授权策略等数据。大多数存在于DSpace的关系数据库表中。
③结构元数据
包括的信息有:如何展示一个数字条目,或者是将个数字条目内部的数字流给用户;数字条目组成部分之间的关系。例如:组成一个论文的一组TIFF图,每幅图代表其中一页,结构元数据可以将其中的每一张图像表示为一页,并表示每页的顺序信息。
(2)DSpace中的电子用户(E-People)
DSpace中的许多功能如:文档发现和提取都可以匿名使用,但是用户必须经过身份验证才能行使如提交,E-mail通知或管理的功能。用户可以通过分组来方便地管理。DSpace中把用户叫做“E-People”,因为在有些时候一些用户可能是机器而非真正的人。
DSPace中保存的每个E-Person的信息
①邮件地址;
②姓名;

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。