数据库的定义
胡经国
本文作者的话
本文是根据有关文献和资料编写的《漫话云计算》系列文稿之一。以此作为云计算学习笔录,供云计算业外读者进一步学习和研究参考。希望能够得到大家的指教和喜欢!
下面是正文
一、数据库定义说法一
严格地说,数据库(Database,DB)是“按照数据结构来组织、存储和管理数据的仓库”。在日常经济管理工作中,常常需要把某些相关的数据放进这样的“仓库”,并根据管理的需要进行相应的处理。
例如,企业或事业单位的人事部门,常常要把本单位职工的基本情况(职工号、姓名、年龄、性别、籍贯、工资、简历等)存放在表中,这张表就可以看成是一个数据库。有了这种数据仓我们就可以根据需要随时查询某职工的基本情况,也可以查询工资在某个范围内的职工人数等等。这些工作如果都能在计算机上自动进行,那么我们的人事管理就可以达到极高的水平。
此外,在财务管理、仓库管理、生产管理中也需要建立众多的这种数据库,使其可以利用计算机实现财务、仓库、生产的自动化管理。
J·Martin给数据库下了一个比较完整的定义:数据库是存储在一起的相关数据的集合,这些数据是结构化的,无有害的或不必要的冗余,并为多种应用服务;数据的存储独立于使用它的应用程序;对数据库插入新数据,修改和检索原有数据均能按一种公用的和可控制的方式进行。若某个系统中存在结构上完全分开的若干个数据库,则该系统包含一个“数据库集合”。
链接:数据结构
数据结构(Data Structure)是指相互之间存在一种或多种特定关系的数据元素的集合和该集合中所有数据元素之间的关系的有限集合。数据结构可用下式表示:
Data Structure=(D,R)
其中,D是数据元素的集合,R是该集合中所有元素之间的关系的有限集合。
数据结构是计算机存储、组织数据的方式。通常情况下,精心选择的数据
结构可以带来更高的运行或者存储效率。数据结构往往同高效的检索算法和索引技术有关。
链接:结构化数据、非结构化数据
结构化数据是指行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据。
相对于结构化数据而言,不方便用数据库二维逻辑表来表现的数据,称为非结构化数据,包括所有格式的办公文档、文本、图片、XML文件、HTML文件、各类报表、图像和音频、视频信息等等。
链接:二维表
通俗地说,二维表就是由行列组成的表,知道行号列号就可以确定一个表中的数据。这是二维表的特点。二维表中每一行称为一个记录(或称为一个元组);二维表中每一列称为一个字段(或称为一个属性)。二维表在生活中应用广泛,例如成绩单、工资表、人员名单等。在关系型数据库中,存放在数据库中的数据的逻辑结构以二维表为主。
链接:冗余
冗余(Redundancy Redundance),是指多余的重复内容(包括信息、语言、代码等);通常是指通过多重备份来增加系统的可靠性。
二、数据库定义说法二
数据库,是指依照某种数据模型组织起来并存放在二级存储器中的数据集合。这种数据集合具有如下特点:尽可能不重复;以最优方式为某个特定组织的多种应用服务;其数据结构独立于使用它的应用程序;对数据的增、删、改和检索由统一软件进行管理和控制。
数据库属性的概念从发展的历史看,数据库是数据管理的高级阶段,它是由文件管理系统发展起来的。
链接:数据模型
数据(Data)是描述事物的符号记录。
模型(Model)是现实世界的抽象。
数据模型(Data Model)是数据特征的抽象,是数据库管理的教学形式框架,数据库系统中用以提供信息表示和操作手段的形式构架。数据模型包括数据库数据的结构部分、数据库数据的操作部分和数据库数据的约束条件,即数据模型所描述的内容包括三个部分:数据结构、数据操作、数据约束。
链接:二级存储器
二级存储(Secondary Storage,Auxiliary Storage)是计算机主存储器或内存之外的所有可访问数据存储器。外部存储以及辅助存储是其同义词。
链接:文件管理系统
文件管理越来越受到企业的重视。但是,企业在进行文件管理的过程中,经常会碰到以下的问题:海量文件存储,管理困难;查缓慢,效率低下;文件版本管理混乱;文件安全缺乏保障;文件无法有效协作共享;知识管理举步维艰等。所以,文件管理逐渐成为国内外业界研究的热点。
文件管理系统(File Management System)就是为了解决文件管理中的问题而研发的计算机应用系统。
文件管理系统作为一个统一的信息管理机制,应具有下述功能:①、集中存储;②、权限管理;③、全文索引;④、文档审计;⑤、版本管理;⑥、自动编号;⑦、锁定保护;⑧、规则应用;⑨、存储加密;⑩、数据备份;⑪、文档借阅;⑫、审批流程;⑬、统计报表。
三、数据库定义说法三
据伯尔尼公约议定书专家委员会的观点,所有的信息的编纂物,不论其是以印刷形式,计算机存储单元形式,还是其它形式存在,都应视为“数据库”。需要对数字化内容进行选择的原因有很多,概括起来主要有:
⑴、存储空间的原因
数字化产品是通过网络被广大用户存取利用,而大家都知道数字化产品是存放在磁盘阵列上的。磁盘阵列由服务器来管理。磁盘空间是有限的,服务器的能力也是有限的,不可能无限量地存入数字资源。这就需要我们对文献资源数字化内容进行选择。
链接:数字化产品
数字化产品(Digital Products)是指信息、计算机软件、视听娱乐产品等可数字化表示并可用计算机网络转输的产品或劳务。
⑵、解决数字化生产高成本和图书馆经费有限性之间矛盾的需要
几乎没有图书馆有充足的资源来对整个馆藏进行数字化,数字化内容选择不可避免。
⑶、数字资源管理的需要
技术快速发展使数字化项目所生成的数字资源的生命周期越来越短,投入巨资进行数字迁移是延长数字资源生命的一个重要途径,昂贵的维护成本就必须考虑数字化内容的选择。
四、数据库定义说法四
数据库是一个长期存储在计算机内的、有组织的、有共享的、统一管理的数据集合。它是一个按数据结构来存储和管理数据的计算机软件系统。数据库
的概念实际包括两层意思:
⑴、数据库是一个实体。它是能够合理保管数据的“仓库”,用户在该“仓库”中存放要管理的事务数据;“数据”和“库”两个概念结合成为数据库。
⑵、数据库是数据管理的新方法和技术。它能更合适地组织数据、更方便地维护数据、更严密地控制数据和更有效地利用数据。
五、数据库定义说法五
数据库是一个单位或是一个应用领域的通用数据处理系统。它存储的是属于企业和事业部门、团体和个人的有关数据的集合。数据库中的数据是从全局观点出发建立的,是按一定的数据结构(数据模型)进行组织、描述和存储的。其结构基于数据间的自然联系,从而可以提供一切必要的存取路径;并且数据不再针对某一应用,而是面向全组织,具有整体的结构化特征。
数据库中的数据是为众多用户所共享其信息而建立的,已经摆脱了具体程序的限制和制约。不同的用户可以按照各自的用法使用数据库中的数据;多个用户可以同时共享数据库中的数据资源,即不同的
用户可以同时存取数据库中的同一个数据。数据共享性不仅满足了各个用户对信息内容的要求,同时也满足了各个用户之间信息通信的要求。
2016年12月22日编写于重庆
2019年1月15日修改于重庆

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。