《数据库系统概论》基本概念篇(第5版王珊萨师煊编著)数据库属性的概念
⼀、数据库的4个基本概念
1、数据(data)
数据是数据库中存储的对象。描述事物的符号记录称为数据。数据和关于数据的解释是不可分的。数据的解释是指对数据含义的说明,数据的含义称为数据的语义,数据与其语义是不可分的。
2、数据库(DataBase,DB)
数据库是长期存储在计算机内、有组织、可共享的⼤量数据的集合。数据库中的数据按⼀定的数据模型组织、描述、存储,具有较⼩的冗余度、较⾼的数据独⽴性和易扩展性,并可为各种⽤户共享。
数据库数据具有永久存储、有组织和可共享三个基本特点。
3、数据库管理系统(DataBase Management System,DBMS)
数据库管理系统在数据库建⽴、运⽤和维护时对数据库进⾏统⼀控制,以保证数据的完整性和安全性,并在多⽤户同时使⽤数据库时进⾏并发控制,在发⽣故障后对数据库进⾏恢复。
数据库管理系统是位于⽤户和操作系统之间的⼀层数据管理软件。⽤于科学的组织和存储数据,⾼效的获取和维护数据。主要功能:
1. 数据定义功能(数据定义语⾔,DDL)
2. 数据组织、存储和管理
3. 数据操纵功能(数据操纵语⾔,DML)
4. 数据库的事务管理和运⾏管理
5. 数据库的建⽴和维护
6. 其他功能
4、数据库系统(DataBase System,DBS)
数据库系统是由数据库、数据库管理系统、应⽤程序和数据库管理员(DataBase Administrator,DBA)组成的存储、管理、处理和维护数据的系统。
⼆、数据库系统的特点
1、数据结构化
数据库系统实现整体数据的结构化,这是数据库的主要特征之⼀,也是数据库系统与⽂件系统的本质区别。
在⽂件系统中,⽂件中的记录内部有结构,但记录的结构和记录之间的联系被固化在程序中,由程序员维护。
数据不再仅仅⾯对某⼀个应⽤,⽽是⾯向整个系统,不仅数据内部是结构化的,⽽且整体是结构化的,数据之间是具有联系的。
2、数据的共享性⾼、冗余度低且易扩充
数据⾯向整个系统。数据共享可以⼤⼤减少数据冗余,节约存储空间,还能避免数据间的不相容性与不⼀致性。这使数据库系统弹性⼤,易于扩充。
3、数据独⽴性⾼
数据独⽴性包括物理独⽴性和逻辑独⽴性。
1. 物理独⽴性是指⽤户的应⽤程序和数据库中数据的物理存储是相互独⽴的。
2. 逻辑独⽴性是指⽤户的应⽤程序和数据库的逻辑结构是相互独⽴的。
4、数据由数据库管理系统统⼀管理和控制
数据库的共享会带来数据库的安全隐患,⽽且共享是并发的(多⽤户同时存取数据)。数据库中数据的正确和⼀致要得到保障。为此,数据库管理系统要提供数据控制功能:
(1)数据的安全性保护,指保护数据以防⽌不合法使⽤造成的数据泄密和破坏。
(2)数据的完整性检测, 指数据的正确性、有效性和相容性。
(3)并发控制,对多⽤户的并发操作加以控制和协调。
(4)数据库恢复,从错误状态恢复到某⼀已知的正确状态。
三、数据模型
数据模型应满⾜三⽅⾯要求:⼀是能⽐较真实地模拟现实世界,⼆是容易被⼈理解,三是便于在计算机上实现。
数据模型通常由数据结构、数据操作和数据的完整性约束条件组成。
第⼀类是概念模型,第⼆类是逻辑模型和物理模型。
概念模型也叫信息模型,按⽤户的观点对数据和信息建模,主要⽤于数据库设计。
逻辑模型包括层次模型、⽹状模型、关系模型、⾯向对象模型等,按计算机系统的观点对数据建模,主要⽤于数据库管理系统的实现。
物理模型是对数据最底层的抽象,描述数据在系统内部的表⽰⽅法和存取⽅法,或在磁盘上的存储⽅法和存取⽅法,⾯向计算机系统。
先将现实世界抽象为信息世界,再将信息世界转换为机器世界。
四、概念模型
1、信息世界基本概念
(1)实体(entity),客观存在并可相互区别的事物称为实体。
(2)属性(attribute),实体所具有的某⼀特性称为属性。
(3)码(key),唯⼀标识实体的属性集称为码。
(4)实体型(entity type),⽤实体名及其属性名集合来抽象和刻画同类实体,称为实体型。如,学⽣(学号,姓名,性别)就是⼀个实体型。
(5)实体机(entity set),同⼀类型实体的集合称为实体集。如,全体学⽣。
(6)联系(relationship),实体之间的联系。⼀对⼀,⼀对多等。
2、概念模型的表⽰⽅法:实体-联系⽅法(E-R)
实体-联系⽅法(Entity-Relationship approach),E-R⽅法也叫E-R模型。
E-R图(E-R diagram)。
approach 有靠近和⽅法的意思。
diagram 图,图表,图解的意思。
E-R图:
(1)实体⽤矩形表⽰
(2)属性⽤椭圆表⽰
(3)联系或者叫关系⽤菱形表⽰
(4)⼀对⼀、⼀对多、多对多关系⽤ 1、a-z(⼀般是m,n)表⽰,其中多对多时字母要不⼀样。
五、关系模型
1、关系模型的数据结构
(1)关系(relation):⼀个关系对应⼀张表。
(2)元组(tuple):表中的⼀⾏为⼀个元组。
(3)属性(attribute):表中的⼀列为⼀个属性。
(4)码(key):表中唯⼀确定⼀个元组的⼀个属性组。
(5)域(domain):属性的取值范围,数据类型要相同。
(6)分量:元组中的⼀个属性值。
(7)关系模式:对关系的描述,⼀般为 关系名(属性1,属性2,…)
关系的每⼀个分量必须是⼀个不可分的数据项。
R(D1,D2,…,Dn)
⽬或度(degree):属性的个数,当n=1时,称该关系为单元关系,往后是⼆元关系。
候选码(candidate key):某⼀属性组能唯⼀标识⼀个元组,⽽其⼦集不能的⼀个属性组。
主码(primary key):多个候选码中选⼀个作为主码。
主属性(prime attribute):候选码的属性叫主属性。
全码(all-key):关系模式的所有属性都是候选码的情况。
2、关系模型的数据操纵和完整性约束
关系模型的数据操纵主要包括查询、插⼊、删除和更新数据,这些操作必须满⾜完整性约束条件。
关系的完整性约束条件包括:实体完整性、参照完整性和⽤户定义的完整性。
1. 实体完整性规则:主属性不能取空值(null value)。
2. 参照完整性:外码属性要么取空值,要么等于某个元组的主码值。
3. ⽤户定义的完整性:⽤户定义的⼀系列约束条件。
3、关系模型优缺点
(1)关系模型建⽴在严格的数学概念上的。
(2)关系模型概念单⼀,数据结构简单、清晰、⽤户易懂易⽤。
(3)关系模型的存取路径对⽤户透明,数据独⽴性更⾼,安全保密性更好,简化程序员⼯作和数据库开发建⽴的⼯作。
六、数据库系统的三级模式结构与⼆级映像
1、模式(schema)
模式也称逻辑模式,是数据库全体数据的逻辑结构和特征的描述,是所有⽤户的公共数据视图。
数据库数据在逻辑上的视图,⼀个数据库只有⼀个模式。
2、外模式(external schema)
外模式也称⼦模式或⽤户模式,局部数据的逻辑结构和特征的描述,是数据库⽤户的数据视图,是与某⼀个应⽤有关的数据的逻辑表⽰。(对应于某⼀应⽤)。
外模式通常是模式的⼦集,⼀个数据库可以有多个外模式,但⼀个程序只能使⽤⼀个外模式。
3、内模式(internal schema)
内模式也称存储模式,它是数据物理结构和存储⽅式的描述,是数据在数据库内部的组织⽅式。
⼀个数据库只有⼀个内模式。
1、外模式/模式映像
模式描述的是数据的全局逻辑结构,外模式描述的是数据的局部逻辑结构。
外模式/模式映像保证了数据与程序的逻辑独⽴性,简称数据的逻辑独⽴性。
2、模式/内模式映像
保证了数据与程序的物理独⽴性,简称数据的物理独⽴性。
本篇结束,关系代数暂时不讲,下⼀篇是关系数据库标准语⾔SQL

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。