《数据库系统概论》知识整理
第⼀节
⼀、相关概念
1. Data:数据,是数据库中存储的基本对象,是描述事物的符号记录。
2. Database:数据库,是长期储存在计算机内、有组织的、可共享的⼤量数据的集合。
3. DBMS:数据库管理系统,是位于⽤户与操作系统之间的⼀层数据管理软件,⽤于科学地组织、存储和管理数据、⾼效地获取和维护数据。
4. DBS:数据库系统,指在计算机系统中引⼊数据库后的系统,⼀般由数据库、数据库管理系统、应⽤系统、数据库管理员(DBA)构成。
5. 数据模型:是⽤来抽象、表⽰和处理现实世界中的数据和信息的⼯具,是对现实世界的模拟,是数据库系统的核⼼和基础;其组成元素有数据结构、数据操作和完整性约束。
6. 概念模型:也称信息模型,是按⽤户的观点来对数据和信息建模,主要⽤于数据库设计。
7. 逻辑模型:是按计算机系统的观点对数据建模,⽤于DBMS实现。
8. 物理模型:是对数据最底层的抽象,描述数据在系统内部的表⽰⽅式和存取⽅法,在磁盘或磁带上的存储⽅式和存取⽅法,是⾯向计算机系统的。
9. 实体和属性:客观存在并可相互区别的事物称为实体。实体所具有的某⼀特性称为属性。
10.E-R图:即实体-关系图,⽤于描述现实世界的事物及其相互关系,是数据库概念模型设计的主要⼯具。
11.关系模式:从⽤户观点看,关系模式是由⼀组关系组成,每个关系的数据结构是⼀张规范化的⼆维表。
12.型/值:型是对某⼀类数据的结构和属性的说明;值是型的⼀个具体赋值,是型的实例。
13.数据库模式:是对数据库中全体数据的逻辑结构(数据项的名字、类型、取值范围等)和特征(数据之间的联系以及数据有关的安全性、完整性要求)的描述。
14.数据库的三级系统结构:外模式、模式和内模式。
15.数据库内模式:⼜称为存储模式,是对数据库物理结构和存储⽅式的描述,是数据在数据库内部的表⽰⽅式。⼀个数据库只有⼀个内模式。
16.数据库外模式:⼜称为⼦模式或⽤户模式,它是数据库⽤户能够看见和使⽤的局部数据的逻辑结构和特征的描述,是数据库⽤户的数据视图。通常是模式的⼦集。⼀个数据库可有多个外模式。
17.数据库的⼆级映像:外模式/模式映像、模式/内模式映像。
⼆、重点知识点
1. 数据库系统由数据库、数据库管理系统、应⽤系统和数据库管理员构成。
2. 数据模型的组成要素是:数据结构、数据操作、完整性约束条件。
3. 实体型之间的联系分为⼀对⼀、⼀对多和多对多三种类型。
4. 常见的数据模型包括:关系、层次、⽹状、⾯向对象、对象关系映射等⼏种。
5. 关系模型的完整性约束包括:实体完整性、参照完整性和⽤户定义完整性。
6. 阐述数据库三级模式、⼆级映象的含义及作⽤。
数据库三级模式反映的是数据的三个抽象层次: 模式是对数据库中全体数据的逻辑结构和特征的描述。内模式⼜称为存储模式,是对数据库物理结构和存储⽅式的描述。外模式⼜称为⼦模式或⽤户模式,是对特定数据库⽤户相关的局部数据的逻辑结构和特征的描述。
数据库三级模式通过⼆级映象在 DBMS 内部实现这三个抽象层次的联系和转换。外模式⾯向应⽤程序, 通过外模式/模式映象与逻辑模式建⽴联系, 实现数据的逻辑独⽴性。 模式/内模式映象建⽴模式与内模式之间的⼀对⼀映射, 实现数据的物理独⽴性。
第⼆节
⼀、相关概念
1. 主键: 能够唯⼀地标识⼀个元组的属性或属性组称为关系的键或候选键。 若⼀个关系有多个候选键则可选其⼀作为主键
(Primary key)。
2. 外键:如果⼀个关系的⼀个或⼀组属性引⽤(参照)了另⼀个关系的主键,则称这个或这组属性为外码或外键(Foreign key)。
3. 关系数据库: 依照关系模型建⽴的数据库称为关系数据库。 它是在某个应⽤领域的所有关系的集合。
4. 关系模式: 简单地说,关系模式就是对关系的型的定义, 包括关系的属性构成、各属性的数据类型、 属性间的依赖、 元组语义及完整性约束等。 关系是关系模式在某⼀时刻的状态或内容, 关系模型是型, 关系是值, 关系模型是静态的、 稳定的, ⽽关系是动态的、随时间不断变化的,因为关系操作在不断地更新着数据库中的数据。
5. . 实体完整性:⽤于标识实体的唯⼀性。它要求基本关系必须要有⼀个能够标识元组唯⼀性的主键,主键不能为空,也不可取重复值。
6. 参照完整性 : ⽤于维护实体之间的引⽤关系。 它要求⼀个关系的外键要么为空, 要么取与被参照关系对应的主键值,即外键值必须是主键中已存在的值。
7. ⽤户定义的完整性:就是针对某⼀具体应⽤的数据必须满⾜的语义约束。包括⾮空、 唯⼀和布尔条件约束三种情况。
⼆、重要知识点
数据库属性的概念1. 关系数据库语⾔分为关系代数、关系演算和结构化查询语⾔三⼤类。
2. 关系的 5 种基本操作是选择、投影、并、差、笛卡尔积。
3.关系模式是对关系的描述,五元组形式化表⽰为:R(U,D,DOM,F),其中
R —— 关系名
U —— 组成该关系的属性名集合
D —— 属性组 U 中属性所来⾃的域
DOM —— 属性向域的映象集合
F —— 属性间的数据依赖关系集合
4.笛卡尔乘积,选择和投影运算如下
第三节
⼀、相关概念
1. SQL:结构化查询语⾔的简称, 是关系数据库的标准语⾔。SQL 是⼀种通⽤的、 功能极强的关系数据库语⾔, 是对关系数据存取的标准接⼝, 也是不同数据库系统之间互操作的基础。集数据查询、数据操作、数据定义、和数据控制功能于⼀体。
2. 数据定义:数据定义功能包括模式定义、表定义、视图和索引的定义。
3. 嵌套查询:指将⼀个查询块嵌套在另⼀个查询块的 WHERE ⼦句或 HAVING 短语的条件中的查询。
⼆、重要知识点
1. SQL 数据定义语句的操作对象有:模式、表、视图和索引。
2. SQL 数据定义语句的命令动词是:CREATE、DROP 和 ALTER。
3. RDBMS(关系型数据库管理系统) 中索引⼀般采⽤ B+树或 HASH 来实现。
4. 索引可以分为唯⼀索引、⾮唯⼀索引和聚簇索引三种类型。
6.SQL 创建表语句的⼀般格式为
CREATE TABLE <;表名>
( <;列名> <;数据类型>[ <;列级完整性约束> ]
[,<;列名> <;数据类型>[ <;列级完整性约束>] ] …
[,<;表级完整性约束> ] ) ;
其中<;数据类型>可以是数据库系统⽀持的各种数据类型,包括长度和精度。
列级完整性约束为针对单个列(本列)的完整性约束, 包括 PRIMARY KEY、 REFERENCES表名(列名)、UNIQUE、NOT NULL 等。 表级完整性约束可以是基于表中多列的约束,包括 PRIMARY KEY ( 列名列表) 、FOREIGN KEY REFERENCES 表名(列名) 等。
7. SQL 创建索引语句的⼀般格式为
CREATE [UNIQUE] [CLUSTER] INDEX <;索引名>
ON <;表名> (<;列名列表> ) ;
其中UNIQUE:表⽰创建唯⼀索引,缺省为⾮唯⼀索引;
CLUSTER:表⽰创建聚簇索引,缺省为⾮聚簇索引;
<;列名列表>:⼀个或逗号分隔的多个列名,每个列名后可跟 ASC 或 DESC,表⽰升/降序,缺省为升序。多列时则按为多级排序。
8. SQL 查询语句的⼀般格式为
SELECT [ALL|DISTINCT] <;算术表达式列表> FROM <;表名或视图名列表>
[ WHERE <;条件表达式 1> ]
[ GROUP BY <;属性列表 1> [ HAVING <;条件表达式 2 > ] ]
[ ORDER BY <;属性列表 2> [ ASC|DESC ] ] ;
其中
ALL/DISTINCT: 缺省为 ALL, 即列出所有查询结果记录, 包括重复记录。 DISTINCT则对重复记录只列出⼀条。
算术表达式列表:⼀个或多个逗号分隔的算术表达式,表达式由常量(包括数字和字符串)、列名、函数和算术运算符构成。每个表达式后还可跟别名。也可⽤ *代表查询表中的所有列。
<;表名或视图名列表>: ⼀个或多个逗号分隔的表或视图名。 表或视图名后可跟别名。
条件表达式 1:包含关系或逻辑运算符的表达式,代表查询条件。
条件表达式 2:包含关系或逻辑运算符的表达式,代表分组条件。
<;属性列表 1>:⼀个或逗号分隔的多个列名。
<;属性列表 2>: ⼀个或逗号分隔的多个列名, 每个列名后可跟 ASC 或 DESC, 表⽰升/降序,缺省为升序。
关于SQL语句的知识这⾥先作如上简略介绍,具体写法下次将专门拿出⼀篇来叙述。
第四节
⼀、相关概念和知识
1.触发器是⽤户定义在基本表上的⼀类由事件驱动的特殊过程。由服务器⾃动激活, 能执⾏更为复杂的检查和操作,具有更精细和更强⼤的数据控制能⼒。使⽤ CREATE TRIGGER 命令建⽴触发器。
2.计算机系统存在技术安全、管理安全和政策法律三类安全性问题。
3. TCSEC/TDI 标准由安全策略、责任、保证和⽂档四个⽅⾯内容构成。
4. 常⽤存取控制⽅法包括⾃主存取控制(DAC)和强制存取控制(MAC)两种。
5. ⾃主存取控制(DAC)的 SQL 语句包括 GRANT 和 REVOKE 两个。 ⽤户权限由数据对象和操作类型两部分构成。
6. 常见SQL ⾃主权限控制命令和例⼦。
1) 把对 Student 和 Course 表的全部权限授予所有⽤户。
GRANT ALL PRIVILIGES ON TABLE Student,Course TO PUBLIC ;
2) 把对 Student 表的查询权和姓名修改权授予⽤户 U4。
GRANT SELECT,UPDATE(Sname) ON TABLE Student TO U4 ;
3) 把对 SC 表的插⼊权限授予 U5 ⽤户,并允许他传播该权限。
GRANT INSERT ON TABLE SC TO U5 WITH GRANT OPTION ;
4) 把⽤户 U5 对 SC 表的 INSERT 权限收回,同时收回被他传播出去的授权。
REVOKE INSERT ON TABLE SC FROM U5 CASCADE ;
5) 创建⼀个⾓⾊ R1,并使其对 Student 表具有数据查询和更新权限。
CREATE ROLE R1;
GRANT SELECT,UPDATE ON TABLE Student TO R1;
6) 对修改 Student 表结构的操作进⾏审计。
AUDIT ALTER ON Student ;
⼀、相关概念和知识点
1.数据依赖:反映⼀个关系内部属性与属性之间的约束关系,是现实世界属性间相互联系的抽象,属于数据内在的性质和语义的体现。
2. 规范化理论:是⽤来设计良好的关系模式的基本理论。它通过分解关系模式来消除其中不合适的数据依赖,以解决插⼊异常、删除异常、更新异常和数据冗余问题。
3. 函数依赖:简单地说,对于关系模式的两个属性⼦集X和Y,若X的任⼀取值能唯⼀确定Y的值,则称Y函数依赖于X,记作X→Y。
4. ⾮平凡函数依赖:对于关系模式的两个属性⼦集X和Y,如果X→Y,但Y!⊆X,则称X→Y为⾮平凡函数依赖;如果X→Y,但Y⊆X,则称X→Y为⾮平凡函数依赖。
5. 完全函数依赖:对于关系模式的两个属性⼦集X和Y,如果X→Y,并且对于X的任何⼀个真⼦集X',都没有X'→Y,则称Y对X完全函数依赖。
6. 范式:指符合某⼀种级别的关系模式的集合。在设计关系数据库时,根据满⾜依赖关系要求的不同定义为不同的范式。
7. 规范化:指将⼀个低⼀级范式的关系模式,通过模式分解转换为若⼲个⾼⼀级范式的关系模式的集合的过程。
8. 1NF:若关系模式的所有属性都是不可分的基本数据项,则该关系模式属于1NF。
9. 2NF:1NF关系模式如果同时满⾜每⼀个⾮主属性完全函数依赖于码,则该关系模式属于2NF。
10. 3NF:若关系模式的每⼀个⾮主属性既不部分依赖于码也不传递依赖于码,则该关系模式属于3NF。
11. BCNF:若⼀个关系模式的每⼀个决定因素都包含码,则该关系模式属于BCNF。
12. 数据库设计:是指对于⼀个给定的应⽤环境,构造优化的数据库逻辑模式和物理结构,并据此建⽴数据库及其应⽤系统,使之能够有效地存储和管理数据,满⾜各种⽤户的应⽤需求,包括信息管理要求和数据操作要求。
13. 数据库设计的6个基本步骤:需求分析,概念结构设计,逻辑结构设计,物理结构设计,数据库实施,数据库运⾏和维护。
14. 概念结构设计:指将需求分析得到的⽤户需求抽象为信息结构即概念模型的过程。也就是通过对⽤户需求进⾏综合、归纳与抽象,形成⼀个独⽴于具体DBMS的概念模型。
15. 逻辑结构设计:将概念结构模型(基本E-R图)转换为某个DBMS产品所⽀持的数据模型相符合的逻辑结构,并对其进⾏优化。
16. 物理结构设计:指为⼀个给定的逻辑数据模型选取⼀个最适合应⽤环境的物理结构的过程。包括设计数据库的存储结构与存取⽅法。
17. 抽象:指对实际的⼈、物、事和概念进⾏⼈为处理,抽取所关⼼的共同特性,忽略⾮本质的细节,并把这些特性⽤各种概念精确地加以描述,这些概念组成了某种模型。
18. 数据库设计必须遵循结构设计和⾏为设计相结合的原则。
19. 数据字典主要包括数据项、数据结构、数据流、数据存储和处理过程五个部分。
20. 三种常⽤抽象⽅法是分类、聚集和概括。
21. 局部 E-R 图之间的冲突主要表现在属性冲突、命名冲突和结构冲突三个⽅⾯。
22. 数据库常⽤的存取⽅法包括索引⽅法、聚簇⽅法和 HASH⽅法三种。
23. 确定数据存放位置和存储结构需要考虑的因素主要有: 存取时间、 存储空间利⽤率和维护代价等。
⼆、细说数据库三范式
2.1 第⼀范式(1NF)⽆重复的列
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论