全国计算机等级考试——⼆级公共基础知识辅导讲义全国计算机等级考试——⼆级公共基础知识辅导讲义
第⼀章数据结构与算法
1.1算法
1、算法是指解题⽅案的准确⽽完整的描述。换句话说,算法是对特定问题求解步骤的⼀种描
述。
:算法不等于程序,也不等于计算⽅法。程序的编制不可能优于算法的设计[这是因为:在编写
程序时要受到计算机系统运⾏环境的限制,程序通常还要考虑很多与⽅法和分析⽆关的细节问
题。]。
2、算法的基本特征
(1)可⾏性。针对实际问题⽽设计的算法,执⾏后能够得到满意的结果。
(2)确定性。每⼀条指令的含义明确,⽆⼆义性。并且在任何条件下,算法只有唯⼀的⼀条执
⾏路径,即相同的输⼊只能得出相同的输出。
(3)有穷性。算法必须在有限的时间内完成。有两重含义,⼀是算法中的操作步骤为有限个,
⼆是每个步骤都能在有限时间内完成。
(4)拥有⾜够的情报。算法中各种运算总是要施加到各个运算对象上,⽽这些运算对象⼜可能
具有某种初始状态,这就是算法执⾏的起点或依据。因此,⼀个算法执⾏的结果总是与输⼊的
初始数据有关,不同的输⼊将会有不同的结果输出。当输⼊不够或输⼊错误时,算法将⽆法执
⾏或执⾏有错。⼀般说来,当算法拥有⾜够的情报时,此算法才是有效的;⽽当提供的情报不
够时,算法可能⽆效。
:综上所述,所谓算法,是⼀组严谨地定义运算顺序的规则,并且每⼀个规则都是有效的,且
是明确的,此顺序将在有限的次数下终⽌。
3、算法复杂度主要包括时间复杂度和空间复杂度。
(1)算法时间复杂度是指执⾏算法所需要的计算⼯作量,可以⽤执⾏算法的过程中所需基本运
二叉树的基本性质算的执⾏次数来度量。
(2)算法空间复杂度是指执⾏这个算法所需要的内存空间。
1.2数据结构的基本概念
1、数据结构是指相互有关联的数据元素的集合。
2、数据结构主要研究和讨论以下三个⽅⾯的问题:
(1)数据集合中各数据元素之间所固有的逻辑关系,即数据的逻辑结构。
数据的逻辑结构包含:1)表⽰数据元素的信息;2)表⽰各数据元素之间的前后件关系[前后件
关系:⼀般情况下,在具有相同特征的数据元素集合中,各个数据元素之间存在某种关系(即
联系),这种关系反映了该集合中的数据元素所固有的⼀种结构。在数据处理领域中,通常把
数据元素之间这种固有的关系简单地⽤前后件关系(即直接前驱与直接后继关系)来描述。]。
(2)在对数据进⾏处理时,各数据元素在计算机中的存储关系,即数据的存储结构。
数据的存储结构有顺序、链接、索引等。
1)顺序存储。它是把逻辑上相邻的结点存储在物理位置相邻的存储单元⾥,结点间的逻辑关系
由存储单元的邻接关系来体现。由此得到的存储表⽰称为顺序存储结构。
2)链接存储。它不要求逻辑上相邻的结点在物理位置上亦相邻,结点间的逻辑关系是由附加的指针字段表⽰的。由此得到的存储表⽰称为链式存储结构。
3)索引存储:除建⽴存储结点信息外,还建⽴附加的索引表来标识结点的地址。
:数据的逻辑结构反映数据元素之间的逻辑关系,数据的存储结构(也称数据的物理结构)是数据的逻辑结构在计算机存储空间中的存放形式。同⼀种逻辑结构的数据可以采⽤不同的存储结构,但影响数据处理效率。
(3)对各种数据结构进⾏的运算。
3、数据结构的图形表⽰
⼀个数据结构除了⽤⼆元关系表⽰外,还可以直观地⽤图形表⽰。在数据结构的图形表⽰中,对于数据集合D中的每⼀个数据元素⽤中间标有元素值的⽅框表⽰,⼀般称之为数据结点,并简称为结点;为了进⼀步表⽰各数据元素之间的前后件关系,对于关系R中的每⼀个⼆元组,⽤⼀条有向线段从前件结点指向后件结点。
4、数据结构分为两⼤类型:线性结构和⾮线性结构。
(1)线性结构(⾮空的数据结构)条件:1)有且只有⼀个根结点[在数据结构中,没有前件的结点称为根结点。];2)每⼀个结点最多有⼀个前件,也最多有⼀个后件。
:常见的线性结构有线性表、栈、队列和线性链表等。
(2)⾮线性结构:不满⾜线性结构条件的数据结构。
:常见的⾮线性结构有树、⼆叉树和图等。
1.3线性表及其顺序存储结构
1、线性表由⼀组数据元素构成,数据元素的位置只取决于⾃⼰的序号,元素之间的相对位置是线性的。线性表是由n(n≥0)个数据元素组成的⼀个有限序列,表中的每⼀个数据元素,除了第⼀个外,有且
只有⼀个前件,除了最后⼀个外,有且只有⼀个后件。线性表中数据元素的个数称为线性表的长度。线性表可以为空表。
:线性表是⼀种存储结构,它的存储⽅式:顺序和链式。
2、线性表的顺序存储结构具有两个基本特点:(1)线性表中所有元素所占的存储空间是连续的;(2)线性表中各数据元素在存储空间中是按逻辑顺序依次存放的。
:由此可以看出,在线性表的顺序存储结构中,其前后件两个元素在存储空间中是紧邻的,且前件元素⼀定存储在后件元素的前⾯,可以通过计算机直接确定第i个结点的存储地址。
3、顺序表的插⼊、删除运算
(1)顺序表的插⼊运算:在⼀般情况下,要在第i(1≤i≤n)个元素之前插⼊⼀个新元素时,⾸先要从最后⼀个(即第n个)元素开始,直到第i个元素之间共n-i+1个元素依次向后移动⼀个位置,移动结束后,第i个位置就被空出,然后将新元素插⼊到第i项。插⼊结束后,线性表的长度就增加了1。
:顺性表的插⼊运算时需要移动元素,在等概率情况下,平均需要移动n/2个元素。
(2)顺序表的删除运算:在⼀般情况下,要删除第i(1≤i≤n)个元素时,则要从第i+1个元素开始,直到第n个元素之间共n-i个元素依次向前移动⼀个位置。删除结束后,线性表的长度就减⼩了1。
:进⾏顺性表的删除运算时也需要移动元素,在等概率情况下,平均需要移动(n-1)/2个元素。插⼊、删除运算不⽅便。
1.4栈和队列
1、栈及其基本运算
栈是限定在⼀端进⾏插⼊与删除运算的线性表。
在栈中,允许插⼊与删除的⼀端称为栈顶,不允许插⼊与删除的另⼀端称为栈底。栈顶元素总是最后被插⼊的元素,栈底元素总是最先被插⼊的元素。即栈是按照“先进后出”或“后进先出”的原则组织数据的。[第8题]
栈具有记忆作⽤。
栈的基本运算:1)插⼊元素称为⼊栈运算;2)删除元素称为退栈运算;3)读栈顶元素是将栈顶元素赋给⼀个指定的变量,此时指针⽆变化。
栈的存储⽅式和线性表类似,也有两种,即顺序栈和链式栈。
2、队列及其基本运算
队列是指允许在⼀端(队尾)进⼊插⼊,⽽在另⼀端(队头)进⾏删除的线性表。尾指针(Rear)指向队尾元素,头指针(front)指向排头元素的前⼀个位置(队头)。
队列是“先进先出”或“后进后出”的线性表。
队列运算包括:1)⼊队运算:从队尾插⼊⼀个元素;2)退队运算:从队头删除⼀个元素。
循环队列及其运算:所谓循环队列,就是将队列存储空间的最后⼀个位置绕到第⼀个位置,形成逻辑上的环状空间,供队列循环使⽤。在循环队列中,⽤队尾指针rear指向队列中的队尾元素,⽤排头指针front指向排头元素的前⼀个位置,因此,从头指针front指向的后⼀个位置直到队尾指针rear指向的位置之间,所有的元素均为队列中的元素。[第24套]
1.5线性链表
1、线性表顺序存储的缺点:(1)插⼊或删除的运算效率很低。在顺序存储的线性表中,插⼊或删除数据元素时需要移动⼤量的数据元素;(2)线性表的顺序存储结构下,线性表的存储空间不便于扩充;(3)线性表的顺序存储结构不便于对存储空间的动态分配。
2、线性链表:线性表的链式存储结构称为线性链表,是⼀种物理存储单元上⾮连续、⾮顺序的存储结构,数据元素的逻辑顺序是通过链表中的指针链接来实现的。因此,在链式存储⽅式中,每个结点由两
部分组成:⼀部分⽤于存放数据元素的值,称为数据域;另⼀部分⽤于存放指针,称为指针域,⽤于指向该结点的前⼀个或后⼀个结点(即前件或后件),如下图所⽰:
线性链表分为单链表、双向链表和循环链表三种类型。
在单链表中,每⼀个结点只有⼀个指针域,由这个指针只能到其后件结点,⽽不能到其前件结点。因此,在某些应⽤中,对于线性链表中的每个结点设置两个指针,⼀个称为左指针,指向其前件结点;另⼀个称为右指针,指向其后件结点,这种链表称为双向链表,如下图所⽰:
3、线性链表的基本运算
(1)在线性链表中包含指定元素的结点之前插⼊⼀个新元素。
:在线性链表中插⼊元素时,不需要移动数据元素,只需要修改相关结点指针即可,也不会出现“上溢[当为⼀个线性表分配顺序存储结构后,如果出现线性表的存储空间已满,但还需要插⼊新的元素时,就会发⽣“上溢”现象。]”现象。
(2)在线性链表中删除包含指定元素的结点。
:在线性链表中删除元素时,也不需要移动数据元素,只需要修改相关结点指针即可。
(3)将两个线性链表按要求合并成⼀个线性链表。
(4)将⼀个线性链表按要求进⾏分解。
(5)逆转线性链表。
(6)复制线性链表。
(7)线性链表的排序。
(8)线性链表的查。
:线性链表不能随机存取[在链表中,即使知道被访问结点的序号i,也不能像顺序表中那样直接按序号i访问结点,⽽只能从链表的头指针出发,顺着链域逐个结点往下搜索,直⾄搜索到第i个结点为⽌。因此,链表不是随机存储结构。]。
4、循环链表及其基本运算
在线性链表中,其插⼊与删除的运算虽然⽐较⽅便,但还存在⼀个问题,在运算过程中对于空表和对第⼀个结点的处理必须单独考虑,使空表与⾮空表的运算不统⼀。为了克服线性链表的这个缺点,可以采⽤另⼀种链接⽅式,即循环链表。
与前⾯所讨论的线性链表相⽐,循环链表具有以下两个特点:1)在链表中增加了⼀个表头结点,其数据域为任意或者根据需要来设置,指针域指向线性表的第⼀个元素的结点,⽽循环链表的头指针指向表头结点;2)循环链表中最后⼀个结点的指针域不是空,⽽是指向表头结点。即在循环链表中,所有结点的指针构成了⼀个环状链。
下图a是⼀个⾮空的循环链表,图b是⼀个空的循环链表:
循环链表的优点主要体现在两个⽅⾯:⼀是在循环链表中,只要指出表中任何⼀个结点的位置,就可以从它出发访问到表中其他所有的结点,⽽线性单链表做不到这⼀点;⼆是由于在循环链表中设置了⼀个表头结点,在任何情况下,循环链表中⾄少有⼀个结点存在,从⽽使空表与⾮空表的运算统⼀。
:循环链表是在单链表的基础上增加了⼀个表头结点,其插⼊和删除运算与单链表相同。但它可以从任⼀结点出发来访问表中其他所有结点,并实现空表与⾮空表的运算的统⼀。
1.6树与⼆叉树
1、树的基本概念
树是⼀种简单的⾮线性结构。在树这种数据结构中,所有数据元素之间的关系具有明显的层次特性。
在树结构中,每⼀个结点只有⼀个前件,称为⽗结点。没有前件的结点只有⼀个,称为树的根结点,简称树的根。每⼀个结点可以有多个后件,称为该结点的⼦结点。没有后件的结点称为叶⼦结点。
在树结构中,⼀个结点所拥有的后件的个数称为该结点的度,所有结点中最⼤的度称为树的度。树的最⼤层次称为树的深度。
2、⼆叉树及其基本性质
(1)什么是⼆叉树
⼆叉树是⼀种很有⽤的⾮线性结构,它具有以下两个特点:1)⾮空⼆叉树只有⼀个根结点;2)每⼀个结点最多有两棵⼦树,且分别称为该结点的左⼦树与右⼦树。
:根据⼆叉树的概念可知,⼆叉树结点的度可以为0(叶结点)、1(只有⼀棵⼦树)或2(有2棵⼦树)。
(2)⼆叉树的基本性质
性质1在⼆叉树的第k层上,最多有个结点。
性质2深度为m的⼆叉树最多有个个结点。
性质3在任意⼀棵⼆叉树中,度数为0的结点(即叶⼦结点)总⽐度为2的结点多⼀个。[第4题,第23题]性质4具有n个结点的⼆叉树,其深度⾄少为,其中表⽰取的整数部分。
3、满⼆叉树与完全⼆叉树
满⼆叉树:除最后⼀层外,每⼀层上的所有结点都有两个⼦结点。
完全⼆叉树:除最后⼀层外,每⼀层上的结点数均达到最⼤值;在最后⼀层上只缺少右边的若⼲结点。
:根据完全⼆叉树的定义可得出:度为1的结点的个数为0或1。[第19题]
下图a表⽰的是满⼆叉树,下图b表⽰的是完全⼆叉树:
完全⼆叉树还具有如下两个特性:
性质5具有n个结点的完全⼆叉树深度为。
性质6设完全⼆叉树共有n个结点,如果从根结点开始,按层序(每⼀层从左到右)⽤⾃然数1,2,…,n给结点进⾏编号,则对于编号为k(k=1,2,…,n)的结点有以下结论:
①若k=1,则该结点为根结点,它没有⽗结点;若k>1,则该结点的⽗结点的编号为INT(k/2)。
②若2k≤n,则编号为k的左⼦结点编号为2k;否则该结点⽆左⼦结点(显然也没有右⼦结点)。
③若2k+1≤n,则编号为k的右⼦结点编号为2k+1;否则该结点⽆右⼦结点。
4、⼆叉树的存储结构
在计算机中,⼆叉树通常采⽤链式存储结构。
与线性链表类似,⽤于存储⼆叉树中各元素的存储结点也由两部分组成:数据域和指针域。但在⼆叉树中,由于每⼀个元素可以有两个后件(即两个⼦结点),因此,⽤于存储⼆叉树的存储结点的指针域有两个:⼀个⽤于指向该结点的左⼦结点的存储地址,称为左指针域;另⼀个⽤于指向该结点的右⼦结点的存储地址,称为右指针域。
:⼀般⼆叉树通常采⽤链式存储结构,对于满⼆叉树与完全⼆叉树来说,可以按层次进⾏顺序存储[这样,不仅节省了存储空间,⼜能⽅便地确定每⼀个结点的⽗结点与左右⼦结点的位置,但顺序存储结构对于⼀般的⼆叉树不适⽤。]。
5、⼆叉树的遍历(所谓的前中后指的是,⽗结点访问的顺序)
⼆叉树的遍历是指不重复地访问⼆叉树中的所有结点。⼆叉树的遍历可以分为以下三种:
(1)前序遍历(DLR):若⼆叉树为空,则结束返回。否则:⾸先访问根结点,然后遍历左⼦树,最后遍历右⼦树;并且,在遍历左右⼦树时,仍然先访问根结点,然后遍历左⼦树,最后遍历右⼦树。(从上往下)
(2)中序遍历(LDR):若⼆叉树为空,则结束返回。否则:⾸先遍历左⼦树,然后访问根结点,最后遍历右⼦树;并且,在遍历左、右⼦树时,仍然先遍历左⼦树,然后访问根结点,最后遍历右⼦树。
(3)后序遍历(LRD):若⼆叉树为空,则结束返回。否则:⾸先遍历左⼦树,然后遍历右⼦树,最后访问根结点,并且,在遍历左、右⼦树时,仍然先遍历左⼦树,然后遍历右⼦树,最后访问根结点。
1.7查技术
查:根据给定的某个值,在查表中确定⼀个其关键字等于给定值的数据元素。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论