数据结构与算法基础
⼀: 算法
算法:是⼀组有穷指令集,是解题⽅案的准确⽽完整的描述。通俗地说,算法就是计算机解题的过程。算法不等于程序,也不等于计算⽅法,程序的编制不可能优于算法的设计。
算法是⼀组严谨地定义运算顺序的规则,每⼀个规则都是有效的,且是明确的,此顺序将在有限的次数下终⽌。所以其四个基本特征包括:
(1)确定性,算法中每⼀步骤都必须有明确定义,不允许有模棱两可的解释,不允许有多义性;
(2)有穷性,算法必须能在有限的时间内做完,即能在执⾏有限个步骤后终⽌;
(3)可⾏性,算法原则上能够精确地执⾏;
(4)拥有⾜够的情报。
算法的基本要素:⼀是对数据对象的运算和操作;⼆是算法的控制结构。
指令系统:⼀个计算机系统能执⾏的所有指令的集合。
基本运算和操作包括:算术运算、逻辑运算、关系运算、数据传输。
算法的三种基本控制结构:顺序结构、选择结构、循环结构。
算法基本设计⽅法:列举法、归纳法、递推、递归、减半递推技术、回溯法。
算法效率的度量—算法复杂度:算法时间复杂度和算法空间复杂度。
算法时间复杂度:指执⾏算法所需要的计算⼯作量。即算法执⾏过程中所需要的基本运算次数。通常,⼀个算法所⽤的时间包括编译时间和运⾏时间。
算法空间复杂度:指执⾏这个算法所需要的内存空间。包括算法程序所占的空间,输⼊的初始数据所占的空间,算法执⾏过程中所需的额外空间。⼆: 数据结构的基本概念
数据结构:指相互有关联的数据元素的集合。
数据结构研究的三个⽅⾯:
(1)数据集合中各数据元素之间所固有的逻辑关系,即数据的逻辑结构;
(2)在对数据进⾏处理时,各数据元素在计算机中的存储关系,即数据的存储结构;
(3)对各种数据结构进⾏的运算。
数据的逻辑结构应包含:
(1)表⽰数据元素的信息;
(2)表⽰各数据元素之间的前后件关系(指逻辑关系,与存储位置⽆关)。
数据的逻辑结构在计算机存储空间中的存放形式称为数据的存储结构,也称数据物理结构。
数据的存储结构有顺序、链接、索引等。
线性结构的条件,(⼀个⾮空数据结构):
(1)有且只有⼀个根结点; (2)每⼀个结点最多有⼀个前件,也最多有⼀个后件。
⾮线性结构:不满⾜线性结构条件的数据结构。
三:线性表及其顺序存储结构
线性表是由⼀组数据元素构成,数据元素的位置只取决于⾃⼰的序号,元素之间的相对位置是线性的。
在复杂线性表中,由若⼲项数据元素组成的数据元素称为记录;
由多个记录构成的线性表称为⽂件。
⾮空线性表的结构特征:
(1)且只有⼀个根结点a1,它⽆前件;
(2)有且只有⼀个终端结点an,它⽆后件;
(3)除根结点与终端结点外,其他所有结点有且只有⼀个前件,也有且只有⼀个后件。
结点个数n称为线性表的长度,当n=0时,称为空表。
线性表的顺序存储结构具有以下两个基本特点:
(1)线性表中所有元素所占的存储空间是连续的;
(2)线性表中各数据元素在存储空间中是按逻辑顺序依次存放的。
元素a i的存储地址为:ADR(a i)=ADR(a1)+(i-1)k,ADR(a1)为第⼀个元素的地址,k代
表每个元素占的字节数。
顺序表的运算:查、插⼊、删除。
四:线性链表
数据结构中的每⼀个结点对应于⼀个存储单元,这种存储单元称为存储结点,简称结点。
结点由两部分组成:
(1) ⽤于存储数据元素值,称为数据域;
(2) ⽤于存放指针,称为指针域,⽤于指向前⼀个或后⼀个结点。
在链式存储结构中,存储数据结构的存储空间可以不连续,各数据结点的存储顺序与数据元素之间的逻辑关系可以不⼀致,⽽数据元素之间的逻辑关系是由指针域来确定的。
链式存储⽅式即可⽤于表⽰线性结构,也可⽤于表⽰⾮线性结构。
线性单链表中,HEAD称为头指针,HEAD=NULL(或0)称为空表。
二叉树的基本性质如果是双项链表的两指针:左指针(Llink)指向前件结点,右指针(Rlink)指向后件结点。
线性链表的基本运算:查、插⼊、删除。
五:栈和队列
栈:限定在⼀端进⾏插⼊与删除的线性表。
其允许插⼊与删除的⼀端称为栈顶,⽤指针top表⽰栈顶位置。
不允许插⼊与删除的另⼀端称为栈底,⽤指针bottom表⽰栈底。
栈按照“先进后出”(FILO)或“后进先出”(LIFO)组织数据,栈具有记忆作⽤。
栈的存储⽅式有顺序存储和链式存储。
栈的基本运算:
(1) ⼊栈运算,在栈顶位置插⼊元素;
(2) 退栈运算,删除元素(取出栈顶元素并赋给⼀个指定的变量);
(3) 读栈顶元素,将栈顶元素赋给⼀个指定的变量,此时指针⽆变化。
队列:指允许在⼀端(队尾)进⼊插⼊,⽽在另⼀端(队头)进⾏删除的线性表。
⽤rear指针指向队尾,⽤front指针指向队头元素的前⼀个位置。
队列是“先进先出”(FIFO)或“后进后出”(LILO)的线性表。
队列运算包括:
(1) ⼊队运算:从队尾插⼊⼀个元素;
(2) 退队运算:从队头删除⼀个元素。
队列的顺序存储结构⼀般采⽤队列循环的形式。
循环队列s=0表⽰队列空;s=1且front=rear表⽰队列满。
计算循环队列的元素个数:“尾指针减头指针”,若为负数,再加其容量即可。
六: 树与⼆叉树
树是⼀种简单的⾮线性结构,其所有元素之间具有明显的层次特性。
在树结构中,每⼀个结点只有⼀个前件,称为⽗结点。
没有前件的结点只有⼀个,称为树的根结点,简称树的根。
每⼀个结点可以有多个后件,称为该结点的⼦结点。没有后件的结点称为叶⼦结点。
在树结构中,⼀个结点所拥有的后件的个数称为该结点的度,所有结点中最⼤的度称为树的度。树的最⼤层次称为树的深度。⼆叉树的特点:
(1) ⾮空⼆叉树只有⼀个根结点;
(2) 每⼀个结点最多有两棵⼦树,且分别称为该结点的左⼦树与右⼦树。
满⼆叉树是指除最后⼀层外,每⼀层上的所有结点有两个⼦结点,则k层上有2k-1个结点深度为m的满⼆叉树有2m-1个结点。完全⼆叉树是指除最后⼀层外,每⼀层上的结点数均达到最⼤值,在最后⼀层上只缺少右边的若⼲结点。
⼆叉树基本性质:
(1)在⼆叉树的第k层上,最多有2k-1(k≥1)个结点;
(2)深度为m的⼆叉树最多有2m-1个结点;
(3)度为0的结点(即叶⼦结点)总是⽐度为2的结点多⼀个;
(4)具有n个结点的⼆叉树,其深度⾄少为[log2n]+1,其中[log2n]表⽰取log2n的整数部分
(5) 具有n个结点的完全⼆叉树的深度为[log2n]+1;
(6) 设完全⼆叉树共有n个结点。如果从根结点开始,按层序(每⼀层从左到右)⽤⾃然数1,2,…n给结点进⾏编号(k=1,2….n),有以下结论:
①若k=1,则该结点为根结点,它没有⽗结点;若k>1,则该结点的⽗结点编号为INT(k/2);
②若2k≤n,则k结点的左⼦结点编号为2k;否则该结点⽆左⼦结点(也⽆右⼦结点);
③若2k+1≤n,则编号为k的结点的右⼦结点编号为2k+1;否则该结点⽆右⼦结点。
补充:增加度为1的结点不会影响⼆叉树的叶⼦结点数,每增加⼀个度为2的结点便会增加⼀个叶⼦结点,没有度为2的结点时叶⼦结点数为1。
已知完全⼆叉树有x个结点,求其叶⼦结点数:
① 确定层数为k;
② ②第k层的结点数y=x-(2 k-1-1);
③ 第k-1层的叶⼦结点数n=2 (k-1)-1-y/2<;若y/2有余,则要加1>;
④ ④最后y+n。
⼆叉树存储结构采⽤链式存储结构,对于满⼆叉树与完全⼆叉树可以按层序进⾏顺序存储。⼆叉树的遍历:
(1)前序遍历(DLR),⾸先访问根结点,然后遍历左⼦树,最后遍历右⼦树;(树根在第⼀,下⾛不跳结点)
(2)中序遍历(LDR),⾸先遍历左⼦树,然后访问根结点,最后遍历右⼦树;(有左先左,再寻根,后右。最左边的结点最先遍历,最右边的结点最后遍历)
(3)后序遍历(LRD)⾸先遍历左⼦树,然后访问遍历右⼦树,最后访问根结点。(有左先左,再右,后寻根,到最右⼀路上⾏,树根在最后)
⼩结:
逻辑结构可分为线性表和⾮线性表。
线性表包括栈、队列,其存储⽅式为顺序存储、链式存储均可。链式型有:线性链表,带链的栈,
带链的队列,循环链表等。
⾮线性表包括树(⼆叉树),其存储⽅式为链式存储。
七: 查技术
只能使⽤顺序查的两种情况:
(1)线性表为⽆序表,不管是顺序存储还是链式存储;
(2)表采⽤链式存储结构,即使是有序线性表。
⼆分法查只适⽤于顺序存储的有序表,对于长度为n的有序线性表,最坏情况只需⽐较log2n次,⽽顺序查需要⽐较n次。⼋: 排序技术
排序是指将⼀个⽆序序列整理成按值⾮递减顺序排列的有序序列。
交换类排序法:
(1)冒泡排序法,需要⽐较的次数为n(n-1)/2;
(2 ) 快速排序法。
插⼊类排序法:
(1)简单插⼊排序法,最坏情况需要n(n-1)/2次⽐较;
(2) 希尔排序法,最坏情况需要O(n1.5)次⽐较。
选择类排序法:
(1)简单选择排序法, 最坏情况需要n(n-1)/2次⽐较;
(2) 堆排序法,最坏情况需要O(nlog2n)次⽐较。相⽐以上⼏种(除希尔排序法外),堆排序法的时间复杂度最⼩。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论