您好,欢迎访问三七文档
02331数据结构第一章概论1.数据是信息的载体。2.数据元素是数据的基本单位。3.一个数据元素可以由若干个数据项组成。4.数据结构指的是数据之间的相互关系,即数据的组织形式。5.数据结构一般包括以下三方面内容:数据的逻辑结构、数据的存储结构、数据的运算①数据元素之间的逻辑关系,也称数据的逻辑结构,数据的逻辑结构是从逻辑关系上描述数据,与数据的存储无关,是独立于计算机的。②数据元素及其关系在计算机存储器内的表示,称为数据的存储结构。数据的存储结构是逻辑结构用计算机语言的实现,它依赖于计算机语言。③数据的运算,即对数据施加的操作。最常用的检索、插入、删除、更新、排序等。6.数据的逻辑结构分类:线性结构和非线性结构①线性结构:若结构是非空集,则有且仅有一个开始结点和一个终端结点,并且所有结点都最多只有一个直接前趋和一个直接后继。线性表是一个典型的线性结构。栈、队列、串等都是线性结构。②非线性结构:一个结点可能有多个直接前趋和直接后继。数组、广义表、树和图等数据结构都是非线性结构。7.数据的四种基本存储方法:顺序存储方法、链接存储方法、索引存储方法、散列存储方法(1)顺序存储方法:该方法把逻辑上相邻的结点存储在物理位置上相邻的存储单元里,结点间的逻辑关系由存储单元的邻接关系来体现。通常借助程序语言的数组描述。(2)链接存储方法:该方法不要求逻辑上相邻的结点在物理位置上亦相邻,结点间的逻辑关系由附加的指针字段表示。通常借助于程序语言的指针类型描述。(3)索引存储方法:该方法通常在储存结点信息的同时,还建立附加的索引表。索引表由若干索引项组成。若每个结点在索引表中都有一个索引项,则该索引表称之为稠密索引,稠密索引中索引项的地址指示结点所在的存储位置。若一组结点在索引表中只对应一个索引项,则该索引表称为稀疏索引稀疏索引中索引项的地址指示一组结点的起始存储位置。索引项的一般形式是:(关键字、地址)关键字是能唯一标识一个结点的那些数据项。(4)散列存储方法:该方法的基本思想是:根据结点的关键字直接计算出该结点的存储地址。8.抽象数据类型(ADT):是指抽象数据的组织和与之相关的操作。可以看作是数据的逻辑结构及其在逻辑结构上定义的操作。抽象数据类型可以看作是描述问题的模型,它独立于具体实现。它的优点是将数据和操作封装在一起,使得用户程序只能通过在ADT里定义的某些操作来访问其中的数据,从而实现了信息隐藏。9.算法+数据结构=程序数据结构:是指数据的逻辑结构和存储结构算法:是对数据运算的描述10.数据的运算通过算法描述的。算法是任意一个良定义的计算过程。它以一个或多个值作为输入,并产生一个或多个值作为输出。若一个算法对于每个输入实例均能终止并给出正确的结果,则称该算法是正确的。正确的算法解决了给定的计算问题。11.选用的算法首先应该是正确的。此外,主要考虑如下三点:①执行算法所耗费的时间;②执行算法所耗费的存储空间,其中主要考虑辅助存储空间;③算法应易于理解,易于编码,易于调试等等。12.一个算法所耗费的时间=算法中每条语句的执行时间之和,每条语句的执行时间=语句的执行次数(即频度(FrequencyCount))×语句执行一次所需时间。13.算法求解问题的输入量称为问题的规模(Size),一般用一个整数表示。14.一个算法的时间复杂度T(n)是该算法的时间耗费,是该算法所求解问题规模n的函数。当问题的规模n趋向无穷大时,时间复杂度T(n)的数量级(阶)称为算法的渐进时间复杂度。平均时间复杂度是指所有可能的输入实例均以等概率出现的情况下,算法的期望运行时间。15.常见的时间复杂度按数量级递增排列依次为:常数0(1)、对数阶0(log2n)、线形阶0(n)、线形对数阶0(nlog2n)、平方阶0(n2)立方阶0(n3)、…、k次方阶0(nk)、指数阶0(2n)。16.一个算法的空间复杂度S(n)定义为该算法所耗费的存储空间,它也是问题规模n的函数。第二章线性表1.线性表(LinearList)是由n(n≥0)个数据元素(结点)a1,a2,…,an组成的有限序列。2.线性表的逻辑结构特征,对于非空的线性表:①有且仅有一个开始结点a1,没有直接前趋,有且仅有一个直接后继a2;②有且仅有一个终结结点an,没有直接后继,有且仅有一个直接前趋an-1;③其余的内部结点ai(2≤i≤n-1)都有且仅有一个直接前趋ai-1和一个ai+1。3.常见的线性表的基本运算:(1)InitList(L)构造一个空的线性表L,即表的初始化。(2)ListLength(L)求线性表L中的结点个数,即求表长。(3)GetNode(L,i)取线性表L中的第i个结点,这里要求1≤i≤ListLength(L)(4)LocateNode(L,x)在L中查找值为x的结点,并返回该结点在L中的位置。若L中有多个结点的值和x相同,则返回首次找到的结点位置;若L中没有结点的值为x,则返回一个特殊值表示查找失败。(5)InsertList(L,x,i)在线性表L的第i个位置上插入一个值为x的新结点,使得原编号为i,i+1,…,n的结点变为编号为i+1,i+2,…,n+1的结点。这里1≤i≤n+1,而n是原表L的长度。插入后,表L的长度加1。(6)DeleteList(L,i)删除线性表L的第i个结点,使得原编号为i+1,i+2,…,n的结点变成编号为i,i+1,…,n-1的结点。这里1≤i≤n,而n是原表L的长度。删除后表L的长度减1。4.顺序存储方法:把线性表的结点按逻辑次序依次存放在一组地址连续的存储单元里的方法。顺序表(SequentialList):用顺序存储方法存储的线性表简称为顺序表。顺序表是一种随机存取结构,顺序表的的特点是逻辑上相邻的结点其物理位置亦相邻。5.顺序表中结点ai的存储地址:LOC(ai)=LOC(a1)+(i-1)*c1≤i≤n,6.顺序表上实现的基本运算:(1)插入:在顺序表中,结点的物理顺序必须和结点的逻辑顺序保持一致,因此必须将表中位置为n,n-1,…,i上的结点,依次后移到位置n+1,n,…,i+1上,空出第i个位置,然后在该位置上插入新结点x。仅当插入位置i=n+1时,才无须移动结点,直接将x插入表的末尾。具体算法:voidInsertList(SeqList*L,DataTypex,inti)//将新结点x插入L所指的顺序表的第i个结点ai的位置上算法的时间主要花费在for循环中的结点后移语句上。该语句的执行次数是n-i+1,在表中第i个位置插入一个结点的移动次数为n-i+1,当i=n+1:移动结点次数为0,即算法在最好时间复杂度是O(1),当i=1:移动结点次数为n,即算法在最坏情况下时间复杂度是O(n)即在顺序表上进行插入运算,平均要移动一半结点(n/2)。(2)删除:在顺序表上实现删除运算必须移动结点,才能反映出结点间的逻辑关系的变化。若i=n,则只要简单地删除终端结点,无须移动结点;若1≤i≤n-1,则必须将表中位置i+1,i+2,…,n的结点,依次前移到位置i,i+1,…,n-1上,以填补删除操作造成的空缺。具体算法:voidDeleteList(SeqList*L,inti)//从L所指的顺序表中删除第i个结点ai结点的移动次数由表长n和位置i决定:i=n时,结点的移动次数为0,即为0(1),i=1时,结点的移动次数为n-1,算法时间复杂度分别是O(n)顺序表上做删除运算,平均要移动表中约一半的结点(n-1)/2,平均时间复杂度也是O(n)。7.链接方式存储的线性表简称为链表(LinkedList)。链表的具体存储表示为:用一组任意的存储单元来存放线性表的结点,链表中结点的逻辑次序和物理次序不一定相同(这组存储单元既可以是连续的,也可以是不连续的)。为了能正确表示结点间的逻辑关系,在存储每个结点值的同时,还必须存储指示其后继结点的地址(或位置)信息(称为指针(pointer)或链(link))。8.链表的结点结构:data域--存放结点值的数据域,next域--存放结点的直接后继的地址(位置)的指针域(链域)单链表中每个结点的存储地址是存放在其前趋结点next域中,而开始结点无前趋,故应设头指针head指向开始结点。终端结点无后继,故终端结点的指针域为空,即NULL。9.①生成结点变量的标准函数p=(ListNode*)malloc(sizeof(ListNode));//函数malloc分配一个类型为ListNode的结点变量的空间,并将其首地址放入指针变量p中②释放结点变量空间的标准函数free(p);//释放p所指的结点变量空间③结点分量的访问方法二:p-﹥data和p-﹥next④指针变量p和结点变量*p的关系:指针变量p的值——结点地址,结点变量*p的值——结点内容10.建立单链表:(1)头插法建表:从一个空表开始,重复读入数据,生成新结点,将读入数据存放在新结点的数据域中,然后将新结点插入到当前链表的表头上,直到读入结束标志为止。算法:s=(ListNode*)malloc(sizeof(ListNode));①//生成新结点s-data=ch;②//将读入的数据放入新结点的数据域中s-next=head;③head=s;④(2)尾插法建表:从一个空表开始,重复读入数据,生成新结点,将读入数据存放在新结点的数据域中,然后将新结点插入到当前链表的表尾上,直到读入结束标志为止。算法:s=(ListNode*)malloc(sizeof(ListNode));①//生成新结点s-data=ch;②//将读入的数据放入新结点的数据域中if(head!=NULL)head=s;//新结点插入空表elser-next=s;③//将新结点插到*r之后r=s;④//尾指针指向新表尾(3)尾插法建带头结点的单链表:头结点及作用:头结点是在链表的开始结点之前附加一个结点。它具有两个优点:⒈由于开始结点的位置被存放在头结点的指针域中,所以在链表的第一个位置上的操作就和在表的其它位置上操作一致,无须进行特殊处理;⒉无论链表是否为空,其头指针都是指向头结点的非空指针(空表中头结点的指针域空),因此空表和非空表的处理也就统一了。头结点数据域的阴影表示该部分不存储信息。在有的应用中可用于存放表长等附加信息。具体算法:r=head;//尾指针初值也指向头结点while((ch=getchar())!='\n'){s=(ListNode*)malloc(sizeof(ListNode));//生成新结点s-data=ch;//将读入的数据放入新结点的数据域中r-next=s;r=s;}r-next=NULL;//终端结点的指针域置空,或空表的头结点指针域置空以上三个算法的时间复杂度均为O(n)。11.单链表上的查找:(1)链表不是随机存取结构在链表中,即使知道被访问结点的序号i,也不能像顺序表中那样直接按序号i访问结点,而只能从链表的头指针出发,顺链域next逐个结点往下搜索,直至搜索到第i个结点为止。因此,链表不是随机存取结构。(2)查找的思想方法计数器j置为0后,扫描指针p指针从链表的头结点开始顺着链扫描。当p扫描下一个结点时,计数器j相应地加1。当j=i时,指针p所指的结点就是要找的第i个结点。而当p指针指为null且j≠i时,则表示找不到第i个结点。头结点可看做是第0个结点。算法:p=head;j=0;//从头结点开始扫描while(p-next&&ji){//顺指针向后扫描,直到p-next为NULL或i=j为止p=p-next;j++;}if(i==j)returnp;//找到了第i个结点elsereturnNULL;//当i0或i0时,找不到第i个结点时间复杂度:在等概率假设下,平均时间复杂度为:为n/2=O(n)(2)按值查找:具体算法:ListNode*p=head-next;//从开始结点比较。表非空,p初始值指向开始结点while(p&&p-data!=key)//直到p为NULL或p-da
本文标题:02331数据结构
链接地址:https://www.777doc.com/doc-3049066 .html