【考纲内容】
(一)线性表的定义和基本操作
(二)线性表的实现
顺序存储;链式存储;线性表的应用
线性表是具有相同数据类型的n(n>=0)个数据元素的有限序列,其中n为表长,当n=0时,线性表是一个空表。若用L命名线性表,则其一般表示为
L=(a1 , a2,a3,……,ai,ai+1,……,an,)
a1是唯一的“第一个”元素,又称表头元素;an是唯一的“最后一个元素”,又称表尾元素。 除第一个元素外,每个元素有且仅有一个直接前驱。除最后一个元素外,每个元素有且只有一个直接后继。以上就是线性表的逻辑特性,这种线性有序的逻辑结构正式线性表的名字由来。
线性表的特点如下:
(1)表中元素个数有限。
(2)表中元素具有逻辑上的顺序性,表中元素有其先后次序。
(3)表中元素都是数据元素,每个元素都是单个元素。
(4)表中元素的数据类型都相同,这意味着每个元素占有相同大小的存储空间。
(5)表中元素具有抽象性,即仅讨论元素间的逻辑关系,而不考虑元素究竟表示什么内容。
注: 线性表是一种逻辑结构,表示元素之间一对一的相邻关系。顺序表和链表是指存储结构,两者属于不同层面的概念。
一个数据结构的基本操作是指最核心、最基本的操作。其他较复杂的操作可以通过调用其基本操作来实现。线性表的主要操作如下:
线性表的顺序存储又称为顺序表。
它是用一组地址连续的存储单元依次存储线性表中的数据元素,从而使逻辑上相邻的两个元素在物理位置上也相邻。
第一个元素存储在线性表的起始位置,第i个元素的存储位置后面紧接着存储的是第i+1个元素,称i为元素ai在线性表中的位序。因此,顺序表的特点是表中元素的逻辑顺序与其物理顺序相同。
假设线性表L存储的起始位置为LOC(A),sizeof(ElemType)是每个数据元素所占用存储空间的大小,则表L所对应的顺序存储如图所示。
注: 线性表中元素的位序是从1开始的,而数组中元素的下标是从0开始的。
#define InitSize 100
typedef struct{
ElemType data[MaxSize];
int length;
}SqList;
一维数组可以是静态分配的,也可以是动态分配的。在静态分配时,由于数组的大小和空间事先已经固定,一旦空间占满,再加入新的数据将会产生溢出,进而导致程序崩溃。
在动态分配时,存储数组的空间是在程序执行过程中通过动态存储分配语句分配的,一旦数据空间占满,就另外开辟一块更大的存储空间,用以替换原来的存储空间,从而达到扩充存储数组空间的目的,而不需要为线性表一次性地划分所有空间。
#define InitSize 100
typedef struct{
Elemtype *data;
int MaxSize,length;
}SqList;
c的初始动态分配语句为
L.data=(ElemType*)malloc(sizeof(ElemType)*InitSize)
c++的初始动态分配语句为
L.data=new ElemType[InitSize];
动态分配不是链式存储,它同样属于顺序存储结构,物理结构没有变化,依然是随机存取方式,只是分配的空间大小可以在运行时决定。
顺序表最主要的特点是随机访问,即通过首地址和元素序号可在时间O(1)内找到指定的元素。
顺序表的存储密度高,每个结点只存储数据元素。
顺序表逻辑上相邻的元素物理上也相邻,所以插入和删除操作需要移动大量元素。
最好情况: 在表尾插入(即i=n+1),元素后移语句不执行,时间复杂度为O(1)。
最坏情况: 在表头插入(即i=1),元素后移语句将执行n次,时间复杂度为O(n)。
平均情况: 假设pi (pi=1/(n+1))是在第i个位置上插入一个结点的概率,则在长度为n的线性表中插入一个结点时,所需移动结点的概率为:
bool ListDelete (SqList &L,int i,ElemType &e){
if(i<=1||i>L.length)
return false;
e=L.data[i-1];
for (int j=i;j<L.length;j++)
L.data[j-1]=L.data[j];
L.length--;
return true;
}
最好情况: 删除表尾元素(即i=n),无需移动元素,时间复杂度为O(1)。
最坏情况: 删除表头元素(即i=1),需移动除第一个元素外的所有元素,时间复杂度为O(n)。
**平均情况:**假设pi(pi=1/n)是删除第i个位置上结点的概率,则在长度为n的线性表中删除一个结点时,所需移动结点的平均次数为:
因此,线性表删除算法的平均时间复杂度为O(n)。
下图为一个顺序表在进行插入和删除操作前、后的状态,记忆其数据元素在存储空间中的位置变化和表长的变化。
3. 按值查找(顺序查找)
在顺序表L中查找第一个元素值等于e的元素,并返回其位序。
int LocalElem(SqList L,ElemType e){
int i;
for(i=0;i<L.length;i++)
if(L.data[i]==e)
return i+1;
return 0;
}
最好情况: 查找的元素就在表头,仅需要比较一次,时间复杂度为O(1)。
最坏情况: 查找的元素在表尾(或不存在时),需要比较n次,时间复杂度为O(n)。
**平均情况:**假设pi(pi=1/n)是查找第i个位置上结点的概率,则在长度为n的线性表中查找值为e的元素所需要比较的平均次数为:
顺序表可以随时存取表中的任意一个元素,它的存储位置可以用一个简单直观的公式表示,但插入和删除的操作需要移动大量元素。
链式存储线性表时,不需要使用地址连续的存储单元,即不要求逻辑上相邻的元素在物理位置上也相邻,它通过“链”建立起数据元素之间的逻辑关系,因此插入和删除操作不需要移动元素,而只需要修改指针,但也会失去顺序表可随机存取的优点。
线性表的链式存储又称单链表,它是指通过一组任意的存储单元来存储线性表中的数据元素。
为了建立数据元素之间的线性关系,对每个链表结点,除存放元素自身的信息外,还需要存放一个指向其后继的指针。
单链表的结构如图所示:
其中data为数据域,存放数据元素;next为指针域,存放其后继结点的地址。
单链表中结点类型的描述如下:
typedef struct LNode{
ElemType data;
struct LNode *next;
}LNode,*LinkList;
利用单链表可以解决顺序表需要大量连续存储单元的缺点,但单链表附加指针域,也存在浪费存储空间的缺点。
由于单链表的元素离散的分布在存储空间中,所以单链表是非随机存取的存储结构,即不能直接找到表中某个特定的结点。查找某个特定的结点时,需要从表头开始遍历,依次查找。
通常用头指针 来标识一个单链表,如单链表L,头指针为NULL时,表示一个空表。
为了操作上的方便,在单链表第一个结点之前附加一个结点,称为头结点,头结点的数据域可以不设任何信息,也可以记录表长等信息。头结点的指针域指向线性表的第一个元素结点,如图所示:
头结点和头指针的区别:不管带不带头结点,头指针始终指向链表的第一个结点,而头结点是带头结点的链表中的第一个结点,结点内通常不存储信息。
引入结点后带来的优点:
(1)由于第一个数据结点的位置被存放在头结点的指针域中,所以在链表的第一个位置上的操作和在表的其他位置上操作一致,无需进行特殊处理。
(2)无论链表是否为空,其头指针都指向结点的非空指针(空表中头结点的指针域为空),因此空表和非空表的处理也就得到了统一。
LinkList List_HeadInsert(LinkList &L){
LNode *s; int x;
L=(LinkList)malloc(sizeof(LNode));
L->next =NULL;
scanf("%d",&x);
while(x!=9999){
s=(LNode*)malloc(sizeof(LNode));
s->data=x;
s->next=L->next;
L->next=x;
scanf("%d",&x);
}
return L;
}
采用头插法建立单链表时,读入数据的顺序与生成的链表中的元素的顺序是相反的。每个结点插入的时间为O(1),设单链表长为n,则总时间复杂度为O(n)。
如果没有设立头结点,需要修改哪些地方?
因为在头部插入新结点,每次插入新结点后,需要将它的地址赋给头指针L。
该方法将新结点插入法到当前链表的尾表,为此必须增加一个尾指针r,使其始终指向当前链表的尾结点,如图所示:
尾插法建立单链表的算法如下:
LinkList List_TailInsert(LinkLiist &L){
int x;
L=(LinkList)malloc(sizeof(LNode)); //是由系统生产一个LNode型的结点,同时在该结点的其实位置赋值给变量指针s。
LNode *s,*r=L;
scanf("%d",&x);
while(x!=9999){
s=(LNode*)malloc(sizeof(LNode));
s->data=x;
r->next=s;
r=s;
scanf("%d",&x);
}
r->next=NULL;
return L;
}
因为附设了一个指向表尾结点的指针,故时间复杂度和头插法的相同为O(n)。
LNode *GetElem(LinkList L,int i){
int j=1;
LNode *p=L->next;
if(i==0)
return L;
if(i<1)
return NULL;
while(P&&j<i){
p=p->next;
j++;
}
return p;
}
按序号查找操作的时间复杂度为O(n)。
按值查找表结点的算法如下:
LNode *LocateElem(LinkList L,ElemType e){
LMode *p=L->next;
while(p!=NULL&&p->data!=e)
p=p->next;
return p;
}
按值查找操作的时间复杂度为O(n)。
算法首先调用按序号查找算法GetElem(L,i-1),查找第i-1个结点。
假设返回的第i-1个结点为*p,然后令新结点 *s的指针域指向 *p的后继结点,再令结点 *p的指针域指向新插入的结点 *s。
实现插入结点的代码片段如下:
① p=GetElem(L,i-1);
② s->next=p->next;
③ p->next=s;
算法中,语句②和 ③的顺序不能颠倒,否则,当限制性p->next=s后,指向其原后继的指针就不存在,再执行s->next=p->next时,相当于执行了s->next=s,显然是错误的。
本算法主要的时间开销在于查找第i-1个元素,时间复杂度为O(n),若在给定的结点后面插入新结点,则时间复杂度仅为O(1)。
扩展:对某一结点进行前插操作。
前插操作是指在某结点的前面插入一个新结点,后插操作的定义刚好与之相反。在单链表插入算法中,通常都采用后插操作。
以上面的算法为例,首先调用函数GetElem()找到第i-1个结点,即插入结点的前驱结点后,再对其执行后插操作。
由此可知,对结点的前插操作均可转化为后插操作,前提是从单链表的头结点开始顺序查找到其前驱结点,时间复杂度为O(n)。
还可以采用另一方式将其转化为后插操作来实现,设待插入结点为 *s,将 *s插入到 *p的前面。仍然可以将 *s插入到 *p的后面,然后将p->data 与s->data交换,这样既满足了逻辑关系,又能使时间复杂度为O(1)。
算法的代码片段如下:
//将*s结点插入到*p之前的主要代码片段
s->next=p->next; //修改指针域,不能颠倒
p->next=s;
temp=p->data; //交换数据域部分
p->data=s->data;
s->data=temp;
实现删除结点的代码片段如下:
p=GetElem(L,i-1);
q=p->next;
p->next=q->next;
free(q);
和插入算法一样,该算法的主要时间也耗费在查找操作上,时间复杂度为O(n)。
扩展:删除节点*p
要删除某个给定结点*p,通常的做法是先从链表的头结点开始顺序找到其前驱结点,然后再执行删除操作,算法的时间复杂度为O(n)。
删除结点 p的操作可用删除p 的后继结点操作来实现,实质就是将其后继结点的值赋予其自身,然后删除后继结点,也能使得时间复杂度为O(1)。
实现上述操作代码片段如下:
q=p->next;
p->data=p->next->data;
p->next=q->next;
free(q); //有系统回收一个LNode型的结点,回收的空间可供再次生结点时用。
因为单链表的长度是不包括头结点的,因此不带头结点和带头结点的单链表在求表长操作上会略有不同。对不带头结点的单链表,当表为空时,要单独处理。
单链表结点中只有一个指向其后继的指针,使得单链表只能从头结点依次顺序地向后遍历。要访问某个结点的前驱结点(插入、删除操作时),只能从头开始遍历,访问后继结点的时间复杂度为O(1),访问前驱结点的时间复杂度为O(n)。
为了克服单链表的缺点,引入双链表,双链表结点中有两个指针prior和next,分别指向其前驱结点和后继结点,如图所示
双链表结点类型描述如下:
typedef struct DNode{
ElemType data;
struct DNode *prior,*next;
}DNode,*DLinkList;
双链表在单链表的结点中增加了一个指向其前驱的prior指针,因此,双链表中的按值查找和按位查找的操作与单链表的相同。
但双链表在插入和删除的操作的实现上,与单链表由着较大的不同,这是因为“链”变化时也需要对prior指针做出修改,其关键是保证在修改的过程中不断链。此外,双链表可以很方便的找到其前驱结点,因此,插入、删除操作的时间复杂度为O(1)。
插入操作的代码片段如下:
①s->next=p->next;
②p->next->prior=s;
③s->prior=p;
④p->next=s;
上述代码的顺序不是唯一的,也不是任意的,①和②两步必须在④步之前,否则*p的后继结点的指针就会丢掉,导致插入失败。
p->next=q->next;
q->next->prior=p;
free(q);
在建立双链表的操作中,也可以采用如同单链表的头插法和尾插法,但在操作上需要注意指针的变化和单链表有所不同。
在循环单链表中,表尾结点*r的next域指向L,故表中没有指针域为NULL的结点,因此,循环单链表的判空条件不是头结点的指针是否为空,而是它是否等于头指针。
循环单链表的插入、删除算法与单链表的几乎一样,所不同的是若操作在表尾进行,则执行的操作不同,以让单链表继续保持循环的性质。当然,正式因为循环单链表是一个环,因此,在任何一个位置上插入和删除的操作都是等价的,无需判断是否是表尾。
在单链表中只能从表头结点开始往后顺序遍历整个链表,而循环单链表可以从表中的任意一个结点开始遍历整个链表。
有时对单链表常做的操作是在表头和表尾进行的,此时对循环单链表不设头指针仅设尾指针,从而使操作效率更高。原因是,若设的是头指针,对表尾进行操作需要O(n)的时间复杂度,而若设的是尾指针r,r->next,即为头指针,对于表头与表尾进行操作都只需要O(1)的时间复杂度。
静态链表借助数组来描述线性表的链式存储结构,结点也有数据域data和指针域next,与前面说的链表中的指针不同的是,这里的指针是结点的相对地址(数组下标),又称游标。和顺序表一样,静态链表也要预先分配一块连续的内存空间。
静态链表和单链表的对应关系如图所示:
静态链表结构类型描述:
#define MaxSize 50
typedef struct{
ElemType data;
int next;
}SlinkList[MaxSize];
静态链表以next==1作为其结束的标志。静态链表的插入、删除操作与动态链表的相同,只需要修改指针,而不需要移动元素。
总体来说,静态链表没有单链表使用起来方便,但在一些不支持指针的高级语言(如Basic)中,是一种非常巧妙的设计方法。
存取(读写)方式
顺序表可以顺序存取,也可以随机存取,链表只能从表头顺序存取元素。例如在第i个位置上执行或存取的操作,顺序表仅需一次访问,而链表则需从表头开始依次访问i次。
逻辑结构与物理结构
采用顺序存储时,逻辑上相邻的元素,对应的物理存储位置也相邻。而采用链式存储时,逻辑上相邻的元素,物理位置则不一定相邻,对应的逻辑关系是通过指针链接来表示的。
查找和删除操作
对于按值查找,顺序表无序时,两者的时间复杂度均为O(n);顺续表有序时,可采用折半查找,此时的时间复杂度为O(log2n)。
对于按序号查找,顺序表支持随机访问,时间复杂度仅为O(1),而链表的平均时间复杂度为O(n)。顺序表的插入、删除操作,平津需要移动半个表长的元素。链表的插入、删除操作,只需修改相关结点的指针域即可。由于链表的而每个结点都带有指针域,故而存储密度不够大。
空间分配
顺序存储在静态存储分配情形下,一旦存储空间装满就不能扩充,若再加入新元素,则会出现内存溢出,因此需要预先分配足够大的存储空间。预先分配过大,可能会导致顺序表后部大量元素闲置;预先分配过小,又会造成溢出。
动态存储分配虽然存储空间可以扩充,但需要移动大量元素,导致操作效率降低,而且若内存中没有更大块的连续存储空间,则会导致分配失败。
链式存储的结点空间只在需要时申请分配,只要内存中有空间就可以分配,操作灵活、高效。
基于存储的考虑
难以估计线性表的长度或存储规模时,不宜采用顺序表,链表不用事先估计存储规模,但链表的存储密度较低,显然链式存储结构的存储密度是小于1的。
基于运算的考虑
在顺序表中按序号访问ai的时间复杂度为O(1),而链表中按序号访问的时间复杂度为O(n),因此,若经常做的运算时按序号访问数据元素,则显然顺序表优于链表。
在顺序表中进行插入、删除操作时,平均移动表中一般的元素,当数据元素的信息量较大且表较长时,这一点是不应忽视的;在链表中进行插入、删除操作时,虽然也要找插入位置,但操作主要是比较操作,从这个角度考虑显然后者优于前者。
基于环境的考虑
顺序表容易实现,任何高级语言中都有数组类型;链表的操作是基于指针的,相对来说,前者实现较为简单。
总之,两种存储结构各有长短,选择哪一种由实际问题的主要因素决定。通常较稳定的线性表选择顺序存储,而频繁进行插入、删除操作的线性表(即动态性较强)宜选择链式存储。