线性表(List)是零个或多个数据元素的有限序列, 每个数据元素的数据类型相同。线性表是依据数据的逻辑结构定义的,即数据在逻辑结构上是线性的。
线性表满足:(1) 存在唯一的一个被称作“第一个”的数据元素,(2) 存在唯一的一个被称作“最后一个”的数据元素,(3) 除第一个外,集合中的每个数据元素均只有一个前继元素,(4)除最后一个外,集合中的每个数据元素均只有一个后继元素。
可将线性表记为( a 1 a_1 a1, …, a i − 1 a_{i-1} ai−1, a i a_i ai, a i + 1 a_{i+1} ai+1,…, a n a_n an)。当i=1,2,3,…n-1时, a i a_i ai有且仅有一个直接后继元素, 当i=2,3,…,时,有且仅有一个直接前继元素。线性表元素个数n( n ≥ 0 n\geq0 n≥0)为线性表的长度,当n=0时,线性表为空表。
线性表的顺序存储结构是线性表的两种物理结构中的一种,指的是用一段地址连续的存储单元依次存储线性表中的数据元素。线性表的顺序存储示意图如下:
我们一般用数组来实现顺序存储结构,即把第一个数据元素存到数组下标为0的位置,接着把线性表相邻的元素存储在数组中相邻的位置。
注意区分数组长度和线性表长度,数组长度是存放线性表的存储空间的长度,存储分配后这个量一般是不变的(也有例外如动态分配数组,这个这里没深入讲),而线性表的长度是线性表中数据元素的个数,插入和删除等操作会使线性表长度不断变化。在任意时刻,线性表长度应该小于等于数组长度。
线性表的第i个元素存储在数组汇总下标为i-1的位置。对于线性表而言,已知第一个数据元素地址,所有其他数据元素地址都可直接计算得到,假设每个元素占据c个存储单元,用LOC表示存储位置,那么LOC( a i a_i ai) = LOC( a 1 a_1 a1)+c*(i-1)。由此我们发现存入或取出任一数据的时间相同,都为O(1),具有这一特点的存储结构又称为随机存取结构。
在线性表中的第i个位置插入元素e,算法思路如下:
删除线性表中第i个位置的元素,算法思路如下:
插入和删除操作的时间复杂度?
首先最好的情况是要插入或删除的元素位于最后一位,那么不需要移动其他元素,时间复杂度为O(1), 最坏的情况是位于第一位,那么时间复杂度为O(n)。对于一个长度为n的线性表来说,操作第i个元素需要移动的元素个数为n-i,对其求期望,E(n-i)=n-E(i)=n-n(n+1)/2=(n-1)/2,因此平均时间复杂度为O(n)。
优点:1. 快速存取 2.无须为表示元素的逻辑关系占用额外空间
缺点:1. 插入和删除较慢 2. 当线性表长度变化较大时,难以确定存储空间大小 3. 存储空间碎片化(我理解的是可能会有较多空的存储单元)
单链表是由n个结点(Node)链结成的一个链表,一个结点由存储数据元素信息的数据域和存储后继元素位置的指针域构成。由于每个结点只包含一个指针域,因此称为单链表。单链表是通过每个结点的指针域将线性表的数据元素按逻辑次序链接在一起,见下图。
为了方便对单链表进行操作,一般在单链表第一个结点前设一个头结点,头结点的数据域可以不存储任何信息,而指针域存储的指针则指向第一个结点。头结点不一定是链表必要元素,而头指针一定。链表中最后一个结点的指针域为空。若线性表为空,则头结点指针域为空。
获得链表第i个数据的算法思路:
可以得出,上述操作的最好时间复杂度为O(1),最坏时间复杂度为O(n),具体取决于i的值。
插入第i个数据结点的算法思路:
删除第i个数据结点的算法思路:
显然,插入和删除的时间复杂度都为O(n),但是如果我们想从第i个位置起插入10个元素,那么顺序存储每一次插入都要移动n-i个元素,而单链表在找到第i个位置的指针后(O(n)),只需要赋值和移动指针,时间复杂度为O(1)。
整表创建即从“空表”的初始状态起,依次建立各元素结点,并逐个插入链表。
头插法(始终让新结点插入第一个位置)算法思路如下:
静态链表是针对一些编程语言没有指针的情况,我们可以用数组来代替指针描述单链表。数组元素由两个数据域组成,data和cur。data用来存放数据元素,而游标cur相当于指针,存放该元素后继在数组中的下标。我们通常将数组建立得大一些,以便于插入时不溢出。
数组中未被使用的元素组成备用链表。数组的第一个元素,即下标为0的元素的cur,用来存放备用链表第一个结点的下标,而最后一个元素的cur存放第一个有值元素的下标,相当于单链表中的头结点,当整个链表为空时,则为 0 2 0^2 02。
将单链表中终端结点的指针由空改为指向头结点,使整个单链表形成一个环,这种头尾相接的单链表称为循环链表。循环链表使从中间任一结点出发访问全部结点成为可能。
如果我们想要用O(1)的时间访问最后一个结点?将头指针改为尾指针。
双向链表(double linked list)是在单链表的每个结点中,再设置一个指向其前驱结点的指针域。所以双链表每个结点都有两个指针域,一个指向直接后继,一个指向直接前继。