《大话数据结构》学习笔记--线性表

第三章 线性表

  • 什么是线性表
  • 线性表的顺序存储结构
    • 基本概念及特性
    • 顺序存储结构的存取操作
    • 顺序存储结构的插入和删除操作
    • 顺序存储结构的优缺点
  • 线性表的链式存储结构
    • 单链表
      • 基本概念及特性
      • 单链表的读取操作
      • 单链表的插入和删除操作
      • 单链表的整表创建和删除
    • 静态链表
    • 循环链表
    • 双链表
  • 总结

什么是线性表

线性表(List)是零个或多个数据元素的有限序列, 每个数据元素的数据类型相同。线性表是依据数据的逻辑结构定义的,即数据在逻辑结构上是线性的。

线性表满足:(1) 存在唯一的一个被称作“第一个”的数据元素,(2) 存在唯一的一个被称作“最后一个”的数据元素,(3) 除第一个外,集合中的每个数据元素均只有一个前继元素,(4)除最后一个外,集合中的每个数据元素均只有一个后继元素。

可将线性表记为( a 1 a_1 a1, …, a i − 1 a_{i-1} ai1, a i a_i ai, a i + 1 a_{i+1} ai+1,…, a n a_n an)。当i=1,2,3,…n-1时, a i a_i ai有且仅有一个直接后继元素, 当i=2,3,…,时,有且仅有一个直接前继元素。线性表元素个数n( n ≥ 0 n\geq0 n0)为线性表的长度,当n=0时,线性表为空表。

线性表的顺序存储结构

基本概念及特性

线性表的顺序存储结构是线性表的两种物理结构中的一种,指的是用一段地址连续的存储单元依次存储线性表中的数据元素。线性表的顺序存储示意图如下:
线性表的顺序存储示意图
我们一般用数组来实现顺序存储结构,即把第一个数据元素存到数组下标为0的位置,接着把线性表相邻的元素存储在数组中相邻的位置。

注意区分数组长度和线性表长度,数组长度是存放线性表的存储空间的长度,存储分配后这个量一般是不变的(也有例外如动态分配数组,这个这里没深入讲),而线性表的长度是线性表中数据元素的个数,插入和删除等操作会使线性表长度不断变化。在任意时刻,线性表长度应该小于等于数组长度。

《大话数据结构》学习笔记--线性表_第1张图片

顺序存储结构的存取操作

线性表的第i个元素存储在数组汇总下标为i-1的位置。对于线性表而言,已知第一个数据元素地址,所有其他数据元素地址都可直接计算得到,假设每个元素占据c个存储单元,用LOC表示存储位置,那么LOC( a i a_i ai) = LOC( a 1 a_1 a1)+c*(i-1)。由此我们发现存入或取出任一数据的时间相同,都为O(1),具有这一特点的存储结构又称为随机存取结构。

顺序存储结构的插入和删除操作

在线性表中的第i个位置插入元素e,算法思路如下:

  1. 插入位置不合理,raise error
  2. 线性表长度大于等于数组长度,raise error
  3. 从最后一个元素开始向前遍历到第i个位置,并将它们都分别向后移动一个位置
  4. 将e填入位置i
  5. 表长加1

删除线性表中第i个位置的元素,算法思路如下:

  1. 删除位置不合理, raise error
  2. 取出删除元素
  3. 从删除元素开始向后遍历,并分别往前移动一位
  4. 表长减1

插入和删除操作的时间复杂度?
首先最好的情况是要插入或删除的元素位于最后一位,那么不需要移动其他元素,时间复杂度为O(1), 最坏的情况是位于第一位,那么时间复杂度为O(n)。对于一个长度为n的线性表来说,操作第i个元素需要移动的元素个数为n-i,对其求期望,E(n-i)=n-E(i)=n-n(n+1)/2=(n-1)/2,因此平均时间复杂度为O(n)。

顺序存储结构的优缺点

优点:1. 快速存取 2.无须为表示元素的逻辑关系占用额外空间
缺点:1. 插入和删除较慢 2. 当线性表长度变化较大时,难以确定存储空间大小 3. 存储空间碎片化(我理解的是可能会有较多空的存储单元)

线性表的链式存储结构

单链表

基本概念及特性

单链表是由n个结点(Node)链结成的一个链表,一个结点由存储数据元素信息的数据域和存储后继元素位置的指针域构成。由于每个结点只包含一个指针域,因此称为单链表。单链表是通过每个结点的指针域将线性表的数据元素按逻辑次序链接在一起,见下图。
《大话数据结构》学习笔记--线性表_第2张图片
为了方便对单链表进行操作,一般在单链表第一个结点前设一个头结点,头结点的数据域可以不存储任何信息,而指针域存储的指针则指向第一个结点。头结点不一定是链表必要元素,而头指针一定。链表中最后一个结点的指针域为空。若线性表为空,则头结点指针域为空。
《大话数据结构》学习笔记--线性表_第3张图片
《大话数据结构》学习笔记--线性表_第4张图片

单链表的读取操作

获得链表第i个数据的算法思路:

  1. 声明一个结点p指向链表第一个结点,初始化j=1
  2. 当j
  3. 若到链表末尾p为空,则第i个元素不存在
  4. 否则返回结点p的数据

可以得出,上述操作的最好时间复杂度为O(1),最坏时间复杂度为O(n),具体取决于i的值。

单链表的插入和删除操作

插入第i个数据结点的算法思路:

  1. 声明一个结点p指向链表第一个结点,初始化j=1
  2. 当j
  3. 若到链表末尾p为空,则第i个元素不存在
  4. 否则查找i结点成功,系统中生成一个空结点s(C语言的malloc函数)
  5. 将数据元素e赋值给s->data
  6. 插入s,语句为 s->next = p->next,p->next=s

删除第i个数据结点的算法思路:

  1. 声明一个结点p指向链表第一个结点,初始化j=1
  2. 当j
  3. 若到链表末尾p为空,则第i个元素不存在
  4. 否则查找成功,将要删除的结点p->next赋值给q, q=p->next
  5. p->next = q->next
  6. 将q结点的数据赋值给e, e = q->data
  7. 释放q结点(free)

显然,插入和删除的时间复杂度都为O(n),但是如果我们想从第i个位置起插入10个元素,那么顺序存储每一次插入都要移动n-i个元素,而单链表在找到第i个位置的指针后(O(n)),只需要赋值和移动指针,时间复杂度为O(1)。

单链表的整表创建和删除

整表创建即从“空表”的初始状态起,依次建立各元素结点,并逐个插入链表。

头插法(始终让新结点插入第一个位置)算法思路如下:

  1. 声明一结点p和计数变量i
  2. 初始化一空链表L
  3. 让L的头结点指针指向NULL
  4. 循环:(1)生成一新结点赋值给p (2)随机生成一数字赋值给p的数据域p->data (3)将p插入到头结点与前一新结点前

《大话数据结构》学习笔记--线性表_第5张图片
尾插法(新结点始终插在最后)算法思路:

  1. 声明结点p,r和计数变量i
  2. 初始化一空链表L
  3. 定义r为指向尾部的结点
  4. 循环:(1)生成一新结点赋值给p (2)随机生成一数字赋值给p的数据域p->data (3)将r的指针指向p, r->next = p(4)将p赋值给r, r=p
  5. 结束循环后r->next=NULL,表示链表结束
    在这里插入图片描述
    整表删除的算法思路:
    1 声明一结点p和q
    2 将第一个结点赋值给p
    3 循环:(1)将下一结点赋值给q (2)释放p (3)将q赋值给p

静态链表

静态链表是针对一些编程语言没有指针的情况,我们可以用数组来代替指针描述单链表。数组元素由两个数据域组成,data和cur。data用来存放数据元素,而游标cur相当于指针,存放该元素后继在数组中的下标。我们通常将数组建立得大一些,以便于插入时不溢出。

数组中未被使用的元素组成备用链表。数组的第一个元素,即下标为0的元素的cur,用来存放备用链表第一个结点的下标,而最后一个元素的cur存放第一个有值元素的下标,相当于单链表中的头结点,当整个链表为空时,则为 0 2 0^2 02
《大话数据结构》学习笔记--线性表_第6张图片

循环链表

将单链表中终端结点的指针由空改为指向头结点,使整个单链表形成一个环,这种头尾相接的单链表称为循环链表。循环链表使从中间任一结点出发访问全部结点成为可能。
在这里插入图片描述
如果我们想要用O(1)的时间访问最后一个结点?将头指针改为尾指针。
在这里插入图片描述

双链表

双向链表(double linked list)是在单链表的每个结点中,再设置一个指向其前驱结点的指针域。所以双链表每个结点都有两个指针域,一个指向直接后继,一个指向直接前继。

《大话数据结构》学习笔记--线性表_第7张图片

总结

在这里插入图片描述
《大话数据结构》学习笔记--线性表_第8张图片

你可能感兴趣的:(数据结构,链表)