前言:本篇文章只是记录王争的数据结构与算法之美的学习笔记,写下来能强迫自己系统的再过一遍,加深理解。这门课
以实际开发中遇到的问题为例
,引入解决问题涉及到的的数据结构和算法,但不会讲的太细,最好结合一本实体书进行学习。
1. 链表
链表和数组都是非常基础的数据结构,通常也会放到一块来比较,通过和数组对比,我们来了解一下链表的概念。
链表和数组最根本的区别是底层的
存储结构
不同。
数组是需要一块连续的内存空间
来存储的,对内存的要求比较高。比如我们申请一个 100MB 大小的数组,当内存中没有连续的、足够大的存储空间时,及时内存剩余空间 > 100MB,仍然会申请失败。
链表则相反,它并不是连续的,而是通过指针
将一组零散的内存块
串了起来,所以在和上面相同的场景下,如果申请的是 100MB 大小的链表,则不会有任何问题。
两者的区别如下图所示:
2. 链表的分类
最常见的有三种:单链表、双向链表、循环链表。
2.1 单链表
上面有提到,链表通过指针将一组零散的内存块串联在一起。这些个零散的内存块,我们称为链表的结点
,那为了将这些结点串联起来,每个链表的结点除了存储数据之外,还需要记录下一个结点的地址,我们把这个记录下个结点地址的指针叫做后继指针
next,如下图所示:
在链表中,第一个结点称为头结点
,最后一个结点称为尾节点
。头结点用来记录链表的基地址
,有了头结点,就可以遍历整条链表。尾结点的 next 指针指向一个空地址 NULL,标明这是链表的最后一个结点。
2.1.1 链表的插入和删除
链表也支持数据的查找、插入和删除操作,和数组不同,在链表中插入或者删除一个数据,我们并不需要考虑内存的连续性,因为链表的存储空间本身就不是连续的,所以链表中的插入和删除都是比较快速的,如下图:
我们只需要考虑相邻结点的指针改变就行,时间复杂度为 O(1)。
2.1.2 链表的随机访问
相对于数组的插入和删除,链表的表现是比较高效的,但是对于随机访问第 k 个元素,就没有数组那么高效了。链表需要一个结点一个结点的区遍历,直到找到相应的节点。
链表就相当于是一个队伍,队伍的每个人只需要直到后面的人是谁就行了,所以我们想知道第 k 位的人时,就需要从第一个人开始,一个一个的往下数,所以时间复杂度为 O(n) 。
2.2 循环链表
顾名思义,循环链表就是一个循环的单链表,和单链表唯一的区别就是循环链表的尾结点的 next 指针指向了头结点,首尾相连了,如下图所示:
和单链表相比,循环链表的优点是从链表尾到链表头很方便,当要处理的数据具有环形结构时,适合使用循环链表。
2.3 双向链表
单链表只有一个方向,只有一个后继指针 next 指向后面的节点。但是双向链表支持两个方向,除了这个后继指针之外,还有一个前继指针 prev 指向前面的结点,如下图所示:
从上图中可以看出,双向链表占用的空间比单链表更多,虽然两个指针比较浪费空间,但是可以支持双向遍历。
从结构上来看,双向链表相比于单链表可以支持 O(1) 时间复杂度的情况下找到前驱节点,因此在某种情况下,双向链表的插入和删除等操作比单链表更简单,高效。
比如,删除操作。从链表中删除一个数据无外乎两种情况:
- 删除结点中“值等于某个给定值”的结点
- 删除给定指针指向的结点
对于第一种情况,不管是单链表还是双向链表,为了查找值等于给定值的结点,都需要从头结点开始依次遍历对比,直到找到值等于给定值的结点,然后再通过指针操作将其删除。
删除操作的时间复杂度是 O(1),但是遍历查找的时间则是主要的耗时点,对应的时间复杂度为 O(n),根据时间复杂度分析中的加法法则,删除值等于给定值的结点对应的链表操作的总时间复杂度为 O(n)。
对于第二种情况,我们已经找到了要删除的结点,但是删除某个节点 q 需要知道其前驱结点,但是单链表查找前驱结点,又得从头开始遍历。对于双向链表来说,这种情况就很 easy 了,因为双向链表中的结点已经保存了前驱结点的指针。这种情况下,单链表删除需要 O(n) 的时间复杂度,双向链表只需要在 O(1)的时间复杂度内就搞定了。
双向链表其实涉及到了一个空间换时间
的设计思想,当内存空间充足的时候,我们可以选择空间复杂度相对较高、时间复杂度相对很低的算法或数据结构。缓存的设计就是利用了这种思想,我们把数据提前加载在内存中,虽然比较会耗费内存空间,但是每次数据查询的速度就会提高了。
总结:对于执行较慢的程序,可以通过消耗更多的内存(空间换时间)来进行优化;而消耗过多内存的程序,可以通过消耗更多的时间(时间换空间)来降低内存的消耗。
2.5 双向循环链表
这玩意就是双向链表和循环链表的结合体,如下图所示:
3. 链表和数组性能PK
链表和数组的内存存储结构不同,它们的插入、删除、随机访问操作的时间复杂度相反,如下图所示:
数组:
- 简单易用,内存连续
- 大小固定,需要占用整块连续内存空间
链表:
- 对 CPU 缓存不友好,无法有效预读
- 大小没有限制,支持动态扩容
4. 用链表实现 LRU 缓存淘汰算法
大概思路:
当有一个新的数据被访问时,从链表头部开始顺序遍历链表
1.如果这个数据之前已经被缓存在链表中了,就将这个数据对应的结点从原来位置删除,然后插入到链表的头部
2.如果数据没有在缓存链表中:
2.1 如果此时缓存未满,将此结点直接插入到链表的头部
2.2 如果此时缓存满了,将链表尾结点删除,将新的数据插入链表的头部
这种缓存访问的时间复杂度为 O(n)。
5. 写链表相关代码的技巧
5.1 理解指针或者引用的含义
将某个变量赋值给指针,实际上就是将这个变量的地址赋值给指针,或者说,指针中存储了这个变量的内存地址,指向了这个变量,通过指针就能找到这个变量。
比如 p->next = q,p 节点中的 next 指针存储了 q 结点的内存地址。
5.2 警惕指针丢失和内存泄漏
插入或者删除节点时要注意操作的顺序和手动释放内存空间。
5.3 利用哨兵简化实现难度
针对于链表的插入、删除操作,需要对插入的第一个结点和删除最后一个结点的情况进行特殊处理。
这种情况可以引入哨兵结点,不管链表是否为空,head 指针都会一直指向这个哨兵结点。有哨兵结点的链表叫做带头链表。
从上图中可以发现,哨兵结点是不存储数据的,所以插入第一个节点和插入其他节点,都可以统一为相同的代码实现逻辑了。
5.4 重点留意边界条件处理
- 链表为空时
- 只包含一个结点时
- 只包含两个结点时
- 代码逻辑在处理头结点和为结点时
等等
5.5 举例画图,辅助思考
可以举例画图
6. 练习操作
单链表的基础操作:
链表构建、指定位置添加结点、指定位置删除节点、打印链表、头插法、尾插法单链表反转:
迭代方法&递归方法实现环的检测
快慢指针两个有序链表合并
递归&迭代(增加虚拟头结点)删除链表倒数第 n 个结点
两个指针求链表的中间结点
快慢指针判断链表是否为回文链表