本文始发于个人公众号:TechFlow,原创不易,求个关注
今天是LeetCode专题的44篇文章,我们一起来看下LeetCode的75题,颜色排序 Sort Colors。
这题的官方难度是Medium,通过率是45%,点赞2955,反对209(国际版数据),从这份数据上我们大概能看得出来,这题的难度不大,并且点赞远远高于反对,说明题目的质量很不错。事实上也的确如此,这题足够简单也足够有趣,值得一做。
题意
给定一个n个元素的数组,数组当中的每一个元素表示一个颜色。一共有红白蓝三种颜色,分别用0,1和2来表示。要求将这些颜色按照大小进行排序,返回排序之后的结果。
要求不能调用排序库sort来解决问题。
桶排序
看完题目应该感受到了,如果没有不能使用sort的限制,这题毫无难度。即使加上了限制难度也不大,我们既然不能调用sort,难道还不能自己写个sort吗?Python写个快排也才几行而已。
自己写sort当然是可以的,显然这是下下策。因为元素只有3个值,互相之间的大小关系也就只有那么几种,排序完全没有必要。比较容易想到,我们可以统计一下这三个数值出现的次数,几个0几个1几个2,我们再把这些数拼在一起,还原之前的数据不就可以了吗?
这样的确可行,但实际上这也是一种排序方案,叫做基数排序,也称为桶排序,还有些地方称为小学生排序(大概是小学生都能懂的意思吧)。基数排序的思想非常简单,我们创建一个数组,用它的每一位来表示某个元素是否在原数组当中出现过。出现过则+1,没出现过则一直是0。我们标记完原数组之后,再遍历一遍标记的数组,由于下标天然有序,所以我们就可以得到排序之后的结果了。
如果你还有些迷糊也没有关系,我们把代码写出来就明白了,由于这题让我们提供一个inplace的方法,所以我们在最后的时候需要对nums当中的元素重新赋值。
class Solution:
def sortColors(self, nums: List[int]) -> None:
"""
Do not return anything, modify nums in-place instead.
"""
bucket = [0 for _ in range(3)]
for i in nums:
bucket[i] += 1
ret = []
for i in range(3):
ret += [i] * bucket[i]
nums[:] = ret[:]
和排序相比,我们只是遍历了两次数据,第一次是遍历了原数组获得了其中0,1和2的数量,第二次是将获得的数据重新填充回原数组当中。相比于快排或者是其他一些排序算法的耗时,桶排序只遍历了两次数组,明显要快得多。但遗憾的是这并不是最佳的方法,题目当中明确说了,还有只需要遍历一次原数组的方法。
two pointers
在我们介绍具体的算法之前,我们先来分析一下问题。既然颜色只有三种,那么当我们排完序之后,整个数组会被分成三个部分,头部是0,中间是1,尾部是2。
我们可以用一个区间来收缩1的范围,假设我们当前区间的首尾元素分别是l和r。当我们读到0的时候,我们就将它和l交换,然后将l向后移动一位。当我们读到2的时候,则将它和r进行交换,将r向左移动一位。也就是说我们保证l和r之间的元素只有1。
我们之前曾经介绍过这种维护一个区间的做法,虽然都是维护了一个区间,但是操作上是有一些区别的。之前介绍的two pointers算法,也叫做尺取法,本质上是通过移动区间的右侧边界来容纳新的元素,通过移动左边界弹出数据的方式来维护区间内所有元素的合法性。而当前的做法中,一开始获得的就是一个非法的区间,我们通过元素的遍历以及区间的移动,最后让它变得合法。两者的思路上有一些细微的差别,但形式是一样的,就是通过移动左右两侧的边界来维护或者是达到合法。
class Solution:
def sortColors(self, nums: List[int]) -> None:
"""
Do not return anything, modify nums in-place instead.
"""
l, r = 0, len(nums)-1
i = 0
while i < len(nums):
if i > r:
break
# 如果遇到0,则和左边交换
if nums[i] == 0:
nums[l], nums[i] = nums[i], nums[l]
l += 1
# 如果遇到2,则和右边交换
# 交换之后i需要-1,因为可能换来一个0
elif nums[i] == 2:
nums[r], nums[i] = nums[i], nums[r]
r -= 1
continue
i += 1
这种方法我们虽然只遍历了数组一次,但是由于交换的次数过多,整体运行的速度比上面的方法还要慢。所以遍历两次数组并不一定就比只遍历一次要差,毕竟两者都是的算法,相差的只是一个常数。遍历的次数只是构成常数的部分之一。
除了这个方法之外,我们还有其他维护区间的方法。
维护区间
接下来要说的方法非常巧妙,我个人觉得甚至要比上面的方法还有巧妙。
我们来假想一下这么一个场景,假设我们不是在原数组上操作数据,而是从其中读出数据放到新的数组当中。我们先不去想应该怎么摆放这个问题,我们就来假设我们原数组当中的数据已经放好了若干个,那么这个时候的新数组会是什么样?显然,应该是排好序的,前面若干个0,中间若干个1,最后若干个2。
那么问题来了,假设这个时候我们读到一个0,那么应该怎么放呢?为了简化叙述我们把它画成图:
我们假设蓝色部分是0,绿色部分是1,粉色部分是2。a是0最右侧的下标,b是1部分最右侧的下标,c是2部分最右侧的下标。那么这个时候,当我们需要放入一个0的时候,应该怎么办?
我们结合图很容易想明白,我们需要把0放在a+1的位置,那么我们需要把后面1和2的部分都往右侧移动一格,让出一格位置出来放0。我们移动数组显然带来的开销会过于大,实际上没有必要移动整个部分,只需要移动头尾元素即可。比如1的部分左侧被0占掉了一格,那么为了保持长度不变,右侧也需要延伸一格。同理,2的部分右侧也需要延伸一格。那么整个操作用代码来表示就是:nums[a+1] = 0,nums[b+1] = 1, nums[c+1] = 2。
假设我们读入的数是1,那么我们需要把b延长一个单位,但是这样带来的后果是2的部分被侵占,所以需要将2也延长,补上被1侵占的一个单位。如果读到的是2,那么直接延长2即可,因为2后面没有其他颜色了。
假设我们有一个空白的数组,我们可以这么操作,但其实我们没有必要专门创建一个数组,我们完全可以用原数组自己填充自己。因为我们从原数组上读取的数和摆放的数是一样的,我们直接把数字摆放在原数组的头部,占用之前读取的数即可。
光说可能还有些迷糊,看下代码马上就清楚了:
class Solution:
def sortColors(self, nums: List[int]) -> None:
"""
Do not return anything, modify nums in-place instead.
"""
# 记录0,1和2的末尾位置
zero, one, two = -1, -1, -1
n = len(nums)
for i in range(n):
# 如果摆放0
# 那么1和2都往后平移一位,让一个位置出来摆放0
if nums[i] == 0:
nums[two+1] = 2
nums[one+1] = 1
nums[zero+1] = 0
zero += 1
one += 1
two += 1
elif nums[i] == 1:
nums[two+1] = 2
nums[one+1] = 1
one += 1
two += 1
else:
nums[two+1] = 2
two += 1
总结
到这里,这道题的解法基本上都讲完了。
相信大家也都看出来了,从难度上来说这题真的不难,相信大家都能想出解法来,但是要想到最优解还是有些困难的。一方面需要我们对题目有非常深入的理解,一方面也需要大量的思考。这类题目没有固定的解法,需要我们根据题目的要求以及实际情况自行设计解法,这也是最考验思维能力以及算法设计能力的问题,比考察某个算法会不会的问题要有意思得多。
希望大家都能从这题当中获得乐趣,如果喜欢本文,可以的话,请点个关注,给我一点鼓励,也方便获取更多文章。
本文使用 mdnice 排版