算法的重要性,我就不多说了吧,想去大厂,就必须要经过基础知识和业务逻辑面试+算法面试。所以,为了提高大家的算法能力,这个公众号后续每天带大家做一道算法题,题目就从LeetCode上面选 !
今天和大家聊的问题叫做 柱状图中最大的矩形,我们先来看题面:
https://leetcode-cn.com/problems/largest-rectangle-in-histogram/
Given n non-negative integers representing the histogram's bar height where the width of each bar is 1, find the area of largest rectangle in the histogram.
给定 n 个非负整数,用来表示柱状图中各个柱子的高度。每个柱子彼此相邻,且宽度为 1 。
求在该柱状图中,能够勾勒出来的矩形的最大面积。
样例
输入: [2,1,5,6,2,3]
输出: 10
https://www.cnblogs.com/techflow/p/13304195.html
拿到手应该能感受到这题的难度,我们一上来的确没有什么太好的思路,题目也比较明确,没有太多可以分析的入手点。所以我们可以先来思考一下最简单的解法。
最简单的解法就是找出能够围成的所有矩形,然后比较它们之间的面积,得出其中的最大面积。我们很容易可以想到可以遍历矩形的起始位置,这样就得到了矩形的宽。至于矩形的长也很简单,就是选定的这个区间段里的最低高度。
我们可以做一个小小的思路转换,假设这些矩形都是木条,我们是要选出木条来制作木桶。那么根据木桶效应,木桶围成的水的高度取决于最短的那根木条,同样围成矩形的面积的高取决于这些矩形当中最矮的那个。也就是说,当我们确定了区间之后,我们只需要找到区间里最小的数就可以了。所以这题就转化成了区间求最值的问题,比如上图当中,如果我们选择最后三个矩形,那么它的高度就是2。
我们假设一共有n个长条矩形可供选择,那么我们可以选出的首尾组合就是,大概是n的平方量级个区间。对于每个区间,我们需要遍历它们中的元素获取最小值,这需要的遍历时间,所以整体的复杂度应该在量级。显然这是一个非常大的数量级,当n超过1000就很难计算出解了。
这个思路显然不够好,我们想要对它进行优化也不容易。比如说如果你学过线段树这类的数据结构,可能还会想到使用线段树,我们可以将每次求最小值的查询优化到,但即便如此最终的复杂度也很高。这是因为我们遍历区间首尾位置就耗费了,而这是很难优化的。所以这个思路的极限已经确定了,我们无法做出大的优化。
从这点出发,如果存在更好的解法,那么一定不是通过这种方式进行的。
上面的一种思路虽然不太可行,但是它提供了一种正向思路。我们搜索所有的区间,然后通过区间里的木条确定区围成矩形的高度,就得到了矩形的面积。
既然这条路走不通,我们能不能反向思考呢?我们假设我们找到了答案,它是区间[a, b]段的木条围成的矩形,它的高度是h。那么根据木桶效应,a到b区间段的木条当中一定有一根的长度是h。比如下图当中[5, 6, 2, 3]如果要围成矩形,那么高度只能是2。
既然如此,我们可以寻找以某根木条为短板所能构成的最大矩形。比如上图当中,如果我们以第一根木条去寻找,就只能找到它本身,所以这个矩形的面积就是1 x 2 = 2。如果以第二根木条为短板去寻找,可以找到整个区间,它对应的面积就是1 x 6 = 6。
因为我们只有n个木条,以每个木条为短板寻找最大矩形,那么我们一定可以找出最多n个矩形。最终的答案一定在这n个矩形当中,在正向思维当中我们寻找木条区间需要的复杂度,然而我们寻找短板,只需要,也就是说这种思路的搜索空间更小,只要我们保证搜索的效率,就可以更快地找到答案。
为了找到每个木条对应的最大矩形,我们需要找到每个短板向左以及向右能够延伸到的最远位置。比如上图例子当中,根据每个木条向右延伸的最远位置,我们可以得到[0, 5, 3, 3, 5, 5],同样,我们可以得到每根木条向左延伸的数组:[0, 0, 2, 3, 2, 5]。有了这两个数组之后,我们就可以计算出以每一根木条为短板的最大矩形的面积,在这其中面积最大的那个就是答案。
这个位置我们可以使用单调栈来求,我们用一个有序的栈来维护延伸的位置。举个例子,我们用从栈底往栈顶递增的单调栈来维护每根木条向右延伸的位置。当我们遇到一根新的木条时,会弹出栈中所有比它长的值。对于这些值来说,这根新的木条就是它的右边界。比如[5, 6, 2],一开始读到5,入栈。接着读到6,由于6大于栈顶的5,所以6入栈。最后读到2,由于2比6小,所以6出栈,对于6来说,2的位置就是它的右侧边界。正是由于2比它小,所以它才需要出栈,也说明了2的左侧的元素都比6来的大,否则6在之前就应该出栈了。同理,2也是5的右侧边界。
我们把以上的逻辑翻转,就得到了左侧边界求解的逻辑。左右边界有了之后,我们只需要乘上它们之间的区间长度就得到了矩形的面积。
接着,我们来写出代码:
class Solution:
def largestRectangleArea(self, heights: List[int]) -> int:
n = len(heights)
# 左侧边界初始化为0
left_side = [0 for i in range(n)]
# 右侧边界初始化为n-1
right_side = [n-1 for _ in range(n)]
stack_left = []
stack_right = []
for i in range(n):
h = heights[i]
# 弹出栈中所有比当前元素小的值
# 注意,栈内存储的是下标
while len(stack_right) > 0 and h < heights[stack_right[-1]]:
tail = stack_right[-1]
stack_right.pop()
right_side[tail] = i - 1
# 当前元素入栈
stack_right.append(i)
# 把坐标翻转,等价于逆向遍历
i_ = n - 1 - i
h = heights[i_]
# 维护单调栈的逻辑同上
while len(stack_left) > 0 and h < heights[stack_left[-1]]:
tail = stack_left[-1]
stack_left.pop()
left_side[tail] = i_ + 1
# 当前元素入栈
stack_left.append(i_)
ret = 0
for i in range(n):
# 矩形面积等于右侧边界-左侧边界+1 x 高度
cur = (right_side[i] - left_side[i] + 1) * heights[i]
ret = max(ret, cur)
return ret
想要把这道题做出来,单单理清楚题意和单单会单调栈都是没有用的。既需要理清楚题意,从最简单的解法出发推导出优化的方法,也需要深刻理解单调栈这个数据结构,才可以灵活应用。
另外,在代码当中需要特别注意边界的情况。比如初始化时左右边界的设定,以及可能会出现连续相等元素的情况,这些都需要纳入考虑。代码虽然看起来简单,但是隐藏了很多细节,所以只看代码是没用的,最好还是能亲自实现一下。
好了,今天的文章就到这里,如果觉得有所收获,请顺手点个在看或者转发吧,你们的支持是我最大的动力。
上期推文:
LeetCode50-80题汇总,速度收藏!
LeetCode刷题实战81:搜索旋转排序数组 II
LeetCode刷题实战82:删除排序链表中的重复元素 II
LeetCode刷题实战83:删除排序链表中的重复元素