2021-02-28

leetcode 第三题 无重复字符的最长子串

给定一个字符串,请你找出其中不含有重复字符的 最长子串 的长度。

输入: s = "abcabcbb"
输出: 3 
解释: 因为无重复字符的最长子串是 "abc",所以其长度为 3。

输入: s = "bbbbb"
输出: 1
解释: 因为无重复字符的最长子串是 "b",所以其长度为 1。

输入: s = "pwwkew"
输出: 3
解释: 因为无重复字符的最长子串是 "wke",所以其长度为 3。
请注意,你的答案必须是 子串 的长度,"pwke" 是一个子序列,不是子串。

输入: s = ""
输出: 0

最简单的暴力的方式,从头遍历所有的数据,将数据的后面部分的数据全部进行检测,检测部分就是逐一遍历看其中的数据是否出现在前面的数列中,算法复杂度是 n2,代码如下

class Solution:
    def __init__(self):
        self.max_length = 0

    def get_str_length(self, str_data):
        store_list = []
        for data in (str_data):
            if data in store_list:
                return len(store_list)
            else:
                store_list.append(data)
        return len(store_list)

    def lengthOfLongestSubstring(self, s):
        str_length = len(s)
        for i in range(str_length):
            son_length = self.get_str_length(s[i:])
            if son_length > self.max_length:
                self.max_length = son_length
        return self.max_length

if __name__ == '__main__':
    aa = Solution()
    str_test = "abcabcbb"
    print(aa.lengthOfLongestSubstring(str_test))

下面对于程序进行优化,如果我们是人我们如何加速整个寻找的流程呢?

滑动窗口问题可以借助类似于kmp算法的模式思考,因为我们在检测字符串abcdabcdabcd,我们在检测到第二个a的时候终止进行第二次的寻找,但是关键的地方来了,我们要从b开始吗???答案是否定的,因为我们已经检测过了bcd一定是不重复的,这个是先验知识,甚至说bcda也是不重复的,我们利用这个知识进行一次优化。

下面是leetcode的官方代码,使用set替代了重复的空间开销,后面的阶段在set中保留上一次的循环数据,减少了重复循环次数


class Solution:
    def lengthOfLongestSubstring(self, s: str) -> int:
        # 哈希集合,记录每个字符是否出现过
        occ = set()
        n = len(s)
        # 右指针,初始值为 -1,相当于我们在字符串的左边界的左侧,还没有开始移动
        rk, ans = -1, 0
        for i in range(n):
            if i != 0:
                # 左指针向右移动一格,移除一个字符
                occ.remove(s[i - 1])
            while rk + 1 < n and s[rk + 1] not in occ:
                # 不断地移动右指针
                occ.add(s[rk + 1])
                rk += 1
            # 第 i 到 rk 个字符是一个极长的无重复字符子串
            ans = max(ans, rk - i + 1)
        return ans

你可能感兴趣的:(Python练习,python,算法,数据结构)