【chap6-字符串】用Python3刷《代码随想录》

字符串是由若干字符组成的有限序列,也可以理解为一个字符数组


344. 反转字符串 

344. 反转字符串

思路:双指针法。定义两个指针(即索引下标),一个从字符串前面,一个从字符串后面,两个指针同时向中间移动,并交换元素

  • 反转链表和反转字符串都是双指针法,但字符串也是一种数组,故元素在内存中是连续分布的(跟链表不同)
class Solution:
    def reverseString(self, s: List[str]) -> None:
        """
        Do not return anything, modify s in-place instead.
        """
        i, j = 0, len(s)-1
        for i in range(len(s)):
            if i < j:
                s[i], s[j] = s[j], s[i]
                i += 1
                j -= 1
        return s

541. 反转字符串II 

541. 反转字符串 II

题意简单概括:对于字符串s,每次遍历其2k的长度,反转2k长度里的前k个;若最后一组的长度不足2k但大于k,只反转这k个;若不足k,全部反转

首先,这题可以调用 344题反转字符串 中的函数,但要注意的是,344题的输入是一个字符组成的列表,而这题是字符串

  • 对字符串str 转 字符列表 list,用 list() 即可
  • 字符列表res 拼接回 字符串,用 "".join(res)

其次,分析本题哪些部分需要反转。注意,对于字符串s,是2k个长度去遍历的。对于2k个长度中的前k个进行反转 

  1. 使用 range(start, end, step) 来确定需要调换的初始位置 
  2. 对于字符串s = 'abc',如果使用s[0:999] ===> 'abc'。字符串末尾如果超过最大长度,则会返回至字符串最后一个值,这个特性可以避免一些边界条件的处理
  3. 用切片整体替换,而不是一个个替换
class Solution:
    def reverseStr(self, s: str, k: int) -> str:
        # 先定义一个反转函数
        def reverse(s):   # List[str]
            i, j = 0, len(s)-1
            for i in range(len(s)):
                if i < j:
                    s[i], s[j] = s[j], s[i]
                    i += 1
                    j -= 1
            return s

        res = list(s)   # str —> list
        for i in range(0, len(s), 2*k):  # 每次跳2k步
            res[i: i+k] = reverse(res[i: i+k])   # 切片是左闭右开
        return ''.join(res)


剑指offer 05. 替换空格

剑指 Offer 05. 替换空格

因为Python中字符串是不可变类型,所以操作字符串需要将其转换为列表,因此空间复杂度不可能为O(1)

法1:比较直观的一种方法。添加空列表,添加匹配的结果

class Solution:
    def replaceSpace(self, s: str) -> str:
        res = []
        for i in range(len(s)):
            if s[i] != ' ':   # 注意引号中间要打一个空格
                res.append(s[i])
            else:
                res.append('%20')
        return "".join(res)

法2:双指针。首先扩充数组到每个空格替换成 %20 之后的大小,然后从后向前替换空格(为什么是从后向前?因为从前向后填充的话,每次添加元素都要将添加元素之后的所有元素向后移动)

很多数组填充类的问题,都可以预先给数组扩容成填充后的大小,然后再从后向前进行操作

class Solution:
    def replaceSpace(self, s: str) -> str:
        cnt = s.count(' ')   # 统计字符串s里有多少个空格
        res = list(s)   # str —> list
        res.extend([' ']*2*cnt)  # 每个空格都要换成%20,长度+2
        
        # left遍历s,若遇到空格,则替换为%20;否则直接赋给right
        left, right = len(s)-1, len(res)-1   # 从后向前遍历
        while left >= 0:
            if res[left] != ' ':
                res[right] = res[left]
                right -= 1
            else:
                res[right-2: right+1] = '%20'   # 左闭右开 [right-2, right)
                right -= 3
            left -= 1
        return "".join(res)

151. 反转字符串中的单词 

151. 反转字符串中的单词

思路:移除多余空格(双指针法) —> 将整个字符串反转 —> 将每个单词反转(先整体反转再局部反转)

class Solution:
    def reverseWords(self, s: str) -> str:
        s = s.strip()   # 先去除字符串前后的空格
        s = s[::-1]   # 反转整个字符串
        s = ' '.join(word[::-1] for word in s.split())   # 将每个单词反转
        return s

若不借助 strip() 和 split() 函数,写起来很麻烦,代码如下:

class Solution:

    # 反转s[i: j]
    def reverse(self, s, i, j):   # s是一个list
        while i < j:
            s[i], s[j] = s[j], s[i]
            i += 1
            j -= 1

    def reverseWords(self, s: str) -> str:
        s = list(s)
        # strip()
        start, end = 0, len(s) - 1
        n = len(s)
        while start < n and s[start] == ' ':
            start += 1
        while end >= 0 and s[end] == ' ':
            end -= 1
        if start > end:
            return ''

        # 去除中间多余的空格, 并且把字符串挪到最前面        
        i, j = 0, start
        while j <= end:
            if s[j] == ' ':
                if s[j - 1] == ' ':   # 多个空格
                    j += 1
                else:
                    s[i] = s[j]   # 只有1个空格
                    i += 1
                    j += 1
            else:   # 字母
                s[i] = s[j]
                i += 1
                j += 1

        n = i   # 有效字符串的长度
        self.reverse(s, 0, n - 1)
        i = 0
        while i < n:
            j = i # 找到i开始的整个单词
            while j < n and s[j] != ' ':
                j += 1
            # 此时, j指向单词的最后一个字母后的空格或者字符串结束处
            self.reverse(s, i, j - 1)
            i = j + 1 # 跳到下个单词的第一个
        
        return ''.join(s[:n])   # n是有效字符串的长度

剑指Offer58-II.左旋转字符串

剑指 Offer 58 - II. 左旋转字符串

使用整体反转+局部反转就可以实现反转单词顺序的目的

思路:先局部反转再整体反转 

【chap6-字符串】用Python3刷《代码随想录》_第1张图片

class Solution:
    def reverse(self, s: list, start, end):
        while start < end:
            s[start], s[end] = s[end], s[start]
            start += 1
            end -= 1

    def reverseLeftWords(self, s: str, n: int) -> str:
        # 先反转前n个
        res = list(s)
        self.reverse(res, 0, n-1)
        # 再反转n+1到末尾
        self.reverse(res, n, len(res)-1)
        # 再整个反转
        self.reverse(res, 0, len(res)-1)
        return "".join(res) 

28. 找出字符串中第一个匹配项的下标 

28. 找出字符串中第一个匹配项的下标

(一)KMP

KMP主要应用在字符串匹配的场景中,其思想是当出现字符串不匹配的情况时,可以知道一部分之前已经匹配的文本内容,利用这些信息避免从头再去做匹配

如:文本串aabaabaaf(长度为n),模式串aabaaf(长度为m),要在文本串里匹配模式串

  • 暴力:两层for循环,遍历两个字符串,挨个匹配。时间复杂度O(m*n)
  • KMP:匹配过程O(n),单独生成next数组是O(m)。时间复杂度O(m+n)

next数组是一个前缀表,用来回退,记录了模式串与文本串不匹配时,模式串应该从哪里开始重新匹配。定义前缀表为:记录下标i(包括i)之前的字符串中有多长的相同前后缀

  • 前缀:包含首字母,不包含尾字母的所有连续子串
  • 后缀:包含尾字母,不包含首字母的所有连续子串

求得最长相同前后缀的长度就是对应前缀表的元素。找到了最长相等的前后缀,匹配失败的位置是后缀子字符串的后一个字符,找到与其相同的前缀,从后面重新匹配即可

关键:寻找匹配失败位置的前一位在前缀表中的元素,即为要跳转到的重新匹配的下标位置

(二)代码 

class Solution:

    # 构造next数组,即前缀表(将前缀表直接作为next数组)
    def getNext(self, next: List[int], s: str):    # s为模式串
        # step1:初始化next数组
        j = 0   # j为前缀末尾位置
        next[0] = 0   # 只有一个字符的字符串相同前后缀的最大长度是0
        for i in range(1, len(s)):   # i为后缀末尾位置
            # step2:若前缀和后缀对应的字符不相同
            while s[i] != s[j] and j>0:   # 是while而不是if,因为若不相同要连续回退
                j = next[j-1]   # j要回退到前一位next数组的值的下标位置
            # step3:若前缀和后缀对应的字符相同
            if s[i] == s[j]:
                j += 1   # j还代表着i包括i之前子串的最长相等前后缀长度
            next[i] = j 

    # 在haystack(文本串)里匹配needle(模式串)
    def strStr(self, haystack: str, needle: str) -> int:
        next = [0]*len(needle)
        self.getNext(next, needle)
        j = 0   # j为模式串起始位置
        for i in range(len(haystack)):   # i为文本串起始位置
            while haystack[i] != needle[j] and j>0:
                j = next[j-1]   # j就要从next数组中寻找下一个匹配的位置
            if haystack[i] == needle[j]:
                j += 1  # 若相同, i和j同时向后移动
            if j == len(needle):   # 若j指向了模式串的末尾,说明模式串完全匹配文本串的某个子串了
                return i-len(needle)+1   # 返回模式串在文本串中匹配时的第一个字符的位置
        return -1

459. 重复的子字符串

459. 重复的子字符串

复习KMP: 

  • 适用场景:给你一个字符串,判断另一个字符串是不是在这个字符串里出现过
  • KMP算法在查找过程中遇到不匹配的地方,直接跳到上一次匹配的地方继续匹配(因为有计算好的next数组)
  • next数组:以各个字符串为结尾的子串的最长相等前后缀的集合

若一个字符串是由重复子串组成的,那么它的最小重复单位就是它的最长相等前后缀不包含的那个子串。如:字符串 abababab,最长相等前后缀为 ababab,故不包含的就是ab

数组长度 - 最长相等前后缀的长度,相当于第一个重复子串的长度,也就是一个重复周期的长度。如果这个周期可以被整除,说明整个数组就是这个周期的循环

class Solution:

    # KMP求next数组(记录的就是最长相等前后缀的长度)
    def getNext(self, next: List[int], s: str):
        j = 0
        next[0] = 0
        for i in range(1, len(s)):
            while s[i] != s[j] and j>0:
                j = next[j-1]
            if s[i] == s[j]:
                j += 1
            next[i] = j

    def repeatedSubstringPattern(self, s: str) -> bool:
        next = [0]*len(s)
        self.getNext(next, s)   # "ababab"  [0,0,1,2,3,4]
        # next[-1] != 0说明字符串有相同的前后缀
        # next[-1] 就是最长相等前后缀的长度
        # len(s)-next[-1] 就是重复子串的长度
        if next[-1] != 0 and len(s) % (len(s)-next[-1]) == 0:   
            return True
        else:
            return False

总结:使用KMP可以解决两类经典问题,匹配问题(28题)和重复子串问题(459题)

你可能感兴趣的:(LeetCode,leetcode,算法)