神洛华

LeetCode练习六：字符串

文章目录

- 一、字符串基础
- - 1.1 字符串基础知识
  - - 1.1.1 字符串简介
    - 1.1.2 字符串处理
    - 1.1.3 字符串类型的格式化
  - 1.2 字符串基础题目
  - - 1.2.1 字符串基础题目列表
    - 1.2.2 验证回文串
    - 1.2.3 最长回文子串
    - 1.2.4 无重复字符的最长子串
    - 1.2.5 字符串相加
    - 1.2.6 字符串相乘
    - 1.2.7 最长公共前缀
- 二、单模式串匹配算法
- - 2.1 Brute Force 算法（暴力匹配）
  - - 2.1.1 算法介绍
    - 2.1.2 代码实现
    - 2.2.3 算法分析
  - 2.2 KMP 算法介绍
  - - 2.2.1 朴素匹配算法的缺陷
    - 2.2.1 改进算法：KMP
    - 2.2.3 next 数组
    - 2.2.4 next 数组的构造
    - 2.2.5 KMP 算法整体步骤和代码实现
    - 2.2.5 KMP 算法分析
- 三、单模式串匹配练习
- - 3.1 单模式串匹配题目
  - 3.2 找出字符串中第一个匹配项的下标
  - 3.3 重复的子字符串
  - 3.4 重复叠加字符串匹配
  - 3.5 最大重复子字符串
  - 3.6 旋转字符串

参考《算法通关手册》字符串篇

一、字符串基础

1.1 字符串基础知识

1.1.1 字符串简介

字符串的表示:字符串是由0个或多个字符组成的有序字符序列，由一对单引号或一对双引号表示
字符串有2类共4种表示方法:
- 由1对单引号或双引号表示,仅表示单行字符串;
- 由1对三单引号或三双引号表示,可表示多行字符串;
字符串是字符的有序序列，可以对其中的字符进行索引。
特殊字符：使用转义符\，\b表示回退；\n表换行（光标移动到下行首；\r表示回车（光标移动到本行首），\t表示制表符（4格）

1.1.2 字符串处理

format官方文档、re文档

字符串操作符

操作符及查找	描述
x+y	连接两个字符串x和y
nx或xn	复制n次字符串x
x in s	如果x是s的子串，返回True，否则返回False
str.index(‘’)	子串第一次出现的位置，不存在报错ValueError
str.rindex(‘’)	子串最后一次出现的位置，不存在报错ValueError
str.find(‘’)	子串第一次出现的位置，不存在返回-1
str.rfind(‘’)	子串最后一次出现的位置，不存在返回-1

字符串处理函数

函数及使用	描述
len(x)	返回字符串的长度，非空字符串都有长度（换行符、空格和符号长度1）
str(x)	将x转换为string类型
hex(x)或oct(x)	将整数x转换成16进制或8进制字符串
chr(x)	将一个(0-255)10或16进制整数(Unicode编码)，转换成对应ASCII字符
ord(x)	x为字符，返回其对应的Unicode编码(原始值0-65535)

字符串大小写

大小写转换	描述
str.lower()或str.upper()	全部字符小写或大写，产生新字符串
str.swapcase()	字符串大写改小写，小写改大写，产生新字符串
str.capitalize()	首字符大写，其余小写，产生新字符串
str.title()	每个字符首字符大写，其余小写，产生新字符串

字符串对齐

字符串对齐	描述
str.center(width,’stp’)	居中对齐，width指定宽度，stp指定分隔符，默认空格分割。
str.ljust(width,’stp’)	左对齐，width指定宽度，stp指定分隔符，默认空格分割。
str.rjust(width,’stp’)	右对齐，width指定宽度，stp指定分隔符，默认空格分割。
str.zfill(width)	右对齐，左侧用0填充，width指定宽度。

以上对齐方式，指定宽度小于实际宽度时返回原字符串

字符串处理函数

函数及使用	描述
str.split(‘sep’,maxsplit)	从str左侧开始分割，分隔符为sep，默认空格。第二个参数指定最大分割次数。最大分割后剩余字符串成一个元素
str.rsplit(‘sep’,maxsplit)	同上，从右侧开始分割。直接写’/’或者sep=’/’都可以。最大分割后的元素不同。没有指定最大分割时是一样的
str.count(sub)	返回子串sub在str中的出现的次数
str.replace(old,new,num)	返回字符串str副本，所有old子串被替换为new,num为最大替换次数
str.center(width[,fillchar])	字符串str根据宽度width居中，fillchar可选填
str.strip(chars)	从str中去掉在其左侧和右侧chars中列出的字符
str.join(iter)	在iter变量除最后元素外每个元素后增加一个str
str.isidentifier()	判断字符串是否是合法标识符（汉字也算）
str.isspace()	判断字符串是否都是由空白字符组成（回车、换行、水平制表符）
str.isalpha()	判断字符串是否都是由字母组成（汉字也算）
str.isdecimal()	判断字符串是否都是由十进制数字组成
str.isnumeric()	判断字符串是否都是由数字组成（包括罗马数字）
str.isalnum()	判断字符串是否都是由数字和字母组成

字符串的比较
字符串可以用<、>、=、>=、<=、==、!=来比较。比较原理是比较每个字符的原始值（unicode编码），可用ord查看
编码与解码
- 编码：将字符串转换成二进制数据（byte）（gbk中文两个字节，utf-8中文三个字节）
- 格式：str.encode(encoding=’gbk’)(gbk大小写都可以,开头b表二进制)
- 解码：将二进制数据（byte）转换成字符串
- 格式：byte.decode((encoding=’gbk’)(byte为二进制编码)，解码格式应该与编码格式一致

1.1.3 字符串类型的格式化

字符串格式化有两种方式：

用%占位输出
如print(‘我是%s,今年%d岁，%(name,age))
print(‘我今年%10.2f岁’ % age)
结果：我是name，今年age岁
用{}输出，如
print(f‘我是(name),今年(age)岁)
print(‘我是{0},今年{1}岁’.format(name,age))(槽中0 和1可以不写)

整数类型输出格式：

b:输出整数的二进制方式
c:输出整数对应的Unicode字符
d:输出整数的十进制方式
o:输出整数的八进制方式
x:输出整数的小写十六进制方式
X:输出整数的大写十六进制方式

浮点数类型输出格式：

e:输出浮点数对应的小写字母e的指数形式
E:输出浮点数对应的大写字母E的指数形式
f:输出浮点数的标准浮点形式
%:输出浮点数的百分比形式
- {:.2f}表示小数点后两位的小数
- {:.2}表示一共两位数，有十位时表示为3e+01的形式

②格式控制

1.2 字符串基础题目

1.2.1 字符串基础题目列表

题号	标题	题解	标签	难度
0125	验证回文串	Python	字符串、双指针	简单
0005	最长回文子串	Python	字符串、动态规划	中等
0003	无重复字符的最长子串	Python	字符串、哈希表、双指针、字符串、滑动窗口	中等
0344	反转字符串	Python	字符串	简单
0557	反转字符串中的单词 III	Python	字符串	简单
0049	字母异位词分组	Python	字符串、哈希表	中等
0415	字符串相加	Python	字符串、大数加法	简单
0151	颠倒字符串中的单词	Python	双指针、字符串	中等
0043	字符串相乘	Python	数学、字符串、模拟	中等
0014	最长公共前缀	Python	字符串	简单

1.2.2 验证回文串

如果将所有大写字符转换为小写字符、并移除所有非字母数字字符之后，短语正着读和反着读都一样。则可以认为该短语是一个回文串。
给你一个字符串 s，如果它是回文串，返回 true ；否则，返回 false 。

class Solution:
    def isPalindrome(self, s: str) -> bool:
        s = "".join(ch.lower() for ch in s if ch.isalnum())
        return s == s[::-1]

作者：LeetCode-Solution
链接：https://leetcode.cn/problems/valid-palindrome/solution/yan-zheng-hui-wen-chuan-by-leetcode-solution/
来源：力扣（LeetCode）
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

1.2.3 最长回文子串

给你一个字符串 s，找到 s 中最长的回文子串。如果字符串的反序与原始字符串相同，则该字符串称为回文字符串。

输入：s = "babad"
输出："bab"
解释："aba" 同样是符合题意的答案。

思路 1：动态规划

初始化一个 n * n 大小的布尔类型数组 dp[][] ，dp[i][j] 表示字符串 s 上从位置 i 到 j 的子串 s[i...j] 是否是一个回文串，下面进行判断：
- 当子串只有 1 位或 2 位的时候，如果 s[i] == s[j]，该子串为回文子串， dp[i][j] = (s[i] == s[j])。
- 如果子串大于 2 位，则如果 s[i + 1...j - 1] 是回文串，且 s[i] == s[j]，则 s[i...j] 也是回文串，dp[i][j] = (s[i] == s[j]) and dp[i + 1][j - 1]。
当判断完 s[i: j] 是否为回文串时，判断并更新最长回文子串的起始位置和最大长度。

class Solution(object):
    def longestPalindrome(self, s):
        """
        :type s: str
        :rtype: str
        """

        n=len(s)
        if n<2:
            return s
        
        # 定义dp[i][j]表示从i到j的子串是否是回文串，初始设为False
        dp=[[False]*n for _ in range(n)]
        max_len=1 # 回文串最大长度
        start=0   # 最长回文串起始位置

        for j in range(1,n):
            for i in range(j):
                if s[i]==s[j]:
                    # 子串长度只有1或2时，一定是回文串
                    if j-i<3:
                        dp[i][j]=True
                    else:
                        dp[i][j]=dp[i+1][j-1]

                if dp[i][j] and j-i+1>max_len:
                   max_len=j-i+1
                   start=i
                   
        return s[start:start+max_len]

1.2.4 无重复字符的最长子串

给定一个字符串 s ，请你找出其中不含有重复字符的最长子串的长度。

输入: s = "abcabcbb"
输出: 3 
解释: 因为无重复字符的最长子串是 "abc"，所以其长度为 3。

class Solution(object):
    def lengthOfLongestSubstring(self, s):
        """
        :type s: str
        :rtype: int
        """
        left,right=0,0
        se=set()
        ans=0
        while right<len(s):
            if s[right] not in se:
                se.add(s[right])
                right+=1
                ans=max(ans,right-left)
            else:
                se.remove(s[left])
                left+=1
        return ans

class Solution:
    def lengthOfLongestSubstring(self, s: str) -> int:
        l,r=0,0
        ans=0
        se=set()
        for r in range(len(s)):
            while s[r] in se:
                se.remove(s[l])
                l+=1
            se.add(s[r])
            ans=max(ans,r-l+1)
        return ans

1.2.5 字符串相加

给定两个字符串形式的非负整数 num1 和num2 ，计算它们的和并同样以字符串形式返回。

你不能使用任何內建的用于处理大整数的库（比如 BigInteger），也不能直接将输入的字符串转换为整数形式。
解题思路：本题不能将字符串直接转为整数之后，在整数之间相加计算。只能对两个大整数模拟「竖式加法」的过程，如下所示：

算法流程：

设定 i，j 两指针分别指向 num1，num2 尾部，模拟人工加法；
计算进位：计算 add= tmp // 10，代表当前位相加是否产生进位；
添加当前位：计算 tmp = n1 + n2 + add，即当前位的结果。但是这其中要除去进位，所以当前位实际结果是 tmp % 10 ，将其添加至 ans 头部；（比如计算9+4=13，当前位计算结果是3，但是进位add=1，累积到高一位的计算中）
索引溢出处理：当指针 i或j 走过数字首部后，给 n1，n2 赋值为 0，相当于给 num1，num2 中长度较短的数字前面填 0，以便后续计算。
当遍历完 num1，num2 后跳出循环，并根据add 值决定是否在头部添加进位 1，最终返回 res 即可。

这其中的关键点，就是用add来表示前一位是否对当前位产生了进位，并将这个进位状态不断累加到后续每一位的计算中。

class Solution:
    def addStrings(self, num1: str, num2: str) -> str:
        ans=""
        i,j,add=len(num1)-1,len(num2)-1,0
        while i>=0 or j>=0:# 只要有一个数还可以计算
            #位数减为负则补0
            n1=int(num1[i]) if i>=0 else 0 
            n2=int(num2[j]) if j>=0 else 0
            
            temp=n1+n2+add 				# 当前位计算结果
            add=temp//10 				#判断是否要进一位
            ans=str(temp%10)+ans		# 当前位写入的结果
            i-=1
            j-=1
        return "1"+ans if add==1 else ans

1.2.6 字符串相乘

给定两个以字符串形式表示的非负整数 num1 和 num2，返回 num1 和 num2 的乘积，它们的乘积也表示为字符串形式。

注意：不能使用任何内置的 BigInteger 库或直接将输入转换为整数。

输入: num1 = "123", num2 = "456"
输出: "56088"

思路一：先算乘数的每一位相乘结果再相加

将较长的字符作为被乘数（num1），较短的作为乘数（num2）。
遍历num2的每一位j，将num2[j]乘以num1的每一位，得到结果ans
将结果ans存在列表ls中，最后再将ls的所有中间结果依次相加（借用上一题的相加函数）

比如996*32=1992+29980=31872。

class Solution(object):    

    def multiply(self, num1, num2):
        """
        :type num1: str
        :type num2: str
        :rtype: str
        """
        if num1=='0' or num2=='0':
        	return '0' # 如果没有这一步，会算出'00000'之类的
        # 将nums1设为更长的数
        if len(num1)-1<len(num2)-1:
            num1,num2=num2,num1

        ls=[]  # 记录nums2每一位和nums1相乘的结果
        count=0 # 记录nums2的位数，每进一位中间结果要乘以10
        for j in range(len(num2)-1,-1,-1):
            n2=int(num2[j]) # 用nums2的每一位乘以nums1的所有位
            add=0
            ans=''
            for i in range(len(num1)-1,-1,-1): 
                n1=int(num1[i]) 
                #print(n1,n2)          
                temp=n1*n2+add
                add=temp//10
                ans=str(temp%10)+ans
            ans=str(add)+ans if add!=0 else ans # 因为是相乘，进位可以是1到8（9*9=81）
            ls.append(ans+'0'*count)
            count+=1  
        #print(ls)

        res='0'            
        for i in range(len(ls)):
            res=self.addStrings(res,ls[i])
        return  res 

	def addStrings(self, num1, num2): # 加法函数
        ans=""
        i,j,add=len(num1)-1,len(num2)-1,0
        while i>=0 or j>=0:# 只要有一个数还可以计算
            #位数减为负则补0
            n1=int(num1[i]) if i>=0 else 0 
            n2=int(num2[j]) if j>=0 else 0
            
            temp=n1+n2+add 				# 当前位计算结果
            add=temp//10 				#判断是否要进一位
            ans=str(temp%10)+ans		# 当前位写入的结果
            i-=1
            j-=1
        return "1"+ans if add==1 else ans

思路二：各位相乘后，再相加

长度为 len(num1) 的整数 num1 与长度为 len(num2) 的整数 num2 相乘的结果长度为 len(num1) + len(num2) - 1 或 len(num1) + len(num2)。所以我们可以使用长度为 len(num1) + len(num2) 的整数数组 nums 来存储两个整数相乘之后的结果。（相当于首位可能补了0，如果最终结果没有进位的话）

整个计算流程的步骤如下：

从个位数字由低位到高位开始遍历 num1，取得每一位数字 digit1。从个位数字由低位到高位开始遍历 num2，取得每一位数字 digit2。
将 digit1 * digit2 的结果累积存储到 nums 对应位置 i + j + 1 上。（比如1996*23时，nums=[0, 2, 21, 45, 39, 18]）
从 len(num1) + len(num2) - 1 的位置由低位到高位遍历数组 nums。将每个数位上大于等于 10 的数字进行进位操作，然后对该位置上的数字进行取余操作。
最后判断首位是否有进位。如果首位为 0，则从第 1 个位置开始将答案数组拼接成字符串。如果首位不为 0，则从第 0 个位置开始将答案数组拼接成字符串。并返回答案字符串。

class Solution:
    def multiply(self, num1: str, num2: str) -> str:
        if num1 == "0" or num2 == "0":
            return "0"

        len1, len2 = len(num1), len(num2)
        nums = [0 for _ in range(len1 + len2)] # 首位补0

        for i in range(len1 - 1, -1, -1):
            digit1 = int(num1[i])
            for j in range(len2 - 1, -1, -1):
                digit2 = int(num2[j])
                # 比如num1的十位*num2的个位，和num2的十位*num1的个位，结果都在十位上，要累加起来
                nums[i + j + 1] += digit1 * digit2 
                
		# nums是每一位乘法计算之后的结果，比如[0, 2, 21, 45, 39, 18]
        for i in range(len1 + len2 - 1, 0, -1): # 从个位遍历到最高位的前一位
            nums[i - 1] += nums[i] // 10        # 先计算进位，并累加到下一位
            nums[i] %= 10						# 再将当前位结果取余数

        if nums[0] == 0:
            ans = "".join(str(digit) for digit in nums[1:])
        else:
            ans = "".join(str(digit) for digit in nums[:])
            
        return ans

1.2.7 最长公共前缀

编写一个函数来查找字符串数组中的最长公共前缀。如果不存在公共前缀，返回空字符串 ""。
思路一：纵向比较

从前往后遍历所有字符串的每一列，比较相同列上的字符是否相同，如果相同则继续对下一列进行比较，如果不相同则当前列不再属于公共前缀

class Solution(object):
    def longestCommonPrefix(self, strs):
        """
        :type strs: List[str]
        :rtype: str
        """
        
        if not strs:
            return ""


        le=[len(x) for x in strs]
        min_le=min(le) # 最短的长度

        i=0
        while i <min_le:
            se=set(strs[0][i]) # 从第一个字符串的第一个字符开始比较
            for ch in strs[1:]:
                if ch[i] not in se:
                    return strs[0][:i]
            i+=1

        return strs[0][:i]

或者是：

class Solution:
    def longestCommonPrefix(self, strs: List[str]) -> str:
        s = ""
        for i in zip(*strs): # 直接取出所有字符串的第i列
            if len(set(i)) == 1:
                s += i[0]
            else:
                break           
        return s

二、单模式串匹配算法

参考《算法通关手册》单模式串匹配篇

2.1 Brute Force 算法（暴力匹配）

2.1.1 算法介绍

Brute Force 算法：简称为 BF 算法。中文意思是暴力匹配算法，也可以叫做朴素匹配算法。
BF 算法思想：对于给定文本串 T 与模式串 p，从文本串的第一个字符开始与模式串 p 的第一个字符进行比较，如果相等，则继续逐个比较后续字符，否则从文本串 T 的第二个字符起重新和模式串 p 进行比较。依次类推，直到模式串 p 中每个字符依次与文本串 T 的一个连续子串相等，则模式匹配成功。否则模式匹配失败。

Brute Force 算法步骤
1. 对于给定的文本串 T 与模式串 p，求出文本串 T 的长度为 n，模式串 p 的长度为 m。
2. 同时遍历文本串 T 和模式串 p，先将 T[0] 与 p[0] 进行比较。
  1. 如果相等，则继续比较 T[1] 和 p[1]。以此类推，一直到模式串 p 的末尾 p[m - 1] 为止。
  2. 如果不相等，则将文本串 T 移动到上次匹配开始位置的下一个字符位置，模式串 p 则回退到开始位置，再依次进行比较。
3. 当遍历完文本串 T 或者模式串 p 的时候停止搜索。

2.1.2 代码实现

def bruteForce(T: str, p: str) -> int:
    n, m = len(T), len(p)
    
    i, j = 0, 0                     # i 表示文本串 T 的当前位置，j 表示模式串 p 的当前位置
    while i < n and j < m:          # i 或 j 其中一个到达尾部时停止搜索
        if T[i] == p[j]:            # 如果相等，则继续进行下一个字符匹配
            i += 1					# i和j同步右移
            j += 1
        else:
            i = i - (j - 1)         # 如果匹配失败则将 i 移动到上次匹配开始位置的下一个位置，
            j = 0                   # 匹配失败 j 回退到模式串开始位置

    if j == m:
        return i - j                # 匹配成功，返回匹配的开始位置
    else:
        return -1                   # 匹配失败，返回 -1

2.2.3 算法分析

BF 算法非常简单，容易理解，但其效率很低。主要是因为在匹配过程中可能会出现回溯：当遇到一对字符不同时，模式串 p 直接回到开始位置，文本串也回到匹配开始位置的下一个位置，再重新开始比较。

最坏时间复杂度为 $\times n)$ 。在回溯之后，文本串和模式串中一些部分的比较是没有必要的。由于这种操作策略，导致 BF 算法的效率很低。最坏情况是每一趟比较都在模式串的最后遇到了字符不匹配的情况，每轮比较需要进行 m 次字符对比，总共需要进行 n - m + 1 轮比较，总的比较次数为 m * (n - m + 1) 。
最佳时间复杂度是 $O (m)$ 。最理想的情况下（第一次匹配直接匹配成功）。
平均时间复杂度为 $O (n + m)$ 。在一般情况下，根据等概率原则，平均搜索次数为 $\frac{(n + m)}{2}$ 。

2.2 KMP 算法介绍

参考：

《算法通关手册：KMP 算法》

《如何更好地理解和掌握 KMP 算法?》

《【宫水三叶】简单题学 KMP 算法》

KMP 算法：全称叫做 「Knuth Morris Pratt 算法」，是由它的三位发明者 Donald Knuth、James H. Morris、 Vaughan Pratt 的名字来命名的。KMP 算法是他们三人在 1977 年联合发表的。

KMP 算法思想：对于给定文本串 T 与模式串 p，当发现文本串 T 的某个字符与模式串 p 不匹配的时候，可以利用匹配失败后的信息，尽量减少模式串与文本串的匹配次数，避免文本串位置的回退，以达到快速匹配的目的。

2.2.1 朴素匹配算法的缺陷

在朴素匹配算法的匹配过程中，我们分别用指针 i 和指针 j 指示文本串 T 和模式串 p 中当前正在对比的字符。当发现文本串 T 的某个字符与模式串 p 不匹配的时候，j 回退到开始位置，i 回退到之前匹配开始位置的下一个位置上（下图的B），继续匹配，直到能够与匹配串对上位置（下图第二个A），如下图所示。

那么有没有哪种算法，可以让 i 不发生回退，一直向右移动呢？

2.2.1 改进算法：KMP

如果我们可以通过每一次的失配而得到一些「信息」，并且这些「信息」可以帮助我们跳过那些不可能匹配成功的位置，那么我们就能大大减少模式串与文本串的匹配次数，从而达到快速匹配的目的。

每一次失配所告诉我们的信息是：主串的某一个子串等于模式串的某一个前缀。

比如文本串 T[i: i + m] 与模式串 p 的失配是下标位置 j 上发生的，那么文本串 T 从下标位置 i 开始连续的 j - 1 个字符，一定与模式串 p 的前 j - 1 个字符一模一样，即：T[i: i + j] == p[0: j]。

例如上图中，失配是在下标i+5这个位置发生的，那么失配位置的前5个字符，一定与模式串 p 的前 5 个字符一模一样，即："ABCAB" == "ABCAB"。

模式串的前 5 个字符中，前 2 位前缀和后 2 位后缀又是相同的，即 "AB" == "AB"。

所以根据上面的信息，我们可以推出：文本串子串的后 2 位后缀和模式串子串的前 2 位是相同的，即 T[i + 3: i + 5] == p[0: 2]，而这部分（即下图中的蓝色部分）是之前已经比较过的，不需要再比较了，可以直接跳过。

那么我们就可以将文本串中的 T[i + 5] 对准模式串中的 p[2]，继续进行对比。这样 i 就不再需要回退了，可以一直向右移动匹配下去。在这个过程中，我们只需要将模式串 j 进行回退操作即可。

实际上，我们会创建一个next数组作为「部分匹配表」，next[j] 表示的含义是：**记录下标 j 之前（包括 j）的模式串 p 中，最长相等前后缀的长度。**下一节会详细说明。
由于模式串数组中，next[4] == 2，所以不用回退 i，而是将 j 移动到下标为 2 的位置，让 T[i + 5] 直接对准 p[2]，然后继续进行比对。

下图参考《【宫水三叶】简单题学 KMP 算法》

也就是说，匹配失败时，匹配串会检查之前已经匹配成功的部分中里是否存在相同的「前缀」和「后缀」。如果存在，则跳转到「前缀」的下一个位置继续往下匹配：

跳转到下一匹配位置后，尝试匹配，发现两个指针的字符对不上，并且此时匹配串指针前面不存在相同的「前缀」和「后缀」，这时候只能回到匹配串的起始位置重新开始：

KMP 算法就是使用了这样的思路，对模式串 p 进行了预处理，计算出一个 「部分匹配表」(也叫PMT:Partial Match Table)**，用一个数组 next 来记录。然后在每次失配发生时，不回退文本串的指针 i，而是根据「部分匹配表」中模式串失配位置 j 的前一个位置的值，即 next[j - 1] 的值来决定模式串可以向右移动的位数。

KMP 利用已匹配部分中相同的「前缀」和「后缀」来加速下一次的匹配
KMP 的原串指针不会进行回溯（没有朴素匹配中回到下一个「发起点」的过程）

2.2.3 next 数组

上文提到的「部分匹配表PMT」，也叫做「前缀表」，在 KMP 算法中使用 next 数组存储。next[j] 表示的含义是：记录下标 j 之前（包括 j）的模式串 p 中，最长相等前后缀的长度。 也可以理解为，PMT中的值是 字符串的前缀集合与后缀集合的交集中最长元素的长度。

前缀：

如果字符串A和B，存在A=BS，其中S是任意的非空字符串，那就称B为A的前缀。

例如，”Harry”的前缀包括{”H”, ”Ha”, ”Har”, ”Harr”}，我们把所有前缀组成的集合，称为字符串的前缀集合。

后缀：

若有A=SB，其中S是任意的非空字符串，那就称B为A的后缀

例如，”Potter”的后缀包括{”otter”, ”tter”, ”ter”, ”er”, ”r”}，然后把所有后缀组成的集合，称为字符串的后缀集合。

对于字符串”ababa”，它的前缀集合为{”a”, ”ab”, ”aba”, ”abab”}，它的后缀集合为{”baba”, ”aba”, ”ba”, ”a”}，两个集合的交集为{”a”, ”aba”}，其中最长的元素为”aba”，长度为3。

要注意的是，字符串本身并不是自己的前缀或者后缀。

举个例子来说明一下，以 p = "ABCABCD" 为例。

next[0] = 0，因为 "A" 中无有相同前缀后缀，最大长度为 0。
next[1] = 0，因为 "AB" 中无相同前缀后缀，最大长度为 0。
next[2] = 0，因为 "ABC" 中无相同前缀后缀，最大长度为 0。
next[3] = 1，因为 "ABCA" 中有相同的前缀后缀 "a"，最大长度为 1。
next[4] = 2，因为 "ABCAB" 中有相同的前缀后缀 "AB"，最大长度为 2。
next[5] = 3，因为 "ABCABC" 中有相同的前缀后缀 "ABC"，最大长度为 3。
next[6] = 0，因为 "ABCABCD" 中无相同前缀后缀，最大长度为 0。

同理也可以计算出 "ABCABDEF" 的前缀表为 [0, 0, 0, 1, 2, 0, 0, 0]。"AABAAAB" 的前缀表为 [0, 1, 0, 1, 2, 2, 3]。"ABCDABD" 的前缀表为 [0, 0, 0, 0, 1, 2, 0]。

在之前的例子中，当 p[5] 和 T[i + 5] 匹配失败后，根据模式串失配位置 j 的前一个位置的值，即 next[4] = 2，我们直接让 T[i + 5] 直接对准了 p[2]，然后继续进行比对，如下图所示。

但是这样移动的原理是什么？

如果文本串 T[i: i + m] 与模式串 p 的失配是在第 j 个下标位置发生的，那么：

文本串 T 从下标位置 i 开始连续的 j 个字符，一定与模式串 p 的前 j 个字符一模一样，即：T[i: i + j] == p[0: j]（上图中的"ABCAB" == "ABCAB"）。
而如果模式串 p 的前 j 个字符中，前 k 位前缀和后 k 位后缀相同，（"ABCAB"中有相同的前后缀"AB"，即k=2）那么可以断言：文本串中i指针失配位置之前的 k 位（“AB”）一定与模式字符串的第0位至第 k位是相同的（“AB”），即长度为 k的后缀与前缀相同。
这样一来，我们就可以将这些字符段的比较省略掉。具体的做法是，保持i指针不动，然后将j指针指向模式字符串的next[j −1]位即可（表示模式串中，前j-1个子符里，最长相同前后缀的长度k）。

其实相当于因为模式串存在相同的前后缀，所以失配后，模式串不用退回起始位置，退到相同前缀的下一位置就行。

2.2.4 next 数组的构造

其实，求next数组的过程完全可以看成字符串匹配的过程，即以模式字符串为文本串串，以模式字符串的前缀为目标字符串，一旦字符串匹配成功，那么当前的next值就是匹配成功的字符串的长度。
具体来说，就是从模式字符串的第一位(注意，不包括第0位)开始对自身进行匹配运算。在任一位置，能匹配的最长长度就是当前位置的next值。如下图所示。

数组下标从0开始，所以图中应该是next[5]=4，以此类推。下图模式串有next=[0, 0, 1, 2, 3, 4, 0, 1]

这样我们就可以使用KMP本身的匹配原理来计算next数组。

我们将模式串p本身即作为文本串也作为模式串，同样用指针i和j来遍历。因为文本串第一个位置即使匹配上，也有next[0]=0，而不等于1，所以初始时令j = 0，i = 1。
遍历文本串和模式串：
- 如果 p[i] != p[j]，说明文本串在此位置失配，同上面所讲， i 不动，模式串指针 j 不断回退到 next[j - 1] 位置。
  - 如果回退几次后，有 p[i] == p[j] ，说明匹配上了一个字符，令j右移，此时此时 j 既是前缀下一次进行比较的下标位置，又是当前最长前后缀的长度，所以next[i]=j。最后移动指针i遍历下一个位置；
  - 如果一直回退到j=0，表示文本串在i位置匹配不到任何一个字符，next[i]=0=j，i+=1；
- 如果 p[i] == p[j]，同样先将 j += 1，next[i]=j，i+=1；

如果p[j]==p[i]，j先后移，next[i]=j，然后i后移；

如果不匹配，前缀指针回退，退到前一位置的next值，即j=next[j-1]，不停回退，直到p[j]==p[i]，或者j=0表示退到模式串开头位置，此时next[i]=0（因为j=0，所以依旧有next[i]=j），表示没有匹配的共同前后缀。

2.2.5 KMP 算法整体步骤和代码实现

根据 next 数组的构造步骤生成「前缀表」next。
使用两个指针 i、j，其中 i 指向文本串中当前匹配的位置，j 指向模式串中当前匹配的位置。初始时，i = 0，j = 0。
循环判断模式串前缀是否匹配成功，如果模式串前缀匹配不成功，将模式串进行回退，即 j = next[j - 1]，直到 j == 0 时或前缀匹配成功时停止回退。
如果当前模式串前缀匹配成功，则令模式串向右移动 1 位，即 j += 1。
如果当前模式串完全匹配成功，则返回模式串 p 在文本串 T 中的开始位置，即 i - j + 1。
如果还未完全匹配成功，则令文本串向右移动 1 位，即 i += 1，然后继续匹配。
如果直到文本串遍历完也未完全匹配成功，则说明匹配失败，返回 -1。

# 生成 next 数组
# next[j] 表示下标 j 之前的模式串 p 中，最长相等前后缀的长度
def generateNext(p: str):
    m = len(p)
    next = [0 for _ in range(m)]                # 初始化数组元素全部为 0
    
    left = 0                                    # left 表示前缀串开始所在的下标位置
    for right in range(1, m):                   # right 表示后缀串开始所在的下标位置
        while left > 0 and p[left] != p[right]: # 匹配不成功, left 进行回退, left == 0 时停止回退
            left = next[left - 1]               # left 进行回退操作
        if p[left] == p[right]:                 # 匹配成功，找到相同的前后缀，先让 left += 1，此时 left 为前缀长度
            left += 1
        next[right] = left                      # 记录前缀长度，更新 next[right], 结束本次循环, right += 1

    return next

# KMP 匹配算法，T 为文本串，p 为模式串
def kmp(T: str, p: str) -> int:
    n, m = len(T), len(p)
    
    next = generateNext(p)                      # 生成 next 数组
    
    j = 0                                       # j 为模式串中当前匹配的位置
    for i in range(n):                          # i 为文本串中当前匹配的位置
        while j > 0 and T[i] != p[j]:           # 如果模式串前缀匹配不成功, 将模式串进行回退, j == 0 时停止回退
            j = next[j - 1]
        if T[i] == p[j]:                        # 当前模式串前缀匹配成功，令 j += 1，继续匹配
            j += 1
        if j == m:                              # 当前模式串完全匹配成功，返回匹配开始位置
            return i - j + 1
    return -1                                   # 匹配失败，返回 -1

2.2.5 KMP 算法分析

KMP 算法在构造前缀表阶段的时间复杂度为 $O (m)$ ，其中 $m$ 是模式串 p 的长度。
KMP 算法在匹配阶段，是根据前缀表不断调整匹配的位置，文本串的下标 i 并没有进行回退，可以看出匹配阶段的时间复杂度是 $O (n)$ ，其中 $n$ 是文本串 T 的长度。
所以 KMP 整个算法的时间复杂度是 $O (n + m)$ ，相对于朴素匹配算法的 $O (n * m)$ 的时间复杂度，KMP 算法的效率有了很大的提升。

参考资料

【博文】从头到尾彻底理解 KMP - 结构之法算法之道 - CSDN博客

【博文】字符串匹配的 KMP 算法 - 阮一峰的网络日志

【题解】多图预警详解 KMP 算法 - 实现 strStr() - 力扣

【题解】「代码随想录」KMP算法详解 - 实现 strStr() - 力扣

三、单模式串匹配练习

3.1 单模式串匹配题目

题号	标题	题解	标签	难度
0028	找出字符串中第一个匹配项的下标	Python	字符串、双指针	简单
0459	重复的子字符串	Python	字符串、字符串匹配	简单
0686	重复叠加字符串匹配	Python	字符串、字符串匹配	中等
1668	最大重复子字符串
0796	旋转字符串	Python	字符串、字符串匹配	简单
1408	数组中的字符串匹配	Python	字符串、字符串匹配	简单
2156	查找给定哈希值的子串	Python	字符串、滑动窗口、哈希函数、滚动哈希	中等

3.2 找出字符串中第一个匹配项的下标

class Solution(object):
    def strStr(self, haystack, needle):
        """
        :type haystack: str
        :type needle: str
        :rtype: int
        """
        # KMP 匹配算法，haystack 为文本串，needle 为模式串
        m,n = len(haystack), len(needle)
        next = self.next(needle)  # 生成 next 数组
        j = 0                                             # j 为模式串中当前匹配的位置

        for i in range(m):                                # i 为文本串中当前匹配的位置
            while j > 0 and haystack[i] != needle[j]:     # 如果模式串前缀匹配不成功, 将模式串进行回退, j == 0 时停止回退
                j = next[j - 1]
            if haystack[i] == needle[j]:                  # 当前模式串前缀匹配成功，令 j += 1，继续匹配
                j += 1
            if j == n:                              	  # 当前模式串完全匹配成功，返回匹配开始位置
                return i - j + 1
        return -1

    def next(self,p):
        # 等同于模式串自己和自己匹配，只不过文本串从1开始（第一位匹配到结果也应该是0不是1），模式串从0开始
        next=[0 for _ in range(len(p))]
        j=0 # 模式串匹配起始位置，也是匹配到的长度
        for i in range(1,len(p)):
            #次序反过来，left右移，下一步判定就不对了
            #if p[left]==p[right]:
                #left+=1
            # 先判定不相等就回退，直到相等再右移模式串指针，进行下一步比较
            while j>0 and p[j]!=p[i]:
                j=next[j-1]
            if p[i]==p[j]:
                j+=1 			# 匹配上了，公共前后缀长度+1
            next[i]=j
        return next

3.3 重复的子字符串

给定一个非空的字符串 s ，检查是否可以通过由它的一个子串重复多次构成。

输入: s = "abcabcabcabc"
输出: true
解释: 可由子串 "abc" 重复四次构成。 (或子串 "abcabc" 重复两次构成。)

思路一：官方题解

class Solution:
    def repeatedSubstringPattern(self, s: str) -> bool:
        return (s+s).find(s,1)!=len(s)

思路二：KMP（参考《算法通关手册》）
我们知道 next[j] 表示的含义是：记录下标 j 之前（包括 j）的模式串 p 中，最长相等前后缀的长度。
而如果整个模式串 p 的最长相等前后缀长度不为 0，即 next[len(p) - 1] != 0 ，则说明整个模式串 p 中有最长相同的前后缀。假设 next[len(p) - 1] == k，则说明 p[0: k] == p[m - k: m]。比如字符串 “abcabcabc”，最长相同前后缀为 “abcabc” = “abcabc”。

如果最长相等的前后缀是重叠的，比如之前的例子 “abcabcabc”。
- 如果我们去除字符串中相同的前后缀的重叠部分，剩下两头前后缀部分（这两部分是相同的）。然后再去除剩余的后缀部分，只保留剩余的前缀部分。比如字符串 “abcabcabc” 去除重叠部分和剩余的后缀部分之后就是 “abc”。实际上这个部分就是字符串去除整个后缀部分的剩余部分。
- 如果整个字符串可以通过子串重复构成的话，那么这部分就是最小周期的子串。
- 我们只需要判断整个子串的长度是否是剩余部分长度的整数倍即可。也就是判断 len(p) % (len(p) - next[size - 1]) == 0 是否成立，如果成立，则字符串 s 可由 s[0: len(p) - next[size - 1]] 构成的子串重复构成，返回 True。否则返回 False。
如果最长相等的前后缀是不重叠的，那我们可将重叠部分视为长度为 0 的空串，则剩余的部分其实就是去除后缀部分的剩余部分，上述结论依旧成立。

class Solution:
    def repeatedSubstringPattern(self, s: str) -> bool:
    	# 创建next数组
        le=len(s)
        if le==1:
            return False
        j=0
        next=[0 for _ in range(le)]
        for i in range(1,le):
            while j>0 and s[i]!=s[j]:
                j=next[j-1]
            if s[i]==s[j]:
                j+=1
            next[i]=j
        
        # next数组最后一位的值，表示模式串的最长相等前后缀长度。
        # 将其除去前后缀重叠部分和剩余的后缀部分，就是剩余前缀部分。
        # 这部分就是最小周期长度，可以被模式串长度整除
        if next[le-1]!=0 and le%(le-next[le-1])==0:
            return True
        return False

3.4 重复叠加字符串匹配

给定两个字符串 a 和 b，寻找重复叠加字符串 a 的最小次数，使得字符串 b 成为叠加后的字符串 a 的子串，如果不存在则返回 -1。

输入：a = "abcd", b = "cdabcdab"
输出：3
解释：a 重复叠加三遍后为 "abcdabcdabcd", 此时 b 是其子串。

首先，可以分析复制次数的「下界」和「上界」为何值：

「下界」：至少将 a 复制长度大于等于 b 的长度，才有可能匹配
「上界」：由于主串是由 a 复制多次而来，并且是从主串中找到子串 b，因此可以明确子串的起始位置，不会超过 a 的长度。即长度越过 a 长度的起始匹配位置，必然在此前已经被匹配过了。由此，我们可知复制次数「上界」最多为「下界 + 1」

class Solution:
    def repeatedStringMatch(self, a: str, b: str) -> int:
    # 将b看做模式串，a最低重复次数是len([a]*count)=len(b)，即至少的是一样长
    # 最大重复次数是count+1。
    # 将a复制（n+1）次后匹配b，如果匹配下标超过n，则表示无法重复，否则返回count
        m,n=len(a),len(b)
        count=(n//m)+1 if n%m!=0 else n//m
        a=a*(count+1)
        idx=a.find(b)
        
        if idx ==-1:
            return -1
        else:
            idx=idx+n-1 # 匹配串的结束位置
            return count if idx<m*count else count +1

如果用KMP算法代替find函数写，就是：

class Solution:
    def repeatedStringMatch(self, a: str, b: str) -> int:
    # 将b看做模式串，a最低重复次数是len([a]*count)=len(b)，即至少的是一样长
    # 最大重复次数是count+1。
    # 将a复制（n+1）次后匹配b，如果匹配下标超过n，则表示无法重复，否则返回count
        m,n=len(a),len(b)
        count=(n//m)+1 if n%m!=0 else n//m
        a=a*(count+1)
        idx=self.KMP(a,b)
        print(idx)
        if idx ==-1:
            return -1
        else:        
            return count if idx<m*count else count +1
    
    def KMP(self, t, p):
        """
        :type haystack: str
        :type needle: str
        :rtype: int
        """
        # KMP 匹配算法，haystack 为文本串，needle 为模式串
        m,n = len(t), len(p)
        next = self.next(p)  # 生成 next 数组
        j = 0                                               # j 为模式串中当前匹配的位置

        for i in range(m):                          # i 为文本串中当前匹配的位置
            while j > 0 and t[i] != p[j]:           # 如果模式串前缀匹配不成功, 将模式串进行回退, j == 0 时停止回退
                j = next[j - 1]
            if t[i] == p[j]:                        # 当前模式串前缀匹配成功，令 j += 1，继续匹配
                j += 1
            if j == n:                              # 当前模式串完全匹配成功，返回匹配结束位置
                return i
        return -1

    def next(self,p):
        # 等同于模式串自己和自己匹配看前缀，只不过文本串从1开始（第一位匹配到结果也应该是0不是1），模式串从0开始
        next=[0 for _ in range(len(p))]
        j=0 # 共同前缀下标
        for i in range(1,len(p)):
            #次序反过来，left右移，下一步判定就不对了
            #if p[left]==p[right]:
                #left+=1
            # 先判定不相等就回退，直到相等再右移模式串指针，进行下一步比较
            while j>0 and p[j]!=p[i]:
                j=next[j-1]
            if p[i]==p[j]:
                j+=1 # 匹配时，公共前后缀长度+1
            next[i]=j
        #print(next)
        return next

3.5 最大重复子字符串

给你一个字符串 sequence ，如果字符串 word 连续重复 k 次形成的字符串是 sequence 的一个子字符串，那么单词 word 的重复值为 k 。单词 word 的最大重复值是单词 word 在 sequence 中最大的重复值。如果 word 不是 sequence 的子串，那么重复值 k 为 0 。

给你一个字符串 sequence 和 word ，请你返回最大重复值 k 。

输入：sequence = "ababc", word = "ba"
输出：1
解释："ba" 是 "ababc" 的子字符串，但 "baba" 不是 "ababc" 的子字符串。

class Solution(object):
    def maxRepeating(self, sequence, word):
        """
        :type sequence: str
        :type word: str
        :rtype: int
        """
        ans=0
        while (ans*word) in sequence:
            ans+=1
        return ans -1

class Solution(object):
    def maxRepeating(self, sequence, word):
        """
        :type sequence: str
        :type word: str
        :rtype: int
        """
        m,n=len(sequence),len(word)
        max_count=m//n
        ans,count=0,1
        
        while count<=max_count:
            temp=word*count
            if sequence.find(temp)!=-1:
                ans=max(ans,count)
                count+=1
            else:
                break            
        return ans

3.6 旋转字符串

给定两个字符串, s 和 goal。如果在若干次旋转操作之后，s 能变成 goal ，那么返回 true 。
s 的旋转操作就是将 s 最左边的字符移动到最右边。

输入: s = "abcde", goal = "cdeab"
输出: true

class Solution(object):
    def rotateString(self, s, goal):
        """
        :type s: str
        :type goal: str
        :rtype: bool
        """
        return goal in s+s if len(s)==len(goal) else False

你可能感兴趣的:(数据结构与算法,leetcode,算法,字符串,KMP)

C#中 String类API（函数）幻想趾于现实 C#.NET c#开发语言
字符串属性stringstr="打工人";Console.WriteLine(str);chars=str[0];Console.WriteLine(s);字符串内置API(函数)1.Concat拼接字符串strings1="打";strings2="工";strings3="人";stringsth=string.Concat(s1,s2,s3);Console.WriteLine(sth);/
杨辉三角 II（js实现，LeetCode：119）充气大锤算法 leetcode 算法职场和发展 javascript 前端学习笔记
这题是杨辉三角的进阶版题目，所以直接在返回值那里返回整个三角的rowIndex行的数组就可以做出来/***@param{number}rowIndex*@return{number[]}*/vargetRow=function(rowIndex){letarr=[[1],[1,1]]for(leti=1;i0;--j){row[j]+=row[j-1];}}returnrow;};这样优化之后空间
leetcode:15.三数之和 uncle_ll 编程练习-Leetcode leetcode 三数之和双指针算法训练营数组
15.三数之和来源：力扣（LeetCode）链接:https://leetcode.cn/problems/3sum给你一个包含n个整数的数组nums，判断nums中是否存在三个元素a，b，c，使得a+b+c=0？请你找出所有和为0且不重复的三元组。注意：答案中不可以包含重复的三元组。示例1：输入：nums=[-1,0,1,2,-1,-4]输出：[[-1,-1,2],[-1,0,1]]示例2：输入
LeetCode第104题_二叉树的最大深度 @蓝莓果粒茶算法 leetcode 算法职场和发展 c++数据结构 python c#
LeetCode第104题：二叉树的最大深度题目描述给定一个二叉树，找出其最大深度。二叉树的深度为根节点到最远叶子节点的最长路径上的节点数。说明:叶子节点是指没有子节点的节点。难度简单问题链接https://leetcode.cn/problems/maximum-depth-of-binary-tree/示例示例1：输入：root=[3,9,20,null,null,15,7]输出：3示例2：输
目标检测YOLO实战应用案例100讲-基于深度学习的无人机目标检测算法轻量化研究（中）林聪木目标检测 YOLO 深度学习
目录基于改进YOLOv5的无人机图像实时目标检测4.1引言4.2基于改进YOLOv5的目标检测模型结构4.3消融实验及结果分析4.4算法迁移验证实验基于Jetson-Xavier的模型优化部署5.1引言5.2基于人在回路的目标检测模型裁剪5.3嵌入式实时目标检测交互软件基于深度学习的无人机目标检测算法轻量化研究知识拓展基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的无人机目标检测1.数
Leetcode 306. Additive Number 小白菜又菜 Leetcode 解题报告 leetcode python 深度优先
ProblemAnadditivenumberisastringwhosedigitscanformanadditivesequence.Avalidadditivesequenceshouldcontainatleastthreenumbers.Exceptforthefirsttwonumbers,eachsubsequentnumberinthesequencemustbethesumoft
信息学奥赛一本通 1353：表达式括号匹配(stack) | 洛谷 P1739 表达式括号匹配君义_noip 信息学奥赛一本通题解 C++栈括号匹配算法表达式
【题目链接】ybt1353：表达式括号匹配(stack)洛谷P1739表达式括号匹配【题目考点】1.栈【解题思路】遍历整个字符串，遇到左括号时入栈，遇到右括号时，应该出栈一个左括号。如果遇到右括号时栈空，说明存在右括号无法配对。在遍历结束后，如果栈不为空，说明存在左括号无法配对。可以用数组及表达式实现栈功能，可以使用函数实现栈功能，可以自己写栈类，也可以使用STL中是stack。【题解代码】解法1
leetcode_位运算 67.二进制求和 MiyamiKK57 leetcode 算法 python
67.二进制求和给你两个二进制字符串a和b，以二进制字符串的形式返回它们的和。1.内置函数classSolution(object):defaddBinary(self,a,b):""":typea:str:typeb:str:rtype:str"""res=int(a,2)+int(b,2)returnbin(res)[2:]时间复杂度分析：int(a,2)和int(b,2)：这两步将二进制字符
leetcode_双指针 557. 反转字符串中的单词 III MiyamiKK57 leetcode 算法职场和发展
557.反转字符串中的单词III给定一个字符串s，你需要反转字符串中每个单词的字符顺序，同时仍保留空格和单词的初始顺序。思路:1.首先用split()切割字符串中用空格分隔的单词2.用切片法反转每个单词3.用join()把反转后的单词用空格连接classSolution(object):defreverseWords(self,s):""":types:str:rtype:str"""#使用spl
云智慧：拥抱AI算法驱动的智能运维服务创新引擎
随着信息化、数字化、智能化的加码，企业对人工智能、大数据等技术应用呈现出明显兴趣，海笔研究对国内中型规模企业调研表明，在2020年，54.1%的企业选择购买人工智能类应用，41.9%的企业选择购买大数据及BI类应用，各类产品软件的应用大幅提升了企业信息系统复杂度，以及运维管理难度。业务发展催生服务需求从系统管理者角度出发，信息系统从“单机Excel表格”到“集中式单系统”再到“微服务、云架构”等，
力扣55.跳跃游戏进击的jerk 力扣 leetcode 游戏算法开发语言 c++
55.跳跃游戏-力扣（LeetCode）代码区：classSolution{vectorjump(vectornums){intn=nums.size();vectorstep(n,1e6);//全部设置为1e6step[0]=0;for(inti=0;i&nums){intn=nums.size();vectorstep_ans(n);step_ans=jump(nums);if(step_an
双指针与二分算法打不了嗝蓝桥杯 c++算法
一.双指针1.基本介绍双指针算法是一种暴力枚举的优化算法，他也被叫做尺取法或者滑动窗口。当我们发现算法需要两次for循环时并且两个指针可以不回退，我们可以利用双指针来优化算法复杂度。2.例题详解题目描述企业家Emily有一个很酷的主意：把雪花包起来卖。她发明了一台机器，这台机器可以捕捉飘落的雪花，并把它们一片一片打包进一个包裹里。一旦这个包裹满了，它就会被封上送去发售。Emily的公司的口号是“把
算法刷题区域部分反转无敌的牛算法算法
不断创建数组，相加，利用cpp内字符串相加的性质即可。具体代码如下：classSolution{public:stringreverseStr(strings,intk){intsize=s.size();intcount=size/(2*k);stringa;inti=0;for(i=0;ik){reverse(a2.begin(),a2.begin()+k);}else{reverse(a2.
优选算法训练篇07--力扣LCR179.查找总价格为目标值的两个商品大胆飞猪算法训练篇算法 leetcode
目录1.题目链接：LCR179.查找总价格为目标值的两个商品2.题目描述：3.解法一(暴力解法，会超时)：4.解法二(双指针-对撞指针):1.题目链接：LCR179.查找总价格为目标值的两个商品2.题目描述：购物车内的商品价格按照升序记录于数组price。请在购物车中找到两个商品的价格总和刚好是target。若存在多种情况，返回任一结果即可。示例1：输入：price=[3,9,12,15],tar
LeetCode215. 数组中的第K个最大元素 techpupil 算法快速选择 leetcode
给定整数数组nums和整数k，请返回数组中第k个最大的元素。请注意，你需要找的是数组排序后的第k个最大的元素，而不是第k个不同的元素。你必须设计并实现时间复杂度为O(n)的算法解决此问题。示例1:输入:[3,2,1,5,6,4],k=2输出:5示例2:输入:[3,2,3,1,2,4,5,5,6],k=4输出:4分析：本题我们能想到最简单的方法就是直接给数组排序，然后取第第N-k个元素，但题目要求是
SM国密算法深度解析与技术实践安全
SM国密算法深度解析与技术实践一、算法体系概述SM系列密码算法是由中国国家密码管理局发布的商用密码标准体系，涵盖非对称加密、对称加密、杂凑算法、标识密码等多个领域。其核心组件包括：SM2：基于椭圆曲线的非对称加密算法（GB/T32918）SM3：密码杂凑算法（GB/T32905）SM4：分组对称加密算法（GB/T32907）与国际算法对比类型国密算法国际标准密钥长度安全强度非对称加密SM2RSA-
梯度下降法理论理解伶星37 机器学习人工智能
梯度下降法：看似原始却透露着机器学习的本质前提：在研究梯度下降方法之前，你要理解矩阵运算（解析解）的方法矩阵运算目前的缺点只能进行对线性函数经行分析，无法对复杂的函数经行分析什么是梯度，以及梯度向量梯度下降的形象例子以及基本思想有三个兄弟被困在山上，得要死，他们目标是看谁尽快找到山谷中的水源老大比较后选择最陡的方向随便探索一下，就朝较低处走去探测几下就走陡峭的方向梯度下降算法的核心思想就是沿着负梯
LeetCode 1092：最短公共超序列迪小莫学AI 每日算法 leetcode 算法职场和发展
LeetCode1092：最短公共超序列题目描述LeetCode1092.最短公共超序列是一道困难题。题目要求我们给定两个字符串str1和str2，返回一个最短的字符串，使得str1和str2都是它的子序列。如果答案有多个，可以返回任意一个。题目详情输入：str1:第一个字符串，仅包含小写英文字母。str2:第二个字符串，仅包含小写英文字母。输出：一个最短的字符串，使得str1和str2都是它的子
2.服务器负载均衡我是一条胖咸鱼华为安全HCIP 网络服务器安全负载均衡华为
1.服务器负载均衡概述负载均衡基本概念实服务器：处理业务流量的实体服务器，客户端发送的服务请求最终是由实服务器处理的。实服务器组：由多个实服务器组成的集群，对外提供特定的一种服务。虚拟服务器：实服务器组对外呈现的逻辑形态，客户端实际访问的是虚拟服务器。负载均衡算法：FW分配业务流量给实服务器时依据的算法，不同的算法可能得到不同的分配结果。服务健康检查：FW检查服务器状态是否正常的过程，可以增强为用
AI大模型产品经理学习路线，2025最新，从AI产品经理零基础入门到精通，非常详细收藏我这一篇够了！ AGI-杠哥人工智能产品经理学习语言模型 agi 自然语言处理
随着人工智能技术的发展，尤其是大模型（LargeModel）的兴起，越来越多的企业开始重视这一领域的投入。作为大模型产品经理，你需要具备一系列跨学科的知识和技能，以便有效地推动产品的开发、优化和市场化。以下是一份详细的大模型产品经理学习路线，旨在帮助你构建所需的知识体系，从零基础到精通。一、基础知识阶段1.计算机科学基础数据结构与算法：理解基本的数据结构（如数组、链表、树、图等）和常用算法（如排序
使用 Spring Security的一些常用功能代码代码快快显灵 springsecurity spring java 前端 SpringSecurity
在实际开发中，SpringSecurity常常涉及一些常用的功能。以下是一些在开发中经常使用的SpringSecurity功能：1.PasswordEncoderBean（密码加密）这段配置使用BCryptPasswordEncoder作为密码加密算法。它是SpringSecurity中常用的密码加密方式，通常用于存储和验证用户的密码。@BeanpublicPasswordEncoderpassw
最小生成树C He11o__Wor1d424 c语言算法图论
最小生成树是所有节点的最小连通子图，即：以最小的成本（边的权值）将图中所有节点链接到一起。图中有n个节点，那么一定可以用n-1条边将所有节点连接到一起。Primprim算法是从节点的角度采用贪心的策略每次寻找距离最小生成树最近的节点并加入到最小生成树中。prim算法核心就是三步：第一步，选距离生成树最近节点第二步，最近节点加入生成树第三步，更新非生成树节点到生成树的距离（即更新minDist数组）
2025年第二届机器学习与神经网络国际学术会议(MLNN 2025) 分享学术科研与论文的禁小默机器学习神经网络人工智能
重要信息官网：www.icmlnn.org时间：2025年4月22-24日地点：中国-重庆简介2025年第二届机器学习与神经网络国际学术会议（MLNN2025）围绕学习系统与神经网络的核心理论、关键技术和应用展开讨论，涵盖深度学习、计算机视觉、自然语言处理、强化学习等多个子领域，通过特邀报告、主题演讲、海报展示等形式，展示相关领域的最新研究成果和技术创新。征稿主题神经网络机器学习深度学习算法及应用
代码随想录算法训练营Day19| LeetCode 77 组合、216 组合总和 III、17 电话号码的字母组合今天也要早睡早起代码随想录算法训练营跟练算法 leetcode c++数据结构递归回溯
理论基础回溯的本质是穷举，也就是暴力求解，它是递归的一部分。所有回溯法解决的问题都可以抽象为树形结构，因为回溯法解决的都是在集合中递归查找子集，集合的大小构成了树的宽度，递归的深度就构成了树的深度（cr.代码随想录）。应用回溯一般被用于以下几种问题（cr.代码随想录）的求解中：组合问题：N个数里面按一定规则找出k个数的集合切割问题：一个字符串按一定规则有几种切割方式子集问题：一个N个数的集合里有多
Python进阶之-加密库cryptography使用详解夏天Aileft Python python 网络加密
✨前言cryptography库是一个强大的Python加密库，提供了对加密算法和协议的高层和低层访问。它是用来实现数据加密、签名、密钥管理等功能的。以下是一些常见用法的详解，帮助你理解如何使用这个库。✨安装首先，你需要确保安装了cryptography库：pipinstallcryptography✨1.对称加密对称加密是指加密和解密使用相同的密钥。Fernet是cryptography库中提供
python列表添加元素的三种方法定义集合数据对象_python 学习第三天可迭代对象（列表，字典，元组和集合）... weixin_39852491
列表，字典，元组和集合列表list列表是由一系列特定元素组成的，元素和元素之间没有任何关联关系，但他们之间有先后顺序关系列表是一种容器列表是序列的一种列表是可以被改变的序列Python中的序列类型简介（sequence）字符串（str）列表（list）元组（tuple）字节串（bytes）字节数组（bytearray）创建空列表的字面值L=[]#L绑定空列表创建非空列表：L=[1,’two’,3,
Python密码学：cryptography库零度° python python 密码学
在数字时代，确保数据的安全性和隐私至关重要。Python中的cryptography库是一个全面的包，为Python开发者提供了密码学原语和配方。它支持高级配方和常见密码学算法的低级接口。cryptography库概述cryptography库旨在易于使用且默认安全。它包括各种密码学操作的高级和低级API，如：对称加密非对称加密哈希函数消息认证码（MAC）数字签名密钥管理cryptography库
(python)保障信息安全的加密库-cryptography Marst·Zhang 基础知识实用工具 python
前言cryptography是一个广泛使用的Python加密库，提供了各种加密、哈希和签名算法的实现。它支持多种加密算法，如AES、RSA、ECC等，以及哈希函数（如SHA-256、SHA-384等）和数字签名算法(如DSA、ECDSA等).目录常见用途密码学函数主要功能优点缺点总结常见用途数据加密使用对称加密算法（如AES）对数据进行加密，确保数据在传输或存储过程中的机密性。数字签名生成和验证数
R.E.D.算法：革新文本分类的半监督学习新范式真智AI 算法 r语言分类人工智能学习
随着大型语言模型（LLMs）在解决问题方面的应用进入新时代，只有少数问题仍然存在不尽如人意的解决方案。大多数分类问题（在概念验证层面）可以通过良好的提示工程技术和自适应的上下文学习（ICL）示例，利用LLMs以70-90%的精确度/F1分数来解决。当您希望持续实现高于此水平的性能时——当提示工程不再足够时，会发生什么？分类难题文本分类是监督学习中最古老且最易理解的示例之一。鉴于这一前提，构建能够处
Python文件加密库之cryptography使用详解 Rocky006 python 开发语言
概要在现代信息社会中，数据的安全性变得越来越重要。为了保护敏感信息，文件加密技术被广泛应用。Python的cryptography库提供了强大的加密功能，可以轻松实现文件加密和解密。本文将详细介绍如何使用cryptography库进行文件加密，包含具体的示例代码。cryptography库简介cryptography是Python中一个功能强大且易用的加密库，提供了对称加密、非对称加密、哈希算法、
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本