给定两个字符串 text1 和 text2,返回这两个字符串的最长公共子序列。
一个字符串的 子序列 是指这样一个新的字符串:它是由原字符串在不改变字符的相对顺序的情况下删除某些字符(也可以不删除任何字符)后组成的新字符串。
例如,“ace” 是 “abcde” 的子序列,但 “aec” 不是 “abcde” 的子序列。两个字符串的「公共子序列」是这两个字符串所共同拥有的子序列。
若这两个字符串没有公共子序列,则返回 0。
示例 1:
输入:text1 = "abcde", text2 = "ace"
输出:3
解释:最长公共子序列是 "ace",它的长度为 3。
示例 2:
输入:text1 = "abc", text2 = "abc"
输出:3
解释:最长公共子序列是 "abc",它的长度为 3。
示例 3:
输入:text1 = "abc", text2 = "def"
输出:0
解释:两个字符串没有公共子序列,返回 0。
提示:
1 <= text1.length <= 1000
1 <= text2.length <= 1000
输入的字符串只含有小写英文字符。
最长公共子序列又是一个典型的需要两个维度进行动态规划的问题,因为我们要在两个字符串中进行扫描。
LCS(m, n)表示第一个字符串S1[0…m]从0到m的字符和第二个字符串S2[0…n]从0到n的字符的最长公共子序列的长度。为了求出LCS(m, n),最关键的是比较S1[m]和S2[n]这两个字符,对于这两个字符有两种情况:
可参考下图示例更清晰:
这一版初始化的memo是m行n列,第一行和第一列的值要额外考虑。
class Solution:
def longestCommonSubsequence(self, text1: str, text2: str) -> int:
m, n = len(text1), len(text2)
if m == 0 and n == 0:
return 0
if m == 0 and n != 0:
return n
if m != 0 and n == 0:
return m
memo = [[0 for j in range(n)] for i in range(m)]
memo[0][0] = 1 if text1[0] == text2[0] else 0
for j in range(1, n):
memo[0][j] = 1 if text1[0] == text2[j] else memo[0][j - 1]
for i in range(1, m):
memo[i][0] = 1 if text1[i] == text2[0] else memo[i - 1][0]
for i in range(1, m):
for j in range(1, n):
memo[i][j] = 1 + memo[i - 1][j - 1] if text1[i] == text2[j] else max(memo[i - 1][j], memo[i][j - 1])
return memo[m-1][n-1]
这一版初始化的memo是 m+1行n+1列,第一行和第一列全为0,不用额外考虑,双重循环内部才是重点。
class Solution:
def longestCommonSubsequence(self, text1, text2):
m, n = len(text1), len(text2)
if m == 0 and n == 0:
return 0
if m == 0 and n != 0:
return n
if m != 0 and n == 0:
return m
memo = [[0 for j in range(n + 1)] for i in range(m + 1)]
for i in range(1, m + 1):
for j in range(1, n + 1):
memo[i][j] = 1 + memo[i - 1][j - 1] if text1[i - 1] == text2[j - 1] else max(memo[i - 1][j], memo[i][j - 1])
for x in memo:
print(x)
return memo[m][n]
k = Solution()
text1 = 'AEBD'
text2 = 'ABCD'
print(k.longestCommonSubsequence(text1, text2))
输出:
[0, 0, 0, 0, 0]
[0, 1, 1, 1, 1]
[0, 1, 1, 1, 1]
[0, 1, 2, 2, 2]
[0, 1, 2, 2, 3]
3