递归与动态规划---最长公共子序列问题

【题目】

  给定两个字符串str1和str2,返回两个字符串的最长公共子序列。

【举例】

  str1 = “1A2C3D4B56”,str2 = “B1D23CA45B6A”.
  “123456”或者“12C4B6”都是最长公共子序列,返回哪一个都行

【基本思路】

如果str1和str2的长度分别为N,M,生成N×M的矩阵dp,dp[i][j]的含义是str1[0…i]与str2[0…j]的最长公共子序列,dp[i][j]的计算如下:

  1. 矩阵的第一行表示str1[0]与str2[0…j]的最长公共子序列问题,当str1[0]与str2[j]相等时,其列以及之后的列都设置为1.

  2. 矩阵的第一列同上,当str2[0]与str1[i]相等时,其行以及之后的行都设置为1.

  3. 矩阵的其他位置,dp[i][j]的值可能来自以下的三种情况:
     可能是dp[i-1][j], 代表str1[0…i-1]与str2[0…j]的最长公共子序列长度。
     可能是dp[i][j-1], 代表str1[0…i]与str2[0…j-1]的最长公共子序列长度。
     如果str1[i] == str2[j],还可能是dp[i-1][j-1] + 1。
    选择三种情况中最大的作为dp[i][j]的值

接下来根据str1、str2和dp表就可以得到最长的公共子序列。具体方法如下:

   从dp矩阵的右下角开始,如果该位置的值等于相邻左边的值,左移;如果该位置的值等于相邻上方的值,上移;如果既不能左移也不能上移,此处的值便是最长公共子序列的末尾值,保存此位置的值,然后向左上角移动。按照上述步骤依次移动便可以得到最长的公共子序列。

下面是使用python3.5实现的代码

#最长公共子序列问题
def maxCommonSubSerial(str1, str2):
    def getdp(str1, str2):
        dp = [[0 for i in range(len(str2))] for j in range(len(str1))]
        dp[0][0] = 1 if str1[0] == str2[0] else 0
        for i in range(1, len(str2)):
            dp[0][i] = max(dp[0][i-1], 1 if str1[0] == str2[i] else 0)
        for i in range(1, len(str1)):
            dp[i][0] = max(dp[i-1][0], 1 if str1[i] == str2[0] else 0)
        for i in range(1, len(str1)):
            for j in range(1, len(str2)):
                dp[i][j] = max(dp[i-1][j], dp[i][j-1])
                if str1[i] == str2[j]:
                    dp[i][j] = max(dp[i-1][j-1]+1, dp[i][j])
        return dp


    if str1 == None or str2 == None or str1 == "" or str2 == "":
        return ""
    dp = getdp(str1, str2)
    m = len(str2) - 1
    n = len(str1) - 1
    res = [0 for i in range(dp[n][m])]
    index = dp[n][m] - 1
    while index >= 0:
        if n > 0 and dp[n][m] == dp[n-1][m]:
            n -= 1
        elif m > 0 and dp[n][m] == dp[n][m-1]:
            m -= 1
        else:
            res[index] = str1[n]
            index -= 1
            m -= 1
            n -= 1
    return ''.join(res)

你可能感兴趣的:(数据结构与算法)