动态规划 Leetcode 72 Edit Distance(编辑距离)

题目

给你两个单词 word1 和 word2,请你计算出将 word1 转换成 word2 所使用的最少操作数 。

你可以对一个单词进行如下三种操作:

1. 插入一个字符

2. 删除一个字符

3. 替换一个字符

示例 1:

输入:word1 = "horse", word2 = "ros"

输出:3

解释:

horse -> rorse (将 'h' 替换为 'r')

rorse -> rose (删除 'r')

rose -> ros (删除 'e')

示例 2:

输入:word1 = "intention", word2 = "execution"

输出:5

解释:

intention -> inention (删除 't')

inention -> enention (将 'i' 替换为 'e')

enention -> exention (将 'n' 替换为 'x')

exention -> exection (将 'n' 替换为 'c')

exection -> execution (插入 'u')

链接(中文版):https://leetcode-cn.com/problems/edit-distance

链接(英文版):https://leetcode.com/problems/edit-distance

分析

编辑距离是相互的,即a到aa的编辑距离和aa到a的编辑距离相同,都是1。a到aa是通过插入操作,反之是通过删除操作。

当我们求两个字符串的编辑距离时,分两种情况。

情况一:两个字符串最后一个字符相同

例如求aaasbbs的编辑距离,两个字符串最后的字符都是s,则这两个字符串的编辑距离等于把最后的s都去掉,即aaa和bb的编辑距离,因为aaabb都加上了一个相同的字符s,编辑距离不变。

情况二:两个字符串最后一个字符不相同

例如求aaasbbk的编辑距离,最后的字符s和k不同,此时有三条路可以求取答案,我们选择最小的即可。

第一条路:用aaa和bbk的编辑距离加1,加1是因为aaa后边还有一个s,需要多一步插入或者删除操作。

第二条路:用aaas和bb的编辑距离加1,加1是因为bb后边还有一个k,需要多一步插入或者删除操作。

第三条路:用aaa和bb的编辑距离加1,加1是因为aaa后边的sbb后边的k不同,需要多一步替换操作。

显然上述所有蓝色的编辑距离,都是问题的子集,我们用矩阵存储全部子集的答案,矩阵最右下角就是最终答案。如下图E1表示aaa和bb的编辑距离;E2表示aaa和bbk的编辑距离;E3表示aaas和bb的编辑距离。

  b b k
a      
a      
a   E1 E2
s   E3  

 

举例说明

求horse和ros的编辑距离。

为方便判断边界,我们先求出矩阵M第0行和第0列的内容。其中M[0][0]表示h和r的编辑距离,显然是1;

M[0][1]表示h和ro的编辑距离,由于h和o不同,则编辑距离就是h和r的编辑距离加1,等于2;

M[0][2]表示h和ros的编辑距离,由于h和s不同,则编辑距离就是h和ro的编辑距离加1,等于3;

M[1][0]表示ho和r的编辑距离,由于o和r不同,则编辑距离就是h和r的编辑距离加1,等于2;

M[2][0]表示hor和r的编辑距离,由于r和r相同,则编辑距离就是ho和空串的编辑距离,也就是ho的长度,等于2;

M[3][0]表示hors和r的编辑距离,由于s和r不同,则编辑距离就是hor和r的编辑距离加1,等于3;

M[4][0]表示horse和r的编辑距离,由于e和r不同,则编辑距离就是hors和r的编辑距离加1,等于4;

此时矩阵内容如下:

  r o s
h 1 2 3
o 2 x1 x2
r 2 x3 x4
s 3 x5 x6
e 4 x7 x8

 

然后按照上述讨论的情况一和情况二,按序求出x1到x8即可。

当求x1时,即M[1][1],即ho到ro的距离,由于两个末尾字符都是o,属于情况一,所以M[1][1]=M[1-1][1-1]=M[0][0]=1。

当求x2时,即M[1][2],即ho到ros的距离,由于两个末尾字符不同,属于情况二,所以M[1][2]=min(M[0][2], M[1][1], M[0][1])+1=M[1][1]+1=1+1=2。

代码

class Solution:
    def minDistance(self, word1: str, word2: str) -> int:
        len1, len2 = len(word1), len(word2)
        if len1 == 0:
            return len2
        if len2 == 0:
            return len1
        M = [[0 for _ in range(len2)] for _ in range(len1)]
        M[0][0] = 0 if word1[0] == word2[0] else 1

        for y in range(1, len1):
            M[y][0] = y if word1[y] == word2[0] else M[y-1][0] + 1

        for x in range(1, len2):
            M[0][x] = x if word2[x] == word1[0] else M[0][x-1] + 1

        for y in range(1, len1):
            for x in range(1, len2):
                if word1[y] == word2[x]:
                    M[y][x] = M[y-1][x-1]
                else:
                    M[y][x] = min(M[y-1][x-1], M[y-1][x], M[y][x-1]) + 1

        return M[-1][-1]

总结

提交结果:

关键在于找出递推关系。

你可能感兴趣的:(动态规划,Python,动态规划,dynamic,programming,equation,leetcode,python,算法)