最近在学算法,这个动态规划题目比较有意思,似乎现在的机器翻译和语音识别也会用到它。也有一定的难度,在leetcode上是困难难度。
给定两个单词 word1 和 word2,计算出将 word1 转换成 word2 所使用的最少操作数 。
你可以对一个单词进行如下三种操作:
插入一个字符 删除一个字符 替换一个字符
示例 1:
输入: word1 = “horse”, word2 = “ros”
输出: 3
解释:
horse -> rorse (将 'h’替换为 ‘r’)
rorse -> rose (删除 ‘r’)
rose -> ros (删除 ‘e’)示例 2:
输入: word1 = “intention”, word2 = “execution”
输出: 5
解释:
intention ->inention (删除 ‘t’)
inention -> enention (将 ‘i’ 替换为 ‘e’)
enention ->exention (将 ‘n’ 替换为 ‘x’)
exention -> exection (将 ‘n’ 替换为 ‘c’)
exection -> execution (插入 ‘u’)来源:力扣(LeetCode) 链接:https://leetcode-cn.com/problems/edit-distance
著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。
这道题可以用动态规划解决。
dp[i][j]
代表word1
的前i
个字符和word2
的前j
个字符之间的最小编辑距离。(后文的i
指的是word1
中的字符,j
指的是word2
中的字符)。
dp[0][j] = j
是将word1
为空时,变换为word2
的最少步数,全都是插入操作。dp[i][0] = i
是将word2
为空时,word1
变换为word2
的最少步数,全都是删除操作。当我们获得dp[i-1][j]
, dp[i][j-1]
和dp[i-1][j-1]
的值之后,就可以计算出dp[i][j]
了:
dp[i-1][j]
到dp[i][j]
,是删除了第i
个字符;dp[i][j-1]
到dp[i][j]
,是插入了第j
个字符;dp[i-1][j-1]
到dp[i][j]
,是将第i
个字符替换为了第j
个字符。此时,根据第i
个字符与第j
个字符 是否相等,可得到递推方程如下:
word1[i] == word2[j]
时,不用替换了,dp[i][j] = dp[i-1][j-1]
;word1[i] != word2[j]
时,操作数加一,dp[i][j] = 1 + min{ dp[i-1][j], dp[i][j-1], dp[i-1][j-1] }
。class Solution {
public:
int minDistance(string word1, string word2) {
int len1 = word1.size(), len2 = word2.size();
// 初始化dp数组,添加了word1与word2的空字符串状态==>>长度加1
vector<vector<int>> dp(len1 + 1, vector<int>(len2 + 1, 0));
// word2为空时,全是删除
for (int i=0; i<=len1; i++) {
dp[i][0] = i;
}
// word1为空时,全是插入
for (int j=0; j<=len2; j++) {
dp[0][j] = j;
}
for (int i=1; i<=len1; i++) {
for (int j=1; j<=len2; j++) {
if (word1[i - 1] == word2[j - 1]) {
dp[i][j] = dp[i-1][j-1];
} else {
dp[i][j] = 1 + min(dp[i-1][j], min(dp[i][j-1], dp[i-1][j-1]));
}
}
}
// for (int i=0; i<=len1; i++) {
// for (int j=0; j<=len2; j++) {
// cout << dp[i][j] << " ";
// }
// cout << endl;
// }
return dp[len1][len2];
}
};