最小编辑距离

最近在学算法,这个动态规划题目比较有意思,似乎现在的机器翻译和语音识别也会用到它。也有一定的难度,在leetcode上是困难难度。

题目

给定两个单词 word1 和 word2,计算出将 word1 转换成 word2 所使用的最少操作数 。

你可以对一个单词进行如下三种操作:

插入一个字符 删除一个字符 替换一个字符

示例 1:
输入: word1 = “horse”, word2 = “ros”
输出: 3
解释:
horse -> rorse (将 'h’替换为 ‘r’)
rorse -> rose (删除 ‘r’)
rose -> ros (删除 ‘e’)

示例 2:
输入: word1 = “intention”, word2 = “execution”
输出: 5
解释:
intention ->inention (删除 ‘t’)
inention -> enention (将 ‘i’ 替换为 ‘e’)
enention ->exention (将 ‘n’ 替换为 ‘x’)
exention -> exection (将 ‘n’ 替换为 ‘c’)
exection -> execution (插入 ‘u’)

来源:力扣(LeetCode) 链接:https://leetcode-cn.com/problems/edit-distance
著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。

思路

这道题可以用动态规划解决。
dp[i][j]代表word1的前i个字符和word2的前j个字符之间的最小编辑距离。(后文的i指的是word1中的字符,j指的是word2中的字符)。

初始条件

  1. dp[0][j] = j是将word1为空时,变换为word2的最少步数,全都是插入操作。
  2. dp[i][0] = i是将word2为空时,word1变换为word2的最少步数,全都是删除操作。

状态转移方程

当我们获得dp[i-1][j], dp[i][j-1]dp[i-1][j-1]的值之后,就可以计算出dp[i][j]了:

  1. dp[i-1][j]dp[i][j],是删除了第i个字符;
  2. dp[i][j-1]dp[i][j],是插入了第j个字符;
  3. dp[i-1][j-1]dp[i][j],是将第i个字符替换为了第j个字符。

此时,根据第i个字符与第j个字符 是否相等,可得到递推方程如下:

  1. word1[i] == word2[j]时,不用替换了,dp[i][j] = dp[i-1][j-1]
  2. word1[i] != word2[j]时,操作数加一,dp[i][j] = 1 + min{ dp[i-1][j], dp[i][j-1], dp[i-1][j-1] }

代码

class Solution {
public:
    int minDistance(string word1, string word2) {
        int len1 = word1.size(), len2 = word2.size();
        // 初始化dp数组,添加了word1与word2的空字符串状态==>>长度加1
        vector<vector<int>> dp(len1 + 1, vector<int>(len2 + 1, 0));
        
        // word2为空时,全是删除
        for (int i=0; i<=len1; i++) {
            dp[i][0] = i;
        }
        
        // word1为空时,全是插入
        for (int j=0; j<=len2; j++) {
            dp[0][j] = j;
        }
        
        for (int i=1; i<=len1; i++) {
            for (int j=1; j<=len2; j++) {
                if (word1[i - 1] == word2[j - 1]) {
                    dp[i][j] = dp[i-1][j-1];
                } else {
                    dp[i][j] = 1 + min(dp[i-1][j], min(dp[i][j-1], dp[i-1][j-1]));
                }
            }
        }
        
        // for (int i=0; i<=len1; i++) {
        //     for (int j=0; j<=len2; j++) {
        //         cout << dp[i][j] << " ";
        //     }
        //     cout << endl;
        // }
        
        return dp[len1][len2];
    }
};

你可能感兴趣的:(算法训练)