Leetcode72-编辑距离,DP经典回味,深入分析

20201_022201canvas.png

这是一道相当经典的动态规划问题,最初做这道题的时候,还是在大学,当时见到这题一头雾水,看了别人的解析还是不太理解,而且看状态方程时,仅仅是看到了状态的方程的 “形”,不懂每个状态方程的本质是什么。
如今再做时,很快就理解了。废话有点多,不过认真看下去,相信你会理解的更深一些。
在做动态规划时,往往开的dp数组,有的题是原始数据长度 + 1,有的不加一

  int sovle(int n) {
     //n可以理解为题目给的原始数组长度,比如斐波那契数列数列,n 表示 第 n 个值是多少
    //然后根据 n 毫无犹豫的 定义 dp数组
    int[] dp = new int[n];
   //有的题目则是如下形式的
   int[] dp = new int[n+1];
  }

我觉得要想对一个dp状态转移方程理解更深刻,就首先对dp数组的定义理解透彻,包括dp数组长度是+1还是-1。
体会到了这一点,不管你看别人的题解还是自己想dp方程都能在短时间内把握要点。

拿这道题来说,状态方程为 dp[i][j],i, j 分别对应 word1,word2两个字符串的下标。
dp数组意思为:将 word1 i 个字符 替换成 word2 j个字符,所需的最少步数。
注意这里的 “前” 字,理解了这个字,整个dp转移方程你就掌握了最精髓的一部分。
对于本题来说:

  int len1 = word1.length();
  int len2 = word2.length();
  /** 
    如果定义成 len1 len2,就会有问题。数组遍历的下标范围是 [0...len1-1]  [0...len2-1 ]
    假设此时有这样两个单词 
    word1:  "abcde"
    word2:  "abc"
    同时遍历到两个字符串的最后一个位置时,根据dp数组定义可得:
    word1的前4个字符 变成 word2的前2个字符,所需的步数。
    这时问题出现了,len(word1) = 5, len(word2) = 3, 遍历到最后一个位置是不是都少了1个字符,因为是下标所以取不到完整数组长度。正确的定义应该是:word1的前5个字符 变成 word2的前三个字符,所需的最小步数。
因此正确的定义是:  int[][]  dp = new int[len1+1][len2+1];
  **/
 int[][] dp = new int[len1][len2];

步入正题,构建dp状态方程
1. 插入一个字符
2. 删除一个字符
3. 替换一个字符
三个操作分别对应三个dp状态方程。根据dp数组定义,word1 i 个字符 替换成 word2 j个字符,所需的最少步数。
假设现在遍历到了 word1的 i 位置,word2的 j 位置。

  1. 如果 word1[i] == word2[j],则 dp[i][j] = dp[i-1][j-1] + 0,因为当前位置两个字符相等,不需要任何操作,状态可直接由前一个状态转移而来。
  2. 如果 word1[i] == word2[j],要分三种情况讨论,即,是插入 删除 or 替换
 word1:  - - - s
 word2:  - - e
word1[3] != word2[2]
插入:  
     在word1后插入一个字符 e, 即 word1:- - - s e,就可以与word2最后一个字符匹配了。word1插入一个字符 e 之后,与word2最后一个位置的 相抵消了。
这时的状态方程为: dp[i][j] = dp[i][j-1] + 1。为什么 是 j-1? 因为 i 插入的那个字符与 j  位置的字符抵消了。
删除:
     因为 i 位置 与 j  位置 不匹配,这时也可以选择将 i  位置删除,有的人可能会问,既然不匹配,为什么不删除 j 位置呢? 这时回到dp数组的本身含义:将 word1前 i 个 替换成word2 前j个
。 前者 即 word1属于主动做事情的一方,所以删除 i  位置,这时状态方程为:  dp[i][j] = dp[i-1][j] + 1。加1表示,进行了一次删除操作。
插入:
    可将 word1的  i 位置字符替换成  j 位置的e, 这样两个位置就匹配了:dp[i][j] = dp[i-1][j-1] + 1。

具体细节参见源码:

public int minDistance(String word1, String word2) {
        int len1 = word1.length();
        int len2 = word2.length();
        
        if(len1*len2 == 0)
            return len1+len2;
        
        int dp[][] = new int[len1+ 1][len2+1];
        
        /**
         从有到无
         初始化条件:将word1的前 i个字符替换成word2的 前0个字符所需要的步数
         即:在word1中进行删除操作
        **/
        for(int i = 0; i < len1 + 1; i++) {
            dp[i][0] = i;
        }
        //添加操作  从无到有 
        for(int j = 0; j < len2 + 1; j++) {
            dp[0][j] = j;
        }
        
        for(int i = 1; i < len1 + 1; i++) {
            for(int j = 1; j < len2 + 1; j++) {
                int insert = dp[i][j-1] + 1;
                int delete = dp[i-1][j] + 1;
                int replace = dp[i-1][j-1];
                
                if(word1.charAt(i-1) != word2.charAt(j-1)) {
                    replace += 1;
                }
                dp[i][j] = Math.min(insert, Math.min(delete, replace));
            }
        }
        return dp[len1][len2];
        
    }

你可能感兴趣的:(Leetcode72-编辑距离,DP经典回味,深入分析)