10. Regular Expression Matching

Hard
fb tag
https://www.youtube.com/watch?v=DqhPJ8MzDKM
此题简称为"p中找s", 用dp做。
这道题一开始我naive地觉得如果p.length() < s.length()则一定return false. 然而*的含义是零个或多个它前面的字符,所以完全可能p的长度没有s长,因为*可以控制字符数. 这里我们assume *只可能出现在charAt(i) i >= 1.
dp[i][j]表示s.substring(0, i)跟p.substring(0, j)是不是匹配,也就是s里面前i个字符跟p里面前j个字符是否匹配。
首先dp[0][0] = true,因为两个空字符是相匹配的。
至于我们为什么要单独把dp[0][i]单独拿出来初始化,是因为后面当i >= 1, j >= 1的时候,我们要用到dp[i-1][j-1]这样的前面的状态,而dp[0][something]带入到这里的话就会越界。同样很intuitive的我们可以知道dp[something][0] = false, 因为在空字符里面你怎么找也找不到s. 所以就不单独initialize了。

那么中间的部分,我们分两种大类讨论。

  • 斜线(对角线)递推
  • 直线(左到右,上到下)递推

斜线递推是说当p.charAt(j-1) == s.charAt(i-1)时,或者p.charAt(j-1) == '.'时,我们的dp[i][j] = dp[i-1][j-1], 就相当于一条斜线从左上角i-1,j-1穿到了i,j.
直线递推是当p.charAt(j-1) == *时,我们可以选择让它代表前面的字符一共0个或者多个。当它代表前面的字符零个的时候,我们就相当于把p删掉了后面两个字符,所以dp[i][j] = dp[i][j-2]. 当它代表前面的字符有多个的时候,我们要考虑一种特殊情况,就是当p.charAt(j-2) == s.charAt(i-1), 也就是p倒数第二个字符(倒数第一个是*)等于s的倒数第一个字符,或者p的倒数第二个字符干脆就是任意字符.,这种情况dp[i][j] = dp[i-1][j], 也就是如果这时候s除去最后一个字符剩下的部分跟p匹配的话,因为*可以让p继续添加一个当前最后的字符,而这个字符又刚好等于s的最后一个字符,所以他们会继续匹配,因此此时dp[i][j] = dp[i-1][j]. 比如p = ab*, s = abb, 这时候就可以得到dp[3][3] = dp[2][3]. 但是这种情况我们不能直接就不考虑 *代表零个了,而是只要其中一种匹配就return true.
这个test case可以测出来必须两个都写:
"aaa"
"ab*a*c*a"

class Solution {
    public boolean isMatch(String s, String p) {
        if (p == null || s == null){
            return false;
        }   
        //"aaa"
        //".*"
        boolean[][] dp = new boolean[s.length() + 1][p.length() + 1];
        //dp[i][j]: s.substring(0, i) matches with p.substring(0, j); i,j means number of characters,not index.
        dp[0][0] = true; //"" matches ""
        
        for(int i = 1; i < p.length() + 1; i++){
            if (p.charAt(i-1) == '*'){
                dp[0][i] = dp[0][i-2];
            }
        }
        
        for (int i = 1; i < s.length() + 1; i++){
            for (int j = 1; j < p.length() + 1; j++){
                if (s.charAt(i-1) == p.charAt(j-1) || p.charAt(j-1) == '.'){
                    dp[i][j] = dp[i-1][j-1];
                } else if (p.charAt(j-1) == '*'){
                    //"*" could means zero or multiple
                    if (p.charAt(j-2) == s.charAt(i-1) || p.charAt(j-2) == '.'){
                        dp[i][j] = dp[i-1][j] || dp[i][j-2];
                    } else {
                        dp[i][j] = dp[i][j-2];
                    }
                }                
            }
        }
        return dp[s.length()][p.length()];
    }
}

你可能感兴趣的:(10. Regular Expression Matching)