【leetcode】Regular Expression Matching (hard) ★

Implement regular expression matching with support for '.' and '*'.

'.' Matches any single character.

'*' Matches zero or more of the preceding element.



The matching should cover the entire input string (not partial).



The function prototype should be:

bool isMatch(const char *s, const char *p)



Some examples:

isMatch("aa","a") → false

isMatch("aa","aa") → true

isMatch("aaa","aa") → false

isMatch("aa", "a*") → true

isMatch("aa", ".*") → true

isMatch("ab", ".*") → true

isMatch("aab", "c*a*b") → true

题目是让我们自己实现正则表达式中* 和 . 的匹配功能 

. 匹配任意的一个字符

*  如a*是一个整体,表示有 0个a 或 1个a 或 2个a 或..... 任意多个a 

如果是 .*可以匹配 0个任意字符 或一个任意字符 或 任意多个任意字符 但这些字符必须是相同的。

 

思路:

开始觉的跟wildcard matching差不多,后来发现不一样,wildcard matching里面*可以随意匹配,所以当遇到后面一个*之后,前面的*就可以不用管了。

而现在这道题,*只能匹配重复的字符,所以必须考虑多个*表示的范围,所以,问题的关键就在于每个 x*都表示了多少字符。

很容易想到递归,可是写完递归后我在提交的时候各种特殊情况都通不过,每次都对特殊情况加代码,结果越加越长,加到70行仍然没AC。我默默的知道我的思路肯定是有问题了...

 

看大神的代码,我终于知道问题在哪了。

因为我每次都是一个字符一个字符判断的,这样遇到*之后还需要判断很多*前一个字符的情况。

但大神每次都是针对p 2个字符为一组来判断的 根据*(p+1) == '*' 来区分不同的情况,一下子就容易了很多。

还有,大神的代码凡是遇到返回值是真的情况就返回答案,不再递归

class Solution {

public:

    bool matchFirst(const char *s, const char *p){

        return (*p == *s || (*p == '.' && *s != '\0'));

    }



  bool isMatch(const char *s, const char *p) {

      if (*p == '\0') return *s == '\0';  //empty

  

      if (*(p + 1) != '*') {//without *

          if(!matchFirst(s,p)) return false;

          return isMatch(s + 1, p + 1);

      } else { //next: with a *

          if(isMatch(s, p + 2)) return true;    //try the length of 0

          while ( matchFirst(s,p) )       //try all possible lengths 

              if (isMatch(++s, p + 2))return true;

      }

  }

};

 

动态规划的方法:

用dp[i][j]表示 s[0 ~ i-1] 与 p[0 ~ j - 1] 匹配的情况, 可以匹配时true 反之为 false

那么dp[i][j]只会在以下4种情况下为真:

①dp[i-1][j-1]为真,并且s[i-1]与p[j-1]匹配

②dp[i][j-1]为真,并且p[j-1]=='*'

③dp[i-1][j]为真, 并且p[j-1]=='*' 并且 p[j-2]与s[i-1]匹配

④dp[i][j-2]为真,并且p[j-1]=='*'

边界:

dp[0][0] 都是空的肯定为真

dp[i][0] 字符串非空,匹配串为空,肯定为假

dp[0][j] 字符串空,匹配串非空,若p[j-1] == '*' 并且 dp[0][j-2]为真 的情况下 为真

代码是我参照大神的思路写的。

class Solution {

public:

bool isMatch(const char *s, const char *p)

    {

        int m = strlen(s);

        int n = strlen(p);

        vector<vector<bool>> dp(m+1, vector<bool>(n+1, false));

        dp[0][0] = true;

        for(int i = 1; i <= m; i++)

        {

            dp[i][0] = false;

        }

        for(int j = 1; j <= n; j++)

        {

            dp[0][j] = (p[j-1] == '*') && (j >= 2) && dp[0][j-2]; //第j个字符在p中的下标是j-1,因为是从0开始的

        }

        for(int i = 1; i <= m; i++)

        {

            for(int j = 1; j <= n; j++)

            {

                dp[i][j] = (dp[i-1][j-1] && (s[i-1] == p[j-1] || p[j-1] == '.'))

                       ||  (dp[i][j-1] && (p[j-1] == '*'))

                       ||  (dp[i-1][j] && p[j-1] == '*' && ((j >= 2) && s[i-1] == p[j-2] || p[j-2] == '.'))

                       ||  ((j >= 2) && dp[i][j-2] && (p[j-1] == '*'));

            }

        }

        return dp[m][n];

    }

};

 

你可能感兴趣的:(【leetcode】Regular Expression Matching (hard) ★)