Implement regular expression matching with support for '.'
and '*'
.
'.' Matches any single character.
'*' Matches zero or more of the preceding element.
The matching should cover the entire input string (not partial).
The function prototype should be:
bool isMatch(const char *s, const char *p)
Some examples:
isMatch("aa","a") → false
isMatch("aa","aa") → true
isMatch("aaa","aa") → false
isMatch("aa", "a*") → true
isMatch("aa", ".*") → true
isMatch("ab", ".*") → true
isMatch("aab", "c*a*b") → true
解题思路
时间复杂度: O(nm)
字符串比较一般都可以先想到动态规划,此题只需要计算一个n*m
的矩阵即可求解,所以复杂度是O(nm)
。(n
和m
分别是p
和s
的长度)
1、n*m
的矩阵用于记录正则式p
从开头到下标i结束的子串与目标字符串s
从开头到下标i结束的子串的比较结果。
2、基于下标小的元素以及比对字符可以计算出下标大的元素,从而填满整个矩阵。
3、矩阵计算完毕后,返回对应元素即可。
4、矩阵的元素是怎么计算的,用一个例子来说明,如下图:
- 横向是目标字符串
s
,纵向是正则式p
。定义该矩阵为C
- 初始化第一行。当
s
和p
均为空时,匹配正确,所以C[0][0] = 1
。当p
为空串而s
不为空时,一定匹配错误,所以第一行其他列均赋值为0。 - 初始化第一列。第一列表示s为空串,这种情况只有当p中出现*时匹配结果可能为真,如图中第一列标红的位置。当p中出现
*
时,该元素同一列上前两个元素任意一个为真,它就为真。具体原因在4.中解释,所以C[2][0] = C[0][0]
。 - 计算其他元素。有如下情况:
p[i] == p[j] || p[i] == '.': // 该元素对应子串匹配正确
C[i + 1][j + 1] = C[i][j]
p[i] == '*': // x*代表字符x出现 0 次、1 次、1次以上。
C[i + 1][j + 1] = C[i - 1][j + 1] // x*代表x出现0次时,匹配结果等同于“x*”没出现过
//即当前 p 的子串向前跳两个字符与当前 s 的子串的匹配结果
C[i + 1][j + 1] = C[i][j + 1] // x*代表x出现1次时,匹配结果等同于没有该星号,
// 以前一个字符为结尾的 p 的子串与 s 的子串的匹配结果。
C[i + 1][j + 1] = C[i + 1][j] // x*代表x出现1次以上时,只要当前 s 的子串的结尾字
// 符与 p 的子串的 * 的前一个字符(别忘了'.'的情况)能匹配上,
// 当前匹配结果就等同于以 * 前一位字符结尾的 p 子串与 s 子串的匹配结果。
简单来说,p[i] == '*'
的情况只需要考虑如图中的反向“L”区域,其他位置出现 1 则当前位置为 1 ,否则为 0 。
解题源码
#include
#include
#include
using namespace std;
class Solution {
public:
bool isMatch(string s, string p) {
int m = s.length(), n = p.length();
vector> check(n + 1, vector(m + 1, false));// 用 false 初始化所有元素
// 初始化第一个元素,其他第一行元素已经初始化为 false 了
check[0][0] = true;
// 初始化第一列
for (int i = 0; i = 1 && check[i - 1][0] || i >= 0 && check[i][0];
}
}
// 计算其他元素
for (int i = 0; i < n; ++i) {
for (int j = 0; j < m; ++j) {
if (p[i] == '.' || p[i] == s[j]) check[i + 1][j + 1] = check[i][j];
else if (p[i] == '*') {
check[i + 1][j + 1] = check[i - 1][j + 1] || check[i][j + 1] || (p[i - 1] == s[j] || p[i - 1] == '.') && check[i + 1][j];
}
}
}
// 返回结果
return check[n][m];
}
};
参考
Discuss