给定一个字符串 (s) 和一个字符模式 § ,实现一个支持 ‘?’ 和 ‘*’ 的通配符匹配。
'?' 可以匹配任何单个字符。
'*' 可以匹配任意字符串(包括空字符串)。
两个字符串完全匹配才算匹配成功。
说明:
s 可能为空,且只包含从 a-z 的小写字母。
p 可能为空,且只包含从 a-z 的小写字母,以及字符 ? 和 *。
示例 1:
输入:
s = "aa"
p = "a"
输出: false
解释: “a” 无法匹配 “aa” 整个字符串。
示例 2:
输入:
s = "aa"
p = "*"
输出: true
解释: ‘*’ 可以匹配任意字符串。
示例 3:
输入:
s = "cb"
p = "?a"
输出: false
解释: ‘?’ 可以匹配 ‘c’, 但第二个 ‘a’ 无法匹配 ‘b’。
示例 4:
输入:
s = "adceb"
p = "*a*b"
输出: true
解释: 第一个 ‘’ 可以匹配空字符串, 第二个 '’ 可以匹配字符串 “dce”.
示例 5:
输入:
s = "acdcb"
p = "a*c?b"
输出: false
在给定的模式 p 中,只会有三种类型的字符出现:
其中「小写字母」和「问号」的匹配是确定的,而「星号」的匹配是不确定的,因此我们需要枚举所有的匹配情况。为了减少重复枚举,我们可以使用动态规划来解决本题。
我们用 dp[i][j] 表示字符串 s 的前 i 个字符和模式 p 的前 j 个字符是否能匹配。
在进行状态转移时,我们可以考虑模式 p 的第 j 个字符 pj,与之对应的是字符串 s 中的第 i 个字符 si:
最终的状态转移方程如下:
d p [ i ] [ j ] = { ( s i 与 p j 相 同 ) ∧ d p [ i − 1 ] [ j − 1 ] , p j 是 小 写 字 母 d p [ i − 1 ] [ j − 1 ] , p j 是 问 号 d p [ i ] [ j − 1 ] ∨ d p [ i − 1 ] [ j ] , p j 是 星 号 dp[i][j]= \begin{cases} (s_i与p_j相同)∧dp[i−1][j−1], & p_j 是小写字母 \\ dp[i−1][j−1], & p_j 是问号 \\ dp[i][j−1]∨dp[i−1][j], & p_j 是星号 \end{cases} dp[i][j]=⎩⎪⎨⎪⎧(si与pj相同)∧dp[i−1][j−1],dp[i−1][j−1],dp[i][j−1]∨dp[i−1][j],pj是小写字母pj是问号pj是星号
我们也可以将前两种转移进行归纳:
d p [ i ] [ j ] = { d p [ i − 1 ] [ j − 1 ] , s i 与 p j 相 同 或 者 p j 是 问 号 d p [ i ] [ j − 1 ] ∨ d p [ i − 1 ] [ j ] , p j 是 星 号 F a l s e , 其 它 情 况 dp[i][j]= \begin{cases} dp[i−1][j−1], & s_i与p_j相同或者p_j 是问号 \\ dp[i][j−1]∨dp[i−1][j], & p_j 是星号 \\ False, & 其它情况 \end{cases} dp[i][j]=⎩⎪⎨⎪⎧dp[i−1][j−1],dp[i][j−1]∨dp[i−1][j],False,si与pj相同或者pj是问号pj是星号其它情况
细节
只有确定了边界条件,才能进行动态规划。在上述的状态转移方程中,由于 dp[i][j] 对应着 s 的前 i 个字符和模式 p 的前 j 个字符,因此所有的 dp[0][j] 和 dp[i][0] 都是边界条件,因为它们涉及到空字符串或者空模式的情况,这是我们在状态转移方程中没有考虑到的:
dp[0][0]=True,即当字符串 s 和模式 p 均为空时,匹配成功;
dp[i][0]=False,即空模式无法匹配非空字符串;
dp[0][j] 需要分情况讨论:因为星号才能匹配空字符串,所以只有当模式 p 的前 j 个字符均为星号时,dp[0][j] 才为真。
我们可以发现,dp[i][0] 的值恒为假,dp[0][j] 在 j 大于模式 p 的开头出现的星号字符个数之后,值也恒为假,而 dp[i][j] 的默认值(其它情况)也为假,因此在对动态规划的数组初始化时,我们就可以将所有的状态初始化为False,减少状态转移的代码编写难度。
最终的答案即为 dp[m][n],其中 m 和 n 分别是字符串 s 和模式 p 的长度。需要注意的是,由于大部分语言中字符串的下标从 0 开始,因此 si 和 pj 分别对应着 s[i−1] 和 p[j−1]。
def isMatch_dp(self, s: str, p: str) -> bool:
lengthS, lengthP = len(s), len(p)
dp = [[False] * (lengthP + 1) for _ in range(lengthS + 1)]
dp[0][0] = True
for i in range(1, lengthP + 1):
if p[i - 1] == '*':
dp[0][i] = True
else:
break
for i in range(1, lengthS + 1):
for j in range(1, lengthP + 1):
if p[j - 1] == '*':
dp[i][j] = dp[i][j - 1] or dp[i - 1][j]
elif p[j - 1] == '?' or s[i - 1] == p[j - 1]:
dp[i][j] = dp[i - 1][j - 1]
return dp[lengthS][lengthP]
时间复杂度:O(mn),其中 m 和 n 分别是字符串 s 和模式 p 的长度。
空间复杂度:O(mn),即为存储所有 (m+1)(n+1) 个状态需要的空间。此外,在状态转移方程中,由于 dp[i][j] 只会从 dp[i][…] 以及 dp[i−1][…] 转移而来,因此我们可以使用滚动数组对空间进行优化,即用两个长度为 n+1 的一维数组代替整个二维数组进行状态转移,空间复杂度为 O(n)。