算法题之字符串匹配问题

我最近复习一道困难程度的算法题,发现了许多有趣之处。在借鉴了他人解法后,发现从最简单的情况反推到原题是一种解锁新进阶的感觉。从递归到动态规划,思维上一步一步递进,如同一部跌宕起伏的小说,记录下来和诸君共赏之。

题目如下:

给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 '.' 和 '*' 的正则表达式匹配。

'.' 匹配任意单个字符
'*' 匹配零个或多个前面的那一个元素
所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。

说明:

s 可能为空,且只包含从 a-z 的小写字母。
p 可能为空,且只包含从 a-z 的小写字母,以及字符 . 和 *。
示例 1:

输入:
s = "aa"
p = "a"
输出: false
解释: "a" 无法匹配 "aa" 整个字符串。
示例 2:

输入:
s = "aa"
p = "a*"
输出: true
解释: 因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。
示例 3:

输入:
s = "ab"
p = ".*"
输出: true
解释: ".*" 表示可匹配零个或多个('*')任意字符('.')。
示例 4:

输入:
s = "aab"
p = "c*a*b"
输出: true
解释: 因为 '*' 表示零个或多个,这里 'c' 为 0 个, 'a' 被重复一次。因此可以匹配字符串 "aab"。
示例 5:

输入:
s = "mississippi"
p = "mis*is*p*."
输出: false

来源:力扣(LeetCode)

这是一道关于字符串匹配的问题,其中匹配字符串里面可能含有两种特殊符号「.」和「*」。

说时候刚拿到这道题的时候我很懵逼,直接动手分析到带有「*」符号的时候,感觉不同情况挺难分析下去的,甚至陷入了思维的僵局。

如果能让问题简化一下该多好呀,没错,如果我们把问题变成我们以前做过的问题或者容易做的问题,是否能从中发现新的思路?

假设问题变成:求两个纯字符串进行匹配。实现代码可以如下:

package main

func isMatch(text string, pattern string) bool {
    if pattern == "" {
        if text != "" {
            return false
        } else {
            return true
        }
    }
    first_match := false

    if pattern[0] == text[0] {
        first_match = true
    }

    return first_match && isMatch(text[1:], pattern[1:])
}

func main() {
    text := "abc"
    pattern := "ab"
    isMatch(text, pattern)
}

这里用到了递归,之所以这么处理,是为了后续迭代。
那么如果再增加一个条件,把「.」符号加上,如果是带有「.」符号的字符串去匹配一段字符串呢?

需要在实现的时候考虑第一个字节是否是该特殊符号

func isMatch2(text string, pattern string) bool {
    if pattern == "" {
        if text != "" {
            return false
        } else {
            return true
        }
    }
    first_match := false

    if pattern[0] == text[0] || pattern[0] == '.' {
        first_match = true
    }
    return first_match && isMatch2(text[1:], pattern[1:])
}

能解决「.」符号的情况,针对「*」符号的情况,我们可以进一步思考。
可能性:

  • 1.匹配0次。
  • 2.匹配1次。
    具体代码如下:
func isMatch(text string, pattern string) bool {
    if pattern == "" {
        if text != "" {
            return false
        } else {
            return true
        }
    }
    first_match := false
    
    text_bool := false
    if text != "" {
        text_bool = true
    }
    
    if text_bool && (pattern[0] == text[0] || pattern[0] == '.') {
        first_match = true
    }
    
    if len(pattern) >=2 && pattern[1] == '*' {
        return isMatch(text, pattern[2:]) || first_match && isMatch(text[1:], pattern)
    } else {
        return first_match && isMatch(text[1:], pattern[1:])
    }
}

这段代码都是用递归实现的,但是递归的时间复杂度消耗更大,完全可以考虑将每一次递归的结果保存下来,于是我们又可以往动态规划的方向思考。
选择dp保存结果,dp[i][j]表示前i个字符串被j个字节pattern匹配的结果。

func isMatch(s string, p string) bool {
    memory := make(map[string]bool)
    return dp(0, 0, memory, s, p)

}

func dp(i int, j int, memory map[string]bool, s string, p string) bool {
    iToStr := strconv.Itoa(i)
    jToStr := strconv.Itoa(j)
    keyStr := iToStr + "," + jToStr
    if _, ok := memory[keyStr]; ok {
        return memory[keyStr]
    }
    if j == len(p) {
        return i == len(s)
    }

    first := (i < len(s)) && (p[j] == s[i] || p[j] == '.')
    var ans bool
    if j <= (len(p) -2) && p[j+1] == '*' {
        ans = dp(i, j+2, memory,s, p) || first && dp(i+1, j, memory, s, p)
    } else {
        ans = first && dp(i+1, j+1, memory, s, p)
    }
    memory[keyStr] = ans
    return ans
}

反思:还有无更好的解法呢?比如把循环放到外层,而不是封装成dp函数?

你可能感兴趣的:(算法题之字符串匹配问题)