[剑指Offer]正则表达式匹配

本文首发于我的个人博客Suixin’s Blog
原文: https://suixinblog.cn/2019/02/target-offer-regulation.html  作者: Suixin

题目描述

请实现一个函数用来匹配包括'.'和'*'的正则表达式。模式中的字符'.'表示任意一个字符,而'*'表示它前面的字符可以出现任意次(包含0次)。 在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"与模式"a.a"和"ab*ac*a"匹配,但是与"aa.a"和"ab*a"均不匹配

解题思路

  1. 总体上,分为两种情况:模式中第二个字符不是‘*’、模式中第二个字符是‘*’。第一种情况,检查字符串首位和模式首位字符是否相匹配,成功则均后移一位,失败则返回False。第二种情况,需要分为三种情况:‘*’前面的字符匹配多次(贪婪匹配)、匹配1次、匹配0次,分别对字符串和模式进行相应后移。
  2. 《剑指Offer》原文:


    image
  3. 特殊输入测试:空字符串、空模式、含'.'模式、含'*'模式、普通模式。

代码

Python(2.7.3)

# -*- coding:utf-8 -*-
class Solution:
    # s, pattern都是字符串
    def match(self, s, pattern):
        # write code here
        if not pattern:
            if not s:
                # 都空返回True
                return True
            else:
                return False
        if pattern[0] == '*':
            return False
        if len(pattern) > 1 and pattern[1] == '*':
            # 模式第二位为*的情况
            if (len(s) > 0 and (s[0] == pattern[0] or pattern[0] == '.')):
                # *之前的字符与s首位相符且s不为空:递归调用贪婪匹配(将字符串后移一位,模式不变)或匹配到0次(字符串不变,模式后移两位)。(不用考虑匹配1次:相当于递归中贪婪匹配的匹配0次)
                # 本来考虑这里只需要递归self.match(s[1:], pattern),其实需要将这两种都加上,见后文【经典测试用例】。此处两种对应贪婪匹配、匹配0次
                return self.match(s[1:], pattern) or self.match(s, pattern[2:])
            else:
                # *之前的字符与s首位不符或者s为空,直接将模式后移两位递归,相当于匹配到0次
                return self.match(s, pattern[2:])
        elif (len(s) > 0 and (s[0] == pattern[0] or pattern[0] == '.')):
            # 模式第二位不是*的情况:匹配到就都后移一位递归,未匹配到就返回False
            return self.match(s[1:], pattern[1:])
        else:
            return False

运行时间:25ms
占用内存:5736k

经典测试用例

用例:s = 'bbbba', pattern = '.\*a\*a'
如果前面只递归调用self.match(s[1:], pattern),那么相当于贪婪匹配,只要模式是.*就一直缩减s进行递归,到最后s为空时返回False。加上self.match(s, pattern[2:])后,相当于字符串不变,模式向后缩两位,对于s = 'a', pattern = 'a\*a'即可返回True。所以二者缺一不可。
不需要加self.match(s[1:], pattern[2:])的原因是贪婪匹配的递归中的匹配0次相当于匹配1次。

参考

https://www.nowcoder.com/profile/7165145/codeBookDetail?submissionId=12509063

你可能感兴趣的:([剑指Offer]正则表达式匹配)