一看就懂的正则表达式匹配问题解法(牛客网/剑指offer正则表达式的匹配)

慢慢看完这篇,下次这题就不是问题!^_^


题目描述

请实现一个函数用来匹配包括’.’和’‘的正则表达式。模式中的字符’.’表示任意一个字符,而’‘表示它前面的字符可以出现任意次(包含0次)。 在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串”aaa”与模式”a.a”和”ab*ac*a”匹配,但是与”aa.a”和”ab*a”均不匹配!

接下来请认真跟着我的思路走

分析

当模式中的第二个字符是“*”时:

如果字符串第一个字符跟模式第一个字符不匹配,则模式后移2个字符,继续匹配。如果字符串第一个字符跟模式第一个字符匹配,可以有3种匹配方式:

  1. 模式后移2字符,相当于x*被忽略;
  2. 字符串后移1字符,模式后移2字符;
  3. 字符串后移1字符,模式不变,即继续匹配字符下一位,因为*可以匹配多位;

当模式中的第二个字符不是“*”时:

  1. 如果字符串第一个字符和模式中的第一个字符相匹配,那么字符串和模式都后移一个字符,然后匹配剩余的。
  2. 如果 字符串第一个字符和模式中的第一个字符相不匹配,直接返回false。

代码

public class Solution {
    public boolean match(char[] str, char[] pattern)
    {
        if (str == null || pattern == null) {
            return false;
        }
        int strIndex = 0;
        int patternIndex = 0;
        return matchCore(str, strIndex, pattern, patternIndex);
    }
    private boolean matchCore(char[] str, int strIndex, char[] pattern, int patternIndex) {
        // 对于有效的检验:str到尾,pattern到尾,匹配成功
        if (strIndex == str.length && patternIndex == pattern.length) {
            return true;
        }
        // pattern 先到尾,则一定匹配失败
        if (patternIndex == pattern.length && strIndex != str.length) {
            return false;
        }
        // 对于模式字符串第2个是*,且字符串第1个跟模式第1个匹配,分3种匹配模式;如不匹配,模式后移2位
        if (patternIndex + 1 < pattern.length && pattern[patternIndex + 1] == '*') {
            if (strIndex != str.length && (pattern[patternIndex] == str[strIndex] || pattern[patternIndex] == '.')) {
                return matchCore(str, strIndex, pattern, patternIndex+2)    // 模式后移2,视为x*匹配0个字符
                || matchCore(str, strIndex+1, pattern, patternIndex+2)  // 视为模式匹配1个字符
                || matchCore(str, strIndex+1, pattern, patternIndex);   // *匹配1个(*可以匹配多位),再匹配str中的下一个
            } else {
                return matchCore(str, strIndex, pattern, patternIndex+2);   // *前面的字符出现0次,因此直接后移2
            }
        }
        // 模式字符串第2个不是*,且字符串第1个跟模式第1个匹配,则都后移1位,否则直接返回false
        if ((strIndex != str.length && pattern[patternIndex] == str[strIndex]) || (strIndex != str.length && pattern[patternIndex] == '.')) {
            return matchCore(str, strIndex + 1, pattern, patternIndex + 1);
        } else {
            return false;    // 模式字符串第二个不是'*',且第一个还不是'.'时,直接匹配失败
    }
}

补充说一点:

而当模式中的第二个字符是“*”时:

  1. 模式后移2字符,相当于x*被忽略;
  2. 字符串后移1字符,模式后移2字符;
  3. 字符串后移1字符,模式不变,即继续匹配字符下一位,因为*可以匹配多位; 情况2可以被情况1和情况3包含。执行一次情况3,再执行一次情况1,就相当于情况2。 中间那行情况直接删除,也能通过。
// 对于模式第2个是*,且字符串第1个跟模式第1个匹配,分3种匹配模式;如不匹配,模式后移2位
        if (patternIndex + 1 < pattern.length && pattern[patternIndex + 1] == '*') {
            if (strIndex != str.length && (pattern[patternIndex] == str[strIndex] || pattern[patternIndex] == '.')) {
                return matchCore(str, strIndex, pattern, patternIndex+2)    // 模式后移2,视为x*匹配0个字符
//------>可以不要这一行    || matchCore(str, strIndex+1, pattern, patternIndex+2)  // 视为模式匹配1个字符
                || matchCore(str, strIndex+1, pattern, patternIndex);   // *匹配1个(*可以匹配多位),再匹配str中的下一个
            } else {
                return matchCore(str, strIndex, pattern, patternIndex+2);   // *前面的字符出现0次,因此直接后移2
            }
        }

你可能感兴趣的:(Java,Java基础知识的细节分析)