正则表达式的匹配

模式中的字符’.’表示任一字符,而‘*’表示它前面的字符可以出现任意次(含0次)。匹配是指字符串的所有字符匹配整个模式。例如,字符串“aaa”与模式“a.a”和“ab*ac*a”匹配,但与“aa.a”及“ab*a”均不匹配。

分析:分两种情况
a). 当模式中的第二个字符不是’*’时问题要简单很多。如果字符串中的第一个字符和模式中的第一个字符相匹配,那么在字符串和模式上都向后移动一个字符,然后匹配剩余的字符串和模式。如果字符串中的第一个字符和模式中的第一个字符不相匹配,则直接返回false。
b).当模式中的第二个字符是’*’时问题要复杂一些,因为可能有多种不同的匹配方式。1).一个选择时模式上向后移动两个字符。这相当于’*’和他前面的字符被忽略掉了,因为‘*’可以匹配字符串中的0个字符。2).如果模式中的第一个字符和字符串中的第一个字符相匹配时,则在字符串向后移动一个字符,而在模式上有两个选择,我们可以在模式上向后移动两个字符,也可以保持模式不变。

#include   
using namespace std;  

bool matchCore(char *str, char *pattern)
{
    if (*str == '\0' && *pattern == '\0') return true;
    if (*str != '\0' && *pattern == '\0') return false;
    if (*(pattern+1) == '*')
    {
        //当if条件成立时,有如下三种情况
        if (*pattern == *str || (*pattern == '.' && *str != '\0'))
        {
            return matchCore(str+1, pattern+2)     //(1)模式串c*刚好匹配字符串中的一个c字符,即c*匹配为一个c
                || matchCore(str+1, pattern)       //(2)模式串c*至少匹配字符串中的一个c字符,即c*匹配为至少一个c
                || matchCore(str, pattern+2);      //(3)模式串c*匹配字符串中的零个c字符,即c*匹配为零个c
        }
        //当if条件不成立时,只有如下一种情况
        else
            return matchCore(str, pattern+2);       //(1)模式串c*匹配字符串中的零个c字符,即c*匹配为零个c
    }
    if (*pattern == *str || (*pattern == '.' && *str != '\0')) 
        return matchCore(str+1, pattern+1);
    //如果上面的两个条件都不满足,则不匹配,直接返回false
    return false;
}

bool match(char *str, char *pattern)
{
    if (NULL == str || NULL == pattern) return false;
    return matchCore(str, pattern);
}

int main()  
{  
    char *s1 = "aaa";
    char *s2 = "a.a";
    char *s3 = "ab*ac*a";
    char *s4 = "aa.a";
    char *s5 = "ab*a";
    cout<" 与 "<match(s1, s2)?"匹配":"不匹配")<" 与 "<match(s1, s3)?"匹配":"不匹配")<" 与 "<match(s1, s4)?"匹配":"不匹配")<" 与 "<match(s1, s5)?"匹配":"不匹配")<return 0;
} 

运行结果:

正则表达式的匹配_第1张图片

你可能感兴趣的:(算法)