PowerString 之KMP字符串匹配

PowerString这道题所带来的KMP字符串匹配算法的小知识点

之前记录了KMP算法的简单模板。一个是KMP_Index 和 KMP_Count前者用于解决模式串在主串中第一次出现的位置。后者算是KMP的拓展,计算模式串在主串中出现了多少次。
KMP算法的核心是next 数组的理解和应用。简单的KMP例题直接套用模板,稍微复杂一些的题目就要去思考next 数组和题目之间的联系。关于next 数组的理解并不是到位。通过做Power String这道题发现一个小知识。判断主串中是否有最小重复单元,并由最小重复单元重复构成主串的次数。 用的就是next 数组
证明或者是 说明摘抄自网络
对于数组s[0-n-1],计算next[0-n](多计算一位)。

考虑next[n],假设t=n-next[n],如果n%t==0,则t就是问题的解,否则解为1。

这样考虑:

比如字符串"abababab",

字符串 a b a b a b a b *

next : -1 0 1 2 3 4 5 6 7

考虑这样的模式匹配,将"abababab#"当做主串,"abababab*"当做模式串,于是进行匹配到n(n=8)时,出现了不匹配:

主串 abababab#

模式串 abababab*

于是模式串需要回溯到next[*]=7,这之前的主串和模式串对应相等,于是需要模式串向右滚动的位移是d=n-next[n]=2,即:

下标 123456789

主串 abababab#

模式串 abababab*

于是可以看出,s[0-1]=s[3-4]=s[5-6]=s[7-8]。

所以位移d=n-next[n]可以看作是构成字符串s的字串(如果n%d==0,存在这样的构成),相应的重复次数也就是n/d。

n-next[n]也就是当前最小匹配的字串长度。。。。。此处的next数组相当于代码中的p数组…

/*
 * Do not go gentle into that good night
 *                                    ----Dylan Thomas
 * Author:  looooop
 * Created Time:  2019年01月22日 星期二 15时19分03秒
 * File Name: Power_line.cpp
 */
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 

using namespace std;
#define lson 2*i
#define rson 2*i+1
#define LS l,mid,lson
#define RS mid+1,r,rson
#define UP(i,x,y) for(i=x;i<=y;i++)
#define DOWN(i,x,y) for(i=x;i>=y;i--)
#define MEM(a,x) memset(a,x,sizeof(a))
#define gcd(a,b) __gcd(a,b)
#define LL long long
#define N 1000005
#define MOD 1000000007
#define INF 0x3f3f3f3f
#define EXP 1e-8
#define lowbit(x) (x&-x)
#define MAX 10000007
const int maxint = -1u>>1;
char text[MAX];
int Next[MAX];

void getNext(char x[]) {        //求Next数组,传参传入模式串。
    int j,k;
    j = 0; k = -1; Next[0] = -1;
    int length_x = strlen(x);
    while(j < length_x) {
        if(k == -1 || x[j] == x[k])
            Next[++j] = ++k;
        else
            k = Next[k];
    }
}
int KMP_Count(char pattern[],char text[]) {         //KMP_Count计算主串中有多少的模式串,传入参数pattern(模式串),text(主串)
    int ans = 0;
    int i,j = 0;
    int length_pattern = strlen(pattern);
    int length_text = strlen(text);
    if(length_pattern == 1 && length_text == 1) {
        if(pattern[0] == text[0])
            return 1;
        else
            return 0;
    }
    getNext(pattern);
    for( i = 0; i < length_text; i++) {
        while(j>=0 && text[i] != pattern[j])
            j = Next[j];
        if(j == -1||text[i] == pattern[j])
            j++;
        if(j == length_pattern) {
            ans++;
            j = Next[j];
        }
    }
    return ans;
}
int KMP_Index(char pattern[],char text[]) {
    int i = 0,j = 0;
    getNext(pattern);
    int length_pattern = strlen(pattern);
    int length_text = strlen(text);
    while(i < length_text && j < length_pattern) {
        if(j == -1 || text[i] == pattern[j]) {
            i++;
            j++;
        }
        else
            j = Next[j];
    }
    if(j == length_pattern)
        return i-length_pattern;
    else
        return -1;
}

int main(int argc,char *argv[]) {
    while(scanf("%s",text),text[0] != '.') {
        /* if(text[0] == '.')  break; */
        getNext(text);
        int length = strlen(text);
        bool flag = true;
        int Max = 0;
        
        if (length % (length-Next[length]) == 0) {
            printf("%d\n", length/(length-Next[length]));
        }
        else {
            printf("1\n");
        }
    }
    return 0;
}

你可能感兴趣的:(模板)