jzoj3208. 【JSOI2013】编程作业(kmp)

题面

Description
Will相信,很多同学都有过这样的经历:大牛已经写好了编程作业,而作为菜鸟的自己不会写怎么办呢?拿大牛的代码抄一下嘛!但是提交一模一样的作业是不是不太好?于是就改一改变量名什么的……但是其实这样的代码抄袭行为是可以被检测出来的。

考虑到如下的两段代码,很容易发现他们其实是一样的。

jzoj3208. 【JSOI2013】编程作业(kmp)_第1张图片

那么最开始给出的两段雷同代码就可以分别写成AiBjCiDECjDiFGC以及AaBiCaDECiDaFGC。或者简单的说,我们认为这两段代码是一样的。

现在请写一个程序,处理若干这样的代码雷同检测问题:给一个完整代码以及一个较短的代码片段,请求出,这个代码片段在完整代码中一共出现了多少次(代码片段出现的位置可以重叠)。

为了简单起见,我们认为程序中只会至多出现a~z这26个变量,同时也至多只有A~Z这26个非变量符号。

题解

所以说我讨厌字符串……

不难看出题目的意思就是大写字母必须完全相等,小写字母可以有替换

大写字母\(KMP\)就行了,考虑小写字母该怎么搞

我们把每个小写字母的权值改成上一个这个小写字母到它的距离,那么两个小写字母相等要么它们都是在串中第一次出现,要么它们的权值相等

于是就可以跑\(KMP\)

//minamoto
#include
#define R register
#define fp(i,a,b) for(R int i=a,I=b+1;iI;--i)
#define go(u) for(int i=head[u],v=e[i].v;i;i=e[i].nx,v=e[i].v)
using namespace std;
const int N=1e6+5;
char s[N],t[N];int kmp[N],vs[N],vt[N],las[255];
int n,m,T,res;
bool equal(R int x,R int y,R int len){return x==y||x>=len&&y>=len;}
void solve(){
    scanf("%s%s",s+1,t+1),n=strlen(s+1),m=strlen(t+1);
    memset(las,0,sizeof(las));
    fp(i,1,n)if(s[i]>'Z')vs[i]=i-las[s[i]],las[s[i]]=i;
    else vs[i]=-s[i];
    memset(las,0,sizeof(las));
    fp(i,1,m)if(t[i]>'Z')vt[i]=i-las[t[i]],las[t[i]]=i;
    else vt[i]=-t[i];
    kmp[0]=kmp[1]=0;
    for(R int i=2,j=0;i<=m;++i){
        while(j&&!equal(vt[j+1],vt[i],j+1))j=kmp[j];
        j+=equal(vt[j+1],vt[i],j);
        kmp[i]=j;
    }
    res=0;
    for(R int i=0,j=0;i<=n;++i){
        while(j&&!equal(vt[j+1],vs[i],j+1))j=kmp[j];
        j+=equal(vt[j+1],vs[i],1);
        if(j==m)++res,j=kmp[j];
    }
    printf("%d\n",res);
}
int main(){
//  freopen("testdata.in","r",stdin);
    int T;scanf("%d",&T);
    while(T--)solve();
    return 0;
}

转载于:https://www.cnblogs.com/bztMinamoto/p/10326516.html

你可能感兴趣的:(jzoj3208. 【JSOI2013】编程作业(kmp))