kmp总结及其应用

kmp含义

　　克努斯-莫里斯-普拉特算法，一种字符串查找算法。

　　字符串算法主要是用于主串 S( s1,s2,s3,...,sn ), 模式串T( t1,t2,...,tm ), 之间的匹配问题.　

　　相对与模式匹配O(n^2)而言: 当 Si != Tj 失配时, 主串下标i不回溯, 而是将模式串下标j回溯到合适的地方,再继续比较 Tj ,Si.

时间复杂度极端情况是 O(N*M), 但是一般情况下总能保证O(N+M).

　　假定串 S( i-j+1, i ) 与模式串 T( 1, j ) 匹配时, Si != Tj 不匹配,此时需j最短回溯到 k,

　　则存在 T(1,k-1) = T( j-k+1, j-1 ), 此时 k = next[j], 再令 Si 与 Tk 比较.

　　则我们得出 next[] 的定义:

　　　　next[i] = 0, 当 i = 0

　　　　next[i] = Max{ k | 1 < k < j, 且 T(1,k-1) = T(j-k+1,j-1),当此集合不空时 }

　　　　next[i] = 1, 其它情况.

 1 int kmp( char *S, char *T ){ // 主串S,模式串T, 下标皆从1开始.

 2     int la = strlen(S), lb = strlen(T);

 3     int i = 1, j = 1;

 4     while( i <= la && j <= lb ){

 5         if( j == 0 || S[i] == T[j] ) i++, j++;

 6         else    j = next[j]; //模式串向前滑动到 nxt[j]位置,继续比较

 7     }

 8     if( j > lb ) return i-j; //匹配成功,返回最初匹配点

 9     return -1; //匹配失败

10 }

next数组

　　next函数,表示对于模式串而言,其最长的前缀与后缀相同的长度.

　　有定义知道 next[1] = 0;

　　设 next[j] = k, 这表明在模式串中存在下列关系

　　　　T( 1, k-1 ) = T( j-k+1, j-1 )

　　此时 next[ j+1 ]的取值有两种情况:

　　　　1. 当 T[k] == T[j] 时, 此时有 T( 1,k ) = T( j-k+1, j ), 则此时 next[ j+1 ] = next[j] + 1

　　　　2. 但 T[k] == T[j] 时, 此时可把求 next函数值的问题看作是一个模式匹配的问题.整个模式串既是主串又是模式串.

按照前面主串与模式串匹配的思路, 则当 T[k] != T[j] 时, 应将模式串下标 k滑动到 next[k]时, 再与 T[j] 比较,

　　　　最终可能出现两种情况:

　　　　　　　　1. 匹配到, 此时 next[ j+1 ] = next[ k` ] + 1;

　　　　　　　　2. 一直无法匹配则最后会得到, next[ j+1 ] = 1.

 1 void GetNext( char *T, int *nxt ){

 2     int len = strlen(T);

 3     int i = 0, j = 1;

 4     nxt[1] = 0;

 5     while( j <= len ){

 6         if( i == 0 || T[i] == T[j] )

 7             nxt[ ++j ] = ++i;

 8         else i = nxt[i];

 9     }

10 }

应用模型

　　1. 模式串是否在主串中出现.

　　　　 poj 3080 Blue Jeans

　　　　枚举其中一个串的主串,然后与其他串进行KMP匹配即可. 此题细节处理使用了STL.string.substr( 起点l, 数量num ).

View Code

#include<cstdio>

#include<cstdlib>

#include<cstring>

#include<string>

#include<algorithm>

using namespace std;



char str[15][100];

int n, next[100];

string res;

bool flag;



void GetNxt( string T, int *nxt, int len ){

    int i = 0, j = 1;

    while( j <= len ){

        if( i == 0 || T[i-1] == T[j-1] ) 

            nxt[++j] = ++i;

        else    i = nxt[i];

    }

}

bool kmp(char *S, string T){

    int la = strlen(S), lb = T.size();

    int i = 1, j = 1;

    GetNxt( T, next, lb );

    while( i <= la && j <= lb ){

        if( j == 0 || S[i-1] == T[j-1] ) i++, j++;

        else j = next[j];

        if( j > lb ) return true;

    }

    return false;

}

void solve(){

    flag = false;    

    string st = str[0], tmp;    

    for(int L = 60; L >= 3; L--){

        for(int i = 0; i+L <= 60; i++){    

            tmp = st.substr(i,L);

            bool a = true;    

            for(int k = 1; k < n && a; k++)

                if(  kmp( str[k], tmp ) == false ) a = false;

            if( a == true ){

                if( flag == false ) flag = true, res = tmp;

                if( res > tmp ) res = tmp;

            }    

        }

        if( flag ) return;    

    }

}

int main(){

    int T;    

    scanf("%d", &T);

    while( T-- ){

        scanf("%d", &n );

        for(int i = 0; i < n; i++)

            scanf("%s", str[i] );

        solve();

        if( flag == false ) puts("no significant commonalities");

        else printf("%s\n", res.c_str() );

    }

    return 0;

}

　　　 poj 3450 Corporate Identity

　　　　同上题差不多.但是这题 N达到了4000,串长度为200, 暴力肯定不行,二分枚举长度,然后进行匹配.

View Code

#include<cstdio>

#include<cstring>

#include<cstdlib>

#include<string>

#include<algorithm>

using namespace std;

const int N = 4010;



char str[N][210];

int n, next[N], Len[N];

string res, st;

bool flag;



void GetNxt(string T,int *nxt, int len){

    int i = 0, j = 1; nxt[1] = 0;

    while( j <= len ){

        if( i == 0 || T[i-1]==T[j-1] ) 

            nxt[++j] = ++i;

        else i = nxt[i];

    }

} 

bool kmp( char *S, string T, int la, int lb ){ 

    int i = 1, j = 1; GetNxt(T,next,lb);

    while( i <= la && j <= lb ){

        if( j == 0 || S[i-1] == T[j-1] ) i++, j++;

        else    j = next[j];

        if( j > lb ) return true;    

    }

    return false;

}

bool find( int L ){

    string st = str[0],tmp;    

    for(int i = 0; i+L <= Len[0]; i++){

        tmp = st.substr( i, L );

        bool f = true;    

        for(int k = 1; k < n && f; k++)

            if( kmp( str[k], tmp, Len[k], L ) == false ) f = false; 

        if( f ) return true;

    }    

    return false;

}

void solve(){

    flag = false;

    int l = 0, r = Len[0], maxlen = -1;

    while( l < r ){    

        int m = (r+l)>>1;

        if( find(m) ) maxlen = m, l = m+1;

        else r = m;    

    

    }    

    if( maxlen != -1 ){

        string tmp, st = str[0]; l = maxlen;

        for(int i = 0; i+l <= Len[0]; i++){

            tmp = st.substr( i, l );

            bool f = true;

            for(int k = 1; k < n && f; k++)

                if( !kmp( str[k], tmp, Len[k], l) ) f = false;

            if( f ){

                if(flag ==false) flag=true, res = tmp;

                if( res > tmp ) res = tmp;

            }

        }

    }

}

int main(){

    while( scanf("%d", &n), n ){

        for(int i = 0; i < n; i++){

            scanf("%s", str[i] ); Len[i] = strlen(str[i]);

        }

        solve();

        if( flag ) printf("%s\n", res.c_str() );

        else puts("IDENTITY LOST");

    }    

    return 0;

}

　　　　poj 1226 Substrings 　　　　

　　　　本质还是一样求模式串在主串中是否出现. 拿一个串从大到小暴力分解子串. 与其他原串与inverse串匹配.

View Code

#include<cstdio>

#include<cstring>

#include<cstdlib>

#include<string>

#include<algorithm>

using namespace std;



const int N = 110;



char str[120][N];

string bap[120];

int n, m, minlen;

int Len[120], next[120];



void GetNxt(const char *T, int len){

    int i = 1, j = 0; next[1] = 0;

    while( i <= len ){

        if( j == 0 || T[i-1]==T[j-1] )

            next[++i] = ++j;

        else j = next[j];

    } 

} 

bool kmp(const char *S,int la,const char *T,int lb){

    int i = 1, j = 1; GetNxt(T,lb);

    while( i<=la && j<=lb ){

        if( j == 0 || S[i-1] == T[j-1] ) i++,j++;

        else    j = next[j];

        if( j > lb ) return true;    

    }

    return false;

}

int solve(){

    string st = str[0];

    for(int L = minlen; L >= 1; L-- ){

        for(int i = 0; i+L <= Len[0]; i++){

            bool find = true;

            string tmp = st.substr( i, L );

            for(int j = 1; j < n && find; j++){

                if( !kmp(str[j],Len[j],tmp.c_str(),L) && !kmp(bap[j].c_str(),Len[j],tmp.c_str(),L) )

                    find = false;

            }

            if(find) return L;    

        } 

    }

    return 0;

}

int main(){

    int T;

    scanf("%d", &T);

    while( T-- ){

        scanf("%d", &n);

        scanf("%s", str[0] );    

        minlen = (Len[0]=strlen(str[0]));    

        for(int i = 1; i < n; i++){

            scanf("%s", str[i] );        

            bap[i] = str[i];

            Len[i] = strlen(str[i]);    

            minlen = min( minlen, Len[i] );    

            reverse( bap[i].begin(), bap[i].end() );

        }

        int d = solve();

        printf("%d\n", d );

    }

    return 0;

}

　　　　poj 2541 Binary Witch

　　　　这一题还是暴力过去的.不过据说有 dp(i,j)的状态压缩, 字符逆序处理,然后KMP.string.substr挺管用..

View Code

#include<cstdio>

#include<cstdlib>

#include<cstring>

#include<algorithm>

#include<string>

using namespace std;

const int N = (int)1e6+1100;



char str[N];

int n, m;

int next[N];



void GetNxt(string T,int *nxt, int len){

    int i = 1, j = 0; nxt[1] = 0;

    while( i <= len ){

        if( j == 0 || T[i-1]==T[j-1] )

            nxt[++i] = ++j;

        else j = nxt[j];

    }

}

int kmp(string S, int la, string T, int lb){

    int i = 1, j = 1; GetNxt(T,next,lb);

    while( i <= la && j <= lb ){

        if( j == 0 || S[i-1] == T[j-1] )

            i++, j++;

        else j = next[j];

        if( j > lb ) return i-j;    

    }

    return -1;    

} 

int main(){

    while( scanf("%d%d", &n,&m) != EOF){

        scanf("%s", str);

        int start = n;    

        for(int i = 0; i < m; i++){

            string s = str;                

            reverse( s.begin(), s.end() );    

            bool find = false;    

            for(int L = min(13,n); L >= 1 && !find; L-- ){

                int la = n-1, lb = L;    

                string s1 = s.substr(1,la), t1 = s.substr(0,lb);

            //    printf("s1 = %s, t1 = %s\n", s1.c_str(), t1.c_str() );    

                int d = kmp( s1, la, t1, lb );

                if( d != -1 ) find = true, str[n++] = s[d];    

            }    

            if( find == false ) str[n++] = '0';

            str[n] = '\0';    

            //printf("str = %s\n", str);    

        }    

        for(int i = start; i < n; i++) printf("%c",str[i]);    

    }    

    return 0;

}

　　2. 模式串在主串中的出现次数.

　　　　poj 3461 Oulipo

　　　　因为next函数值意义为最长的前缀与后缀相同长度. 当模式串Tj与主串Si 在 (i,j)匹配完成,此时下一个可能出现的匹配的起始位置为 (i+1,lenS) , 若我们使主串下标i回溯时,则会使时间复杂度达到O(N*M), 因为是要找与模式串相同的. 则我们只需要令j = next[j], 此时 T( 1, nxt[j]-1 ) = S( i-nxt[j]+1, i-1 ) , 表示其最长的前缀和后缀,此时i就无需回溯,然后继续匹配.统计次数即可.

　　　　核心点是主串下标不回溯, 并利用 next函数意义(最长的相同前缀和后缀)

View Code

#include<cstdio>

#include<cstdlib>

#include<cstring>



const int N = (int)1e6+10;



char s1[N], s2[10010];

int next[10010];



void GetNxt( char *T, int *nxt, int len ){

    int i = 0, j = 1; nxt[1] = 0;

    while( j <= len ){

        if( i == 0 || T[i-1] == T[j-1] )

            nxt[++j] = ++i;

        else i = nxt[i];

    }

}

int kmp( char *S, char *T ){

    int la = strlen(S), lb = strlen(T), cnt = 0;

    GetNxt( T, next, lb );

    int i = 1, j = 1;

    while( i <= la && j <= lb ){

        if( j == 0 || S[i-1] == T[j-1] )

            i++, j++;

        else j = next[j];

        if( j > lb ) cnt++, j = next[j];    

    }

    return cnt;

}



int main(){

    int T;

    scanf("%d", &T);

    while( T-- ){

        scanf("%s", s2);

        scanf("%s", s1);

        printf("%d\n", kmp( s1, s2 ) );

    }

    return 0;

}

　　　　poj 3167 Cow Patterns 有点难度.

　　　　这题是求一模式串与主串的相对大小匹配,所有位置.

　　　　如果给我们的是绝对大小,那么我们就能用 poj 3461的解法,每次匹配到了再令j = next[j] 即可,得出所有匹配位置.

而对于相对大小,我们需要使用到一个结论:

　　　　两个偏序序列, 对于其每一位, 其前面比起小的数量,和与其相等的数量, 都相等, 则两个偏序序列相同. (小,和等于都一样,则大于也一样- -..)

利用这个结论,我们就可以判定快速判定两个偏序序列是否相同. 从宏观的角度上看, 还是一样对模式串求个next函数,然后再对模式串与主串kmp匹配.

　　　　这里比较特殊的地方, 就在于, 两个值的比较, 根据定义, (1,k) = (i-k+1,i) 时, next[ i+1 ] = k+1 . 模式串中的总是用的前缀,而主串中一直用的后缀.

那么我们就可以预处理出模式串的 m1(小于数量), m2(等于数量), 对于主串则使用树状数组来维护, 当失配时,则为维护树状数组.具体如下.

　　　　若当前模式串 T(1,j) 与主串S( i-j+1, i ) 比较时, Tj != Si, 此时失配, 需要令 j = next[j] 再进行匹配. 模式串我们预处理了前缀.可以O(1)得出.无需处理.

而,对于主串而言, 前面的树状数组中存放的元素是, ( i-j+1, i ), 当令 j = next[j], 再与 Si比较时, 此时树状数组中应该存放序列 S( i-next[j]+1, i ) , 那么我们就

需要手动的删除掉 S( i+j-1, i-next[j] ) 这一段. 对于模式串自身求next函数,操作一样.

View Code

//poj 3167 kmp + binary index tree

//yefeng1627

#include<cstdio>

#include<cstring>

#include<cstdlib>

const int N = (int)1e5+10;

const int K = (int)3e4+10;



int a[N], b[K], c[30];

int nxt[K], m1[K], m2[K];

int n, k, S;

int cnt, res[N];



void add(int x,int v){

    while(x<30) c[x]+=v, x+=(x&(-x));

}

int sum(int x){

    int res = 0;

    while(x>=1) res += c[x],x-=(x&(-x));

    return res;

}

void GetNxt(){

    memset( c, 0, sizeof(c));

    int i = 1, j = 0; nxt[1] = 0;

    while( i <= k ){

    //    printf("i:%d,j:%d b-1=%d, b=%d\n", i,j, sum(b[i]-1),sum(b[i]) );    

        if( j == 0 || (sum(b[i]-1)==m1[j]&&sum(b[i])==m2[j]) )

        {    nxt[++i] = ++j; if(i<=k) add(b[i],1); }

        else{

            for(int x = i-j+1; x <= i-nxt[j]; x++) add(b[x],-1);

            j = nxt[j];

        }        

    }

    //printf("k = %d, i = %d\n", k, i );    

    //for(i = 1; i <= k+1; i++)

    //    printf("%d ", nxt[i] ); puts("");

}

void kmp(){

    cnt = 0; GetNxt();

    int i = 1, j = 1;

    memset(c,0,sizeof(c));    

    add(a[1],1);

    while( i<=n && j<=k ){

        if( j == 0 || (sum(a[i]-1)==m1[j]&&sum(a[i])==m2[j]) ){

            ++i,++j; if(i<=n) add(a[i],1);

        }    

        else{

            for(int x = i-j+1; x <= i-nxt[j]; x++) add(a[x],-1);

            j = nxt[j];

        }

        if( j > k ){

    //        printf("i = %d, k = %d\n", i, k);    

            res[cnt++] = i-k;

            for(int x = i-j+1; x <= i-nxt[j]; x++) add(a[x],-1);

            j = nxt[j];

        }    

    }

}

int main(){

    while( scanf("%d%d%d", &n,&k,&S) != EOF){

        for(int i = 1; i <= n; i++) scanf("%d", &a[i] );

        memset(c,0,sizeof(c));

        for(int i = 1; i <= k; i++){

            scanf("%d", &b[i] );

            add( b[i], 1 );

            m1[i] = sum(b[i]-1),m2[i] = sum(b[i]);    

        //    printf("i:%d, m1 = %d, m2 = %d\n", i, m1[i], m2[i] );    

        }    

        kmp();

        printf("%d\n", cnt );    

        for(int i = 0; i < cnt; i++)            

            printf("%d\n", res[i] );

    }        

    return 0;

}

　　 3. 求循环节长度 / 最小覆盖子串长度图形介绍 http://blog.csdn.net/fjsd155/article/details/6866991

　　　　poj 2406 Power Strings

　　　　kmp的nxt函数过程,会将模式串一个周期一个周期的构造, 对于 (i+1) - nxt[ i+1 ] (因为我们是通过 Ti与Tj 得到nxt[i+1]的),

　　　　即是其周期长度, 当目前总长度 i % { (i+1)-nxt[i+1] } = 0, 时, 则意味着最后一个周期构造完成, 否则 i % { (i+1)-nxt[i+1] }表示目前最后一个周期串已构造出了多少个.

　　　　poj 2185 Milking Grid 有点难度,且题意不是很好懂.

　　　　这题所指的最小覆盖长度,其实就是最小循环周期长度.当然并非是完成循环,换句话说是单元串a,重复k次可以覆盖str, 其中streln(a*k) >= strlen(str),

　　　　并且我们知道 N-next(N)是最小覆盖长度, 之后的 j = next( next(N) )逐渐增大, 解决此题的思路是:

　　　　首先处理宽度width, 寻找所有行都有的最小覆盖宽度 w`, 极端情况是 c. 因为每个串都能覆盖本身.

　　　　之后在将 r长度为c的串(1,c). 截断成 r个长度为width的串(1,width), 然后对这c个串进行一个HASH值.得到一个数组key[C].

　　　　然后对这个数组求一个next函数, 高度 high 即为 C - next(C),

View Code

#include<cstdio>

#include<cstring>

#include<cstdlib>



const int N = (int)1e6+10;

char s[N];

int nxt[N];



int main(){

    while( scanf("%s", s) != EOF ){

        if( s[0] == '.' ) break;    

        int len = strlen(s);

        int i = 0, j = 1; nxt[1] = 0;

        while( j <= len ){

            if( i == 0 || s[i-1] == s[j-1] )

                nxt[++j] = ++i;

            else i = nxt[i];

        }    

        if( len%(len+1-nxt[len+1]) ) puts("1");

        else printf("%d\n", len/(len+1-nxt[len+1]) );

    }    

    return 0;

}

　　　　poj 1961 Period

　　　　对于模式串本身求next函数值时,其实其是一个一个周期在构造串, N-next(N)表示串的循环周期, 而N%(N-next(N))即为最后一个周期已构造串的数量.

View Code

#include<cstdio>

#include<cstring>

#include<cstdlib>

#include<string.h>

#include<algorithm>

using namespace std;



const int N = (int)1e6+10;

int n, nxt[N];

char s[N];



int main(){

    int Case = 1;

    while( scanf("%d",&n), n ){

        scanf("%s", s);

        int len = strlen(s);

        int i = 1, j = 0; nxt[1] = 0;

        while( i <= len ){

            if( j == 0 || s[i-1] == s[j-1] )

                nxt[++i] = ++j;

            else j = nxt[j];

        } 

        printf("Test case #%d\n", Case++);    

        for(int i = 2; i <= len; i++){

            if( (i%(i+1-nxt[i+1])==0) && (nxt[i+1]>1) )

                printf("%d %d\n", i, i/(i+1-nxt[i+1]) );        

        }    

        puts("");    

    }

    return 0;

}

　　 4. 求串的前缀最大长度, 且其前缀与后缀相同. (最大前缀与后缀)

　　　　poj 2752 Seek the Name

　　　　对于串T(1,i), 我们考虑 next函数定义

　　　　next[ i ] = Max{ k | 1 < k < i && T( 1,k-1 ) = T( i-k+1, i-1 ) 且集合不为空, } , 则可以知道,

字串(1,next[ i-1 ]) 即为串 T(1,i-1) 的最大前缀与后缀. 此时再考虑串 [1,next[i-1] ]的最大前缀与后缀,

如此反复,直到 i = 0 结束. 因为定义 k < i, 其实其本身 (1,i)也是其最大前缀和后缀. 逆序输出即可.

　　　　再重复说明下, kmp的next函数值是通过比较 Ti 与 Tj , 若 Ti = Tj ,则 next[ j+1 ] = i+1, 所以,

我们要获取i位置的最后匹配位置,则需要用next[ i+1 ], 因为其包含了 Ti = T[ next[i+1] - 1 ].

View Code

#include<cstdio>

#include<cstring>

#include<cstdlib>

const int N = 400010;

char s[N];

int res[N], nxt[N];



int main(){

    while( scanf("%s", s) != EOF){

        int len = strlen(s);

        int i = 0, j = 1; nxt[1] = 0;

        while( j <= len ){

            if( i == 0 || s[i-1] == s[j-1] ) 

                nxt[++j] = ++i;

            else i = nxt[i];

        }

        int cnt = 0, x = nxt[len+1];

        res[cnt++] = len;

        while( x > 1 ) { res[cnt++] = x-1; x = nxt[x]; } 

        for(int i = cnt-1; i >= 0; i--)

            printf( i == 0 ? "%d" : "%d ", res[i] ); puts("");    

    }    

    return 0;

}

KMP-看毛片算法无休居士数据结构
#include#includevoidinsert(int*arr,inta,intn){/*0到n-1都已排好序*/inti;intkey=a;for(i=0;i=i;j--){arr[j+1]=arr[j];}arr[i]=key;return;}}arr[n]=key;return;}voidsort(int*arr,intsize){if(size<2)return;inti;for(i
KMP模式匹配的java实现星月梦瑾 code java 算法开发语言
importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){try(Scanners=newScanner(System.in)){Stringt=s.nextLine();Stringp=s.nextLine();solveMethod(t,p);}}privatestaticvoidsolveMethod
数据结构（邓俊辉）学习笔记】串 09——BM_BC算法：以终为始诸葛悠闲数据结构学习笔记
文章目录1.不对称性2.善待教训3.前轻后重4.以终为始1.不对称性上一节所介绍的KMP算法计算时间，在最坏情况下也可以保证不超过线性。这的确是一个好消息。然而，倘若我们因此就停下继续优化的脚步，那就大错特错了。实际上，串匹配问题与一般的搜索问题的确有着本质的区别。在我们此前所讨论的所有搜索算法中，每次比对都是一种一对一的模式，也就是一个目标与另一个候选者判定二者是否相等，的确只需常数的时间。而现
面试中需要熟知的字符串知识华南溜达虎数据结构与算法面试算法数据结构职场和发展
面试中需要熟知的字符串知识字符串介绍字符串是一串字符组成的序列，跟数组类似，处理数组的一些方法同样适用于字符串，建议读本文前先读一下面试中需要熟知的数组知识。查找字符串常用的数据结构有：前缀树后缀树常用的字符串算法：KMP算法，在字符串匹配时特别高效。时间复杂度字符串实际上就是一个字符数组，字符串操作和数组操作类似，所以复杂度也基本类似。操作时间复杂度访问O(1)搜索O(n)插入O(n)删除O(n
代码随想录算法训练营第九天 | LeetCode 28 Bingjiaokong 随想录刷题 leetcode 算法职场和发展
文章目录前言一、LeetCode28总结前言LeetCode题目：LeetCode28Takeaway：KMP算法。一、LeetCode28经典KMP算法题，理解很重要。我自己的理解是KMP其实用了回溯+动态规划的思路来减少无用功，让已经匹配过的字符串可以复用。classSolution{public:voidgetNext(int*next,conststring&s){//j就是前缀串的末尾i
【数据结构】BF和KMP算法小南知更鸟数据结构算法数据结构 c++
BF算法#includeusingnamespacestd;//#include//字符串处理#defineMAXSIZE255//串的定长顺序存储结构typedefstruct{charch[MAXSIZE+1];intlength;}SString;//bf算法intIndexBF(SStringS,SStringT){//从主串和模式串的第一个开始比较，因为第一个字符下标是0，所以i=0，j
vowfi中IPSEC port 500、4500端口解释 qq_25467441 网络
https://zhuanlan.zhihu.com/p/46495201关于IPSEC500、4500端口的问题，经过查阅相关RFC，做以下澄清1.port500是InternetSecurityAssociationandKeyManagementProtocol(ISAKMP）端口号2.UDPPORT4500是UDP-encapsulatedESPandIKE端口号刚开始用500，后面对方监
KMP算法（java、C#）以明志、 c#算法 java
文章目录kmp中的nextVal（代码用next数组表示）获取匹配成功的主串下标程序入口（示例）kmp中的nextVal（代码用next数组表示）namespaceTestmain{publicclassGetNext{int[]next;publicint[]getNextArray(char[]ch){next=newint[ch.Length];inti=0,j=-1;next[0]=-1;
算法学习07：KMP算法 Lhz326568 学习打卡算法学习笔记 c++开发语言
算法学习07：KMP算法文章目录算法学习07：KMP算法前言一、KMP算法1.kmp匹配过程：2.求解next数组（kmp算法重点）3.代码总结前言提示：以下是本篇文章正文内容：一、KMP算法1.kmp匹配过程：2.求解next数组（kmp算法重点）3.代码#includeusingnamespacestd;constintN=10000+10,m=100000+10;intn,m;intp[N]
KMP?next数组？前缀表？菜鸟重拾C++之算法阿卡西番茄酱 C++算法算法 c++leetcode
实现strStr（）知识点KMP（Knuth-Morris-Pratt）算法是一种用于字符串匹配的高效算法。其原理基于字符串匹配时的特性，通过预处理模式字符串（待匹配字符串）的信息，避免在匹配过程中重复比较已经匹配过的部分。前缀表记录了模式字符串中最长相同前后缀的长度前缀是指不包含最后一个字符的所有以第一个字符开头的连续子串。后缀是指不包含第一个字符的所有以最后一个字符结尾的连续子串。最长相同前后
28. Find the Index of the First Occurrence in a String(找出字符串中第一个匹配项的下标) apprentice_eye leetcode刷题日记算法数据结构开发语言 leetcode
问题描述给你两个字符串haystack和needle，请你在haystack字符串中找出needle字符串的第一个匹配项的下标（下标从0开始）。如果needle不是haystack的一部分，则返回-1。问题分析此问题时模式匹配问题可以采用暴力算法去查找，也可以使用kmp算法来进行查找。代码暴力算法：intstrStr(char*haystack,char*needle){inti,j;for(i=
KMPC++（Acwing） shady1972 c++算法数据结构
代码：#includeusingnamespacestd;constintN=100010,M=1000010;intn,m;intne[N];chars[M],p[N];intmain(){cin>>n>>p+1>>m>>s+1;for(inti=2,j=0;i<=n;i++){while(j&&p[i]!=p[j+1])j=ne[j];if(p[i]==p[j+1])j++;ne[i]=j;}
代码随想录算法训练营day09 羊角问蕊算法
题目：28.实现strStr()、459.重复的子字符串参考链接：代码随想录28.实现strStr()思路：KMP算法，这个比较复杂，主要是需要理解一个前缀表，即储存模式串needle的最长相等前后缀，注意前缀不包含末尾，后缀不包含开头。我们的第一步就是根据needle，计算出前缀表，这里可以先不用理解为什么，先记住前缀表的求法。前缀表就是一个长度和needle相同的数组，对于needle的每个字
KMP算法 Psycho social 字符串算法信息学竞赛 C++
目录KMP算法字符串匹配问题朴素算法简介思想做法例题KMP算法字符串匹配问题字符串匹配是一种计算机会频繁使用的算法。，例如有一个字符串主串S：knocktheheaven'sdoor，现在需要知道S中是否包含子串P：heaven。这是一个十分常见的问题，由于使用次数很多，所以算法的效率是十分重要的。朴素算法首先来讲，最朴素的方法莫过于是顺次比较，假定主串S的长度为n，子串P的长度是m，我们依次从主
【字符串算法】刷题总结一米の阳光算法字符串
文章目录字符串一、c++字符串基本操作二、字符串hash三、字典树四、KMP算法字符串笔记参考《算法竞赛从入门到进阶》《算法竞赛进阶指南》一、c++字符串基本操作相关博客输入与输出chars1[100],s2[1001000];intl1,l2;scanf("%s",s1);//输入遇到回车结束l1=strlen(s1);//获取长度strings1;cin>>s1;//遇到换行或者回车结束cin
蓝桥杯：C++贪心算法、字符串函数、朴素模式匹配算法、KMP算法 DaveVV 蓝桥杯c++蓝桥杯 c++贪心算法算法开发语言数据结构 c语言
贪心算法贪心(Greedy)算法的原理很容易理解：把整个问题分解成多个步骤，在每个步骤都选取当前步骤的最优方案，直到所有步骤结束；每个步骤都不考虑对后续步骤的影响，在后续步骤中也不再回头改变前面的选择。贪心算法虽然简单，但它有广泛的应用。例如图论中的最小生成树(MinimalSpanningTree，MST)算法、单源最短路径算法(Dijkstra)都是贪心算法的典型应用。贪心算法的主要问题是不一
代码随想录算法训练营第九天 | LeetCode 8. 找出字符串中第一个匹配项的下标、LeetCode 459. 重复的子字符串 Hsu琛君珩算法 leetcode 职场和发展
代码随想录算法训练营第九天|LeetCode8.找出字符串中第一个匹配项的下标、LeetCode459.重复的子字符串文章链接：代码随想录找出字符串中第一个匹配项的下标代码随想录重复的子字符串视频链接：代码随想录KMP算法理论代码随想录找出字符串中第一个匹配项的下标代码随想录重复的子字符串目录代码随想录算法训练营第九天|LeetCode8.找出字符串中第一个匹配项的下标、LeetCode459.重
Acwing（二）帝冰_genxi
第一节1、链表与邻接表2、栈与队列3、Kmp一、链表1、单链表：邻接表邻接表作用存储图和树2、双链表用来优化某些问题e[N]某个点的值ne[N]某个节点的next指针他们用下标关联起来最后一个元素的next指针指向空集ne[n-1]=-1单链表只能找到一个节点的下一个数，无法找到上一个数注意：下标是从0开始的，0是第一个插入的点第k个插入的点的下标是k-1#includeusingnamespac
KMP算法 Loboqui
一定注意读数据从1偏移开始#includeusingnamespacestd;constintN=1e6+5;chara[N],b[N];intnxt[N];intmain(){scanf("%s%s",b+1,a+1);intn=strlen(a+1),m=strlen(b+1);for(inti=2,l=0;i<=n;i++){while(l&&a[i]!=a[l+1])l=nxt[l];if
2.17状压dp有关考试总结 Flame♡ 考试
前言：该考试主要是对于寒假所学习的内容所进行的考试寒假所学习的内容主要是dp字符串相关（hashkmp而此次考试则侧重于考察寒假所学的dp内容包括但不只包括：区间dp，状压dp，树形dp，单调队列优化dp等-考试内容分析t1音量调节给定初始值在不超过最大值且不小于0的前提下，将初值加上或减去每个读入的数，使结果最大，若定会超过最大值或小于0，则输出-1分析：感觉是dp求最大值很有dp那味。但是感觉
算法分类合集 weixin_30784945
算法分类合集ACM所有算法数据结构栈，队列，链表哈希表，哈希数组堆，优先队列双端队列可并堆左偏堆二叉查找树Treap伸展树并查集集合计数问题二分图的识别平衡二叉树二叉排序树线段树一维线段树二维线段树树状数组一维树状数组N维树状数组字典树后缀数组，后缀树块状链表哈夫曼树桶，跳跃表Trie树(静态建树、动态建树)AC自动机LCA和RMQ问题KMP算法图论基本图算法图广度优先遍历深度优先遍历拓扑排序割边
ACM算法分类（要学习的东西还很多）还是太年轻
ACM所有算法数据结构栈，队列，链表哈希表，哈希数组堆，优先队列双端队列可并堆左偏堆二叉查找树Treap伸展树并查集集合计数问题二分图的识别平衡二叉树二叉排序树线段树一维线段树二维线段树树状数组一维树状数组N维树状数组字典树后缀数组，后缀树块状链表哈夫曼树桶，跳跃表Trie树(静态建树、动态建树)AC自动机LCA和RMQ问题KMP算法图论基本图算法图广度优先遍历深度优先遍历拓扑排序割边割点强连通分
ACM算法目录龍木
ACM所有算法数据结构栈，队列，链表哈希表，哈希数组堆，优先队列双端队列可并堆左偏堆二叉查找树Treap伸展树并查集集合计数问题二分图的识别平衡二叉树二叉排序树线段树一维线段树二维线段树树状数组一维树状数组N维树状数组字典树后缀数组，后缀树块状链表哈夫曼树桶，跳跃表Trie树(静态建树、动态建树)AC自动机LCA和RMQ问题KMP算法图论基本图算法图广度优先遍历深度优先遍历拓扑排序割边割点强连通分
力扣第 384 场周赛解题报告 | 珂学家 | 贪心构造 + KMP板子珂朵莉MM 力扣周赛解题报告 leetcode 算法职场和发展 java 开发语言矩阵
前言整体评价因为是新春过年，所以题目出的相对简单一些，T4和上周一样，是字符串匹配模板题。T1.修改矩阵思路:模拟按要求模拟即可classSolution{publicint[][]modifiedMatrix(int[][]matrix){inth=matrix.length;intw=matrix[0].length;int[]cols=newint[w];Arrays.fill(cols,I
KMP算法关于next数组详解 zjqqh 算法
j1234567abcabcdnext[j]0111234要求j=7的时候，next数组为多少，j=7的时候，就是看i=6的时候前缀和后缀的关系（因为求7的时候，和7没有关系，和7的前面有关系）当i=6的时候，j=3，KMP（看门牌算法）就看j=3和j=6对应的两个字符相不相等，相等，就j+1，就是next[7]，如果不相等，就继续看3对应的相不相等。因为j=6的next为3，则红色标注的两个字符
KMP算法 el psy congroo 算法算法
文章目录next数组代码实现next数组的优化KMP和BF不一样的地方在，主串的的下标i并不会回退,只需要让子串的下标j回退就够了(通过一个next数组找到回退的位置)next数组用来保存子串匹配失败后,回退的位置求法next数组0下标的值可以是任意数字,代码实现的时候会处理(之后都以next[0]==-1为例)next[1]==0一个真子串从子串的0下标开始，另一个真子串以子串的j-1下标的字符
【算法】字符串匹配算法柳下敲代码算法算法哈希算法数据结构
文章目录一、字符串匹配1.KMP2.字符串哈希一、字符串匹配记：主串sss长度为mmm，子串ppp长度为nnn。1.KMP暴力的做法，是在当前字符不匹配的时候，主串和子串都回溯，这样做显然是O(nm)O(nm)O(nm)的。KMPKMPKMP则是主串不回溯，子串回溯到特定位置，这个特定位置由子串的nextnextnext数组决定。该算法的时间复杂度是O(n+m)O(n+m)O(n+m)。chars
C++ | KMP算法模板 brilliantgby C/C++算法 c++
next数组初始化chara[1000006];//原串charp[1000006];//子串intpmt[1000006];voidgetNext(intm){intj=0;pmt[0]=0;for(inti=1;i0&&p[i]!=p[j])j=pmt[j-1];if(p[i]==p[j])++j;pmt[i]=j;}}以下实例基于上述getNext函数及数据结构执行：实例1：寻找并输出匹配位
【数据结构】02 字符串匹配&KMP算法 abutu999 数据结构 C\C++数据结构算法
字符串匹配有如下两个字符串S和P，需要判断出P是否为S的子串。简单的方法是以S的每个字符为匹配串的首个字符，将其与P串进行匹配。这个算法的时间复杂度为O(mn)，若遇到较大的字符串，耗时长。实现方法如下：//传入s起始boolcomparep_s(intj,char*p,char*s){intk=0;while(s[k]!='\0'){if(s[j+k]!=p[k]){returnfalse;}k
【上分日记】第380场周赛（数位dp+ KMP + 位运算 + 二分 + 双指针）舜华丶上分日记 KMP 数位dp 位运算二分双指针第380周赛分类讨论
文章目录前言正文1.3005.最大频率元素计数2.3007.价值和小于等于K的最大数字3.3008.找出数组中的美丽下标II总结尾序前言本场周赛，博主也只写出两道题(前两道,hhh菜鸡勿喷)，第三道涉及位运算，数位dp，第四道涉及KMP。下面我们来总结一下这四道题。正文1.3005.最大频率元素计数这道题不难，不过有一个比较妙的写法，因此还是来分析总结一下。题目链接:最大频率元素计数题目思路：
面向对象面向过程 3213213333332132 java
面向对象：把要完成的一件事，通过对象间的协作实现。面向过程：把要完成的一件事，通过循序依次调用各个模块实现。我把大象装进冰箱这件事为例，用面向对象和面向过程实现，都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian
Java Hotspot: Remove the Permanent Generation bookjovi HotSpot
openjdk上关于hotspot将移除永久带的描述非常详细，http://openjdk.java.net/jeps/122 JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/
正则表达式向前查找向后查找,环绕或零宽断言 dcj3sjt126com 正则表达式
向前查找和向后查找 1. 向前查找：根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找，出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找：一个要匹配的字符序列前面有或者没有指定的
BaseDao 171815164 seda
import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn
Ant标签详解--Java命令 g21121 Java命令
这一篇主要介绍与java相关标签的使用终于开始重头戏了，Java部分是我们关注的重点也是项目中用处最多的部分。 1
[简单]代码片段_电梯数字排列 53873039oycg 代码
今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子，如下: import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S
Hessian原理云端月影 hessian原理
Hessian 原理分析一．远程通讯协议的基本原理网络通信需要做的就是将流从一台计算机传输到另外一台计算机，基于传输协议和网络 IO 来实现，其中传输协议比较出名的有 http 、 tcp 、 udp 等等， http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协
区分Activity的四种加载模式----以及Intent的setFlags aijuans android
在多Activity开发中，有可能是自己应用之间的Activity跳转，或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例，而不是产生大量重复的Activity。这需要为Activity配置特定的加载模式，而不是使用默认的加载模式。加载模式分类及在哪里配置 Activity有四种加载模式： standard singleTop
hibernate几个核心API及其查询分析 antonyup_2006 html .net Hibernate xml 配置管理
(一) org.hibernate.cfg.Configuration类读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.) Configuration co
PL/SQL的流程控制百合不是茶 oracle PL/SQL编程循环控制
PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop
强大的Mockito测试框架 bijian1013 mockito 单元测试
一.自动生成Mock类在需要Mock的属性上标记@Mock注解，然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类 &nbs
精通Oracle10编程SQL(11)开发子程序 bijian1013 oracle 数据库 plsql
/* *开发子程序 */ --子程序目是指被命名的PL/SQL块，这种块可以带有参数，可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序：过程和函数 --开发过程 --建立过程：不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E
【EhCache一】EhCache版Hello World bit1129 Hello world
本篇是EhCache系列的第一篇，总体介绍使用EhCache缓存进行CRUD的API的基本使用，更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍环境准备 1.新建Maven项目 2.添加EhCache的Maven依赖 <dependency> <groupId>ne
学习EJB3基础知识笔记白糖_ bean Hibernate jboss webservice ejb
最近项目进入系统测试阶段，全赖袁大虾领导有力，保持一周零bug记录，这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了，EJB基本的知识也有些了解，在这记录下EJB的部分知识，以供自己以后复习使用。 EJB是sun的服务器端组件模型，最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分，定义了一个用于开发基
angular.bootstrap boyitech AngularJS AngularJS API angular中文api
angular.bootstrap 描述：手动初始化angular。这个函数会自动检测创建的module有没有被加载多次，如果有则会在浏览器的控制台打出警告日志，并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。使用方法： angular .
java-谷歌面试题-给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数 bylijinnan java
public class SearchInShiftedArray { /** * 题目：给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答： * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl
天使还是魔鬼？都是我们制造 ducklsl 生活教育情感
----------------------------剧透请原谅，有兴趣的朋友可以自己看看电影，互相讨论哦！！！从厦门回来的动车上，无意中瞟到了书中推荐的几部关于儿童的电影。当然，这几部电影可能会另大家失望，并不是类似小鬼当家的电影，而是关于“坏小孩”的电影！自己挑了两部先看了看，但是发现看完之后，心里久久不能平
[机器智能与生物]研究生物智能的问题 comsci 生物
我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别.... 但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把
获取Android Device的信息 dai_lm android
String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph
最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现 datamachine java 算法字符串匹配
原文：http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------
小学5年级英语单词背诵第一课 dcj3sjt126com english word
long 长的 show 给...看，出示 mouth 口，嘴 write 写 use 用，使用 take 拿，带来 hand 手 clever 聪明的 often 经常 wash 洗 slow 慢的 house 房子 water 水 clean 清洁的 supper 晚餐 out 在外 face 脸，
macvim的使用实战 dcj3sjt126com mac vim
macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳 1. 下载macvim https://code.google.com/p/macvim/ 2. 了解macvim :h vim的使用帮助信息 :h macvim
java二分法查找蕃薯耀 java二分法查找二分法 java二分法
java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/
Spring Cache注解+Memcached hanqunfeng spring memcached
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s
apache commons io包快速入门 jackyrong apache commons
原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html Apache Commons IO 包绝对是好东西，地址在http://commons.apache.org/proper/commons-io/，下面用例子分别介绍： 1）工具类 2
如何学习编程 lampcy java 编程 C++c
首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有
架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy nannan408 Spring3
1.前言。如题。 2.描述。 @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法，使用该Annotation时可以指定一个字符串数组作为参数，每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp
Spring4+quartz2的配置和代码方式调度 Everyday都不同代码配置 spring4 quartz2.x 定时任务
前言：这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多，所以，只好自己去查阅底层API…… quartz定时任务必须搞清楚几个概念： JobDetail——处理类 Trigger——触发器，指定触发时间，必须要有JobDetail属性，即触发对象 Scheduler——调度器，组织处理类和触发器，配置方式一般只需指定触发
Hibernate入门 tntxia Hibernate
前言使用面向对象的语言和关系型的数据库，开发起来很繁琐，费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM（Object/Relational Mapping）解决方案。 Hibernte不仅关心把Java对象对应到数据库的表中，而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。如
Math类 xiaoxing598 Math
一、Java中的数字（Math）类是final类，不可继承。 1、常数 PI：double圆周率 E：double自然对数 2、截取（注意方法的返回类型） double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round

kmp总结及其应用

你可能感兴趣的:(KMP)