lifuxiangcaohui

KMP字符串匹配算法

前言

前面博文分别介绍了字符串匹配算法《朴素算法》、《Rabin-Karp算法》和《有限自动机算法》；本节介绍Knuth-Morris-Pratt字符串匹配算法(简称KMP算法)。该算法最主要是构造出模式串pat的前缀和后缀的最大相同字符串长度数组next，和前面介绍的《朴素字符串匹配算法》不同，朴素算法是当遇到不匹配字符时，向后移动一位继续匹配，而KMP算法是当遇到不匹配字符时，不是简单的向后移一位字符，而是根据前面已匹配的字符数和模式串前缀和后缀的最大相同字符串长度数组next的元素来确定向后移动的位数，所以KMP算法的时间复杂度比朴素算法的要少，并且是线性时间复杂度，即预处理时间复杂度是O(m)，匹配时间复杂度是O(n)。

Java中的indexof()方法用的蛮力法，不过有优化

KMP字符串匹配算法实现

KMP算法预处理过程

首先介绍下前缀和后缀的基本概念：

前缀：字符串中除了最后一个字符，前面剩余的其他字符连续构成的字符或字符子串称为该字符串的前缀；

后缀：字符串中除了首个字符，后面剩余的其他字符连续构成的字符或字符子串称为该字符串的后缀；

注意：空字符是任何字符串的前缀，同时也是后缀；

例如：字符串“Pattern”的前缀是：“P”“Pa”“Pat”“Patt”“Patte”“Patter”；

后缀是：“attern”“ttern”“tern”“ern”“rn”“n”；

在进行KMP字符串匹配时，首先要求出模式串的前缀和后缀的最大相同字符串长度数组next；下面先看下例子模式串pat=abababca的数组next：其中value值即为next数组内的元素值，index是数组下标标号；注意：next[i]是pat[0..i]的最长前缀和后缀相同的字符串，包括当前位置i的字符。之所以是这样，是因为这里讲解的KMP算法是最基本的，没有经过优化的，若要进行优化，则必须优化next数组，下面会介绍优化数组。

[cpp]  view plain copy   
     
    
 char:  | a | b | a | b | a | b | c | a |  
 index: | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 |   
 value: | 0 | 0 | 1 | 2 | 3 | 4 | 0 | 1 |  

－ " a "的前缀和后缀都为空集，最大相同字符子串的长度为 0 ；
－" ab "的前缀为[ a ]，后缀为[ b ]，不存在最大相同字符子串，则长度为 0 ；
－" aba "的前缀为[ a, ab ]，后缀为[ ba, a ]，最大相同字符子串[a]的长度为1；
－" abab "的前缀为[a, ab, aba]，后缀为[bab, ab, b]，最大相同字符子串[ab]的长度为 2 ；
－" ababa "的前缀为[ a, ab, aba, abab ]，后缀为[ baba, aba, ba, a ]，最大相同字符子串[ aba ]的长度为 3 ；
－" ababab "的前缀为[ a, ab, aba, abab, ababa ]，后缀为[ babab, abab, bab, ab, b ]，最大相同字符子串[ abab ]的长度为 4 ；
－" abababc "的前缀为[a, ab, aba, abab, ababa，ababab]，后缀为[bababc, ababc, babc, abc, bc, c]，不存在最大相同字符子串，则长度为0。

－"abababca"的前缀为[a, ab, aba, abab, ababa，ababab，abababc]，后缀为[bababca, ababca, babca, abca, bca, ca,a]，最大相同字符子串[a]的长度为1。

模式串的前缀和后缀的最大相同字符串长度数组next的递推求解

已知next[0..i-1]，求出next[i]：

若P[i]=P[len]，则next[i]=++len；i++继续查找下一个字符的next元素值；
若P[i]！=P[len]，则分为两步：

若len！=0，递归查找，即比较next前一个元素值所在位置的字符P[next[len-1]]与P[i]，因此i不变，而len=next[len-1]；
若len=0，则当前字符的next元素值为0，即next[i]=0；此时len不变，i++查找下一个位置字符的next元素值；

下面给出求解模式串 next 数组的代码：

[cpp]  view plain copy   
     
    
 void computeNextArray(const string &pat, int M, int *next)  
 {  
     int len = 0;  // lenght of the previous longest prefix suffix  
     int i = 1;  
     next[0] = 0; // next[0] is always 0      
    
     // the loop calculates next[i] for i = 1 to M-1  
     while(i < M)  
     {  
            if(pat[i] == pat[len])  
            {  
              len++;  
              next[i] = len;  
              i++;  
            }  
            else // (pat[i] != pat[len])  
            {  
                  if( len != 0 )  
                  {// This is tricky. Consider the example AAACAAAA and i = 7.  
                    len = next[len-1];   
                    // Also, note that we do not increment i here  
                  }  
                  else // if (len == 0)  
                  {  
                    next[i] = 0;  
                    i++;  
                  }  
            }  
     }  
 }  

KMP算法字符串匹配过程

若当前对应字符匹配成功即pat[j] = txt[i]，则i++，j++，继续匹配下一个字符；
若当前对应字符匹配失败即pat[j] ！= txt[i]，则分为两步：

若模式串当前字符的位置j！=0时，此时，模式串相对于文本字符串向后移动j - next[j-1]位，文本字符串当前位置i不变，更新模式串当前字符的位置j = next[j-1]，继续匹配字符；
若模式串当前字符的位置j=0时，此时只需更新文本字符串的当前位置i++，其他不变，继续匹配下一个字符；

源码实现如下：

[cpp]  view plain copy   
     
    
 void KMPSearch(const string &pat, const string &txt)  
 {  
     int M = pat.length();  
     int N = txt.length();  
    
     // create next[] that will hold the longest prefix suffix values for pattern  
     int *next = (int *)malloc(sizeof(int)*M);  
     int j  = 0;  // index for pat[]  
    
     // Preprocess the pattern (calculate next[] array)  
     computeNextArray(pat, M, next);  
    
     int i = 0;  // index for txt[]  
     while(i < N)  
     {  
       if(pat[j] == txt[i])  
       {  
         j++;  
         i++;  
       }  
    
       if (j == M)  
       {  
         cout<<"Found pattern at index:"<< i-j<<endl;  
         j = next[j-1];  
       }  
    
       // mismatch after j matches  
       else if(pat[j] != txt[i])  
       {  
         // Do not match next[0..next[j-1]] characters,  
         // they will match anyway  
         if(j != 0)  
          j = next[j-1];  
         else  
          i = i+1;  
       }  
     }  
     free(next); // to avoid memory leak  
 }  

下面举例，模式串 p at = “ abababca ” ，输入文本字符串 text = “ bacbababaabcbab ”。

由上面可知next表元素值如下

[cpp]  view plain copy   
     
    
 char:  | a | b | a | b | a | b | c | a |  
 index: | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 |   
 value: | 0 | 0 | 1 | 2 | 3 | 4 | 0 | 1 |  

下面是匹配过程

第一次匹配成功的字符为相对应字符a，由于模式串下一个字符b与文本字符c不匹配，且j=1、已匹配字符数为j=1，next[j-1]=0；所以下一次向后移动的位数为j-next[j-1]=1-0=1；文本字符串当前位置i不变，更新模式串当前字符的位置j = next[j-1]=0；

[cpp]  view plain copy   
     
    
 bacbababaabcbab  
  |  
  abababca  

第二次匹配成功的是字符ababa；由于模式串下一个字符b与文本字符a不匹配，且j=5、已匹配字符数j=5、next[j-1]=3；所以下一次向后移动的位数为j-next[j-1]=5-3=2；即忽略两位文本字符；文本字符串当前位置i不变，更新模式串当前字符的位置j = next[j-1]=3；

[cpp]  view plain copy   
     
    
 bacbababaabcbab  
     |||||  
     abababca  

经过上一步向后移动后的字符匹配为下面所示；由于模式串下一个字符 b 与文本字符 a 不匹配，且 j=3 、已匹配字符数 j=3 、 next[j-1]=1 ；则下一次匹配是向后移动位数为j-next[j-1]=3-1=2；即忽略两位文本字符；文本字符串当前位置i不变，更新模式串当前字符的位置j = next[j-1]=1；

[cpp]  view plain copy   
     
    
 // x denotes a skip  
   
 bacbababaabcbab  
     xx|||  
       abababca  

经过前一步的移动后得到下面的匹配；由于模式串下一个字符 b 与文本字符 a 不匹配，且 j=1 、已匹配字符数 j=1 、 next[j-1]=0 ；则下一次匹配是向后移动位数为j-next[j-1]=1-0=1；但是此时，模式串的字符长度大于待匹配的文本字符长度，所以，模式串匹配失败，即在文本字符串中不存在与模式串相同的字符串；

[cpp]  view plain copy   
     
    
 // x denotes a skip  
   
 bacbababaabcbab  
       xx|  
         abababca  

完整程序：

[cpp]  view plain copy   
     
    
 #include<iostream>  
 #include<string>  
 #include<stdlib.h>  
   
 using namespace std;  
    
 void computeNextArray(const string &pat, int M, int *next);  
    
 void KMPSearch(const string &pat, const string &txt)  
 {  
     int M = pat.length();  
     int N = txt.length();  
    
     // create next[] that will hold the longest prefix suffix values for pattern  
     int *next = (int *)malloc(sizeof(int)*M);  
     int j  = 0;  // index for pat[]  
    
     // Preprocess the pattern (calculate next[] array)  
     computeNextArray(pat, M, next);  
    
     int i = 0;  // index for txt[]  
     while(i < N)  
     {  
       if(pat[j] == txt[i])  
       {  
         j++;  
         i++;  
       }  
    
       if (j == M)  
       {  
         cout<<"Found pattern at index:"<< i-j<<endl;  
         j = next[j-1];  
       }  
    
       // mismatch after j matches  
       else if(pat[j] != txt[i])  
       {  
         // Do not match next[0..next[j-1]] characters,  
         // they will match anyway  
         if(j != 0)  
          j = next[j-1];  
         else  
          i = i+1;  
       }  
     }  
     free(next); // to avoid memory leak  
 }  
    
 void computeNextArray(const string &pat, int M, int *next)  
 {  
     int len = 0;  // lenght of the previous longest prefix suffix  
     int i = 1;  
     next[0] = 0; // next[0] is always 0      
    
     // the loop calculates next[i] for i = 1 to M-1  
     while(i < M)  
     {  
            if(pat[i] == pat[len])  
            {  
              len++;  
              next[i] = len;  
              i++;  
            }  
            else // (pat[i] != pat[len])  
            {  
                  if( len != 0 )  
                  {// This is tricky. Consider the example AAACAAAA and i = 7.  
                    len = next[len-1];   
                    // Also, note that we do not increment i here  
                  }  
                  else // if (len == 0)  
                  {  
                    next[i] = 0;  
                    i++;  
                  }  
            }  
     }  
 }  
    
 int main()  
 {  
    string txt = "ABABDABACDABABCABAB";  
    string pat = "ABABCABAB";  
    KMPSearch(pat, txt);  
    system("pause");  
    return 0;  
 }  

数组next的优化

优化求出模式串的前缀和后缀的最大相同字符串长度数组next；下面先看下例子模式串pat=abab的优化数组next：index是数组下标标号，shift标志value值向右移一位之后，并把第一个值初始化为-1的值，next数组内的元素值是对shift值进一步优化；注意：next[i]是pat[0..i]的最长前缀和后缀相同的字符串，不包括当前位置i的字符，所以这里是优化之后的next数组。

[cpp]  view plain copy   
     
    
 char:  | a  | b | a  | b |  
 index: | 0  | 1 | 2  | 3 |   
 value: | 0  | 0 | 1  | 2 |  
 shift：| -1 | 0 | 0  | 1 |  
 next： | -1 | 0 | -1 | 0 |  

下面通过例子讲解优化的过程，假设输入文本字符串和模式串分别为 txt = "abacababc"，pat = "abab"；

第一次匹配成功如下，若根据没有优化的数组进行匹配时，优化之前的数组为shift，则当前模式串字符b与文本字符c不匹配，当前匹配失败的字符位置是j=3；则模式串右移j-shift[j] = 3-1=2位，

[cpp]  view plain copy   
     
    
 abacababc  
 |||  
 abab  

经过上一步骤后，模式串字符b还是与文本字符c失配。而且失配对应的字符和上一步骤完全一样。事实上，因为在上一步的匹配中，已经得知pat[3] = b，与txt[3] = c失配，而右移两位之后，让pat[shift[3]] = pat[1] = b再跟txt[3]匹配时，必然失配。

[cpp]  view plain copy   
     
    
 //x denotes a skip  
 abacababc  
 xx|  
   abab  

问题是因为出现 pat[shift [j]]=pat[j]；因为当pat[j] != txt[i]时，下次匹配必然是pat[shift[j]]跟txt[i]匹配，如果pat[shift[j]]=pat[j]，必然导致后一步匹配失败，所以不能允许pat[shift[j]]=pat[j]。如果出现了pat[shift[j]]=pat[j]，则需要再次递归，即令shift[j]=shift[shift[j]]。则优化后的数组shift就是数组next；

我们重新看下模式串pat=abab的优化数组next；下面是优化数组next的操作过程：

[cpp]  view plain copy   
     
    
 ___________________________________________________________________________________  
 |char:    | a             | b                 | a               | b               |  
 |_________|_______________|___________________|_________________|_________________|  
 |index:   | 0             | 1                 | 2               | 3               |   
 |_________|_______________|___________________|_________________|_________________|  
 |value:   | 0             | 0                 | 1               | 2               |  
 |_________|_______________|___________________|_________________|_________________|  
 |shift：  | -1            | 0                 | 0               | 1               |  
 |_________|_______________|___________________|_________________|_________________|  
 |reason:  | The initial   | p[1]!=p[shift[1]] | p[2]=p[shift[2]]| p[3]=p[shift[3]]|  
 |         |value unchanged|                   |                 |                 |  
 |_________|_______________|___________________|_________________|_________________|  
 |operator:|do nothing     |do nothing         | shift[2]=       | shift[3]=       |  
 |         |               |                   | shift[shift[2]] | shift[shift[3]] |  
 |_________|_______________|___________________|_________________|_________________|  
 |next：   | -1            | 0                 | -1              | 0               |  
 |_________|_______________|___________________|_________________|_________________|  

下面给出优化后的程序：

[cpp]  view plain copy   
     
    
 #include <iostream>  
 #include <string>  
 #include<stdlib.h>  
 using namespace std;  
   
   
 void computeNextArray(const string &pat, int M, int *next)  
 {  
        int j=0,k=-1;  
        next[0]=-1;//优化next，初始值为-1  
        while(j<M-1)  
        {  
               if(k==-1 || pat[j]==pat[k])  
               {  
                      ++j;  
                      ++k;  
                      if(pat[j]!=pat[k])next[j]=k;  
                      //因为不能出现pat[j] = pat[ next[j ]]，所以当出现时需要继续递归  
                      else next[j]=next[k];  
               }  
               else k=next[k];  
        }  
 }  
    
   
 void kmpSearch(const string&txt,const string&pat)  
 {  
        int i=0,j=0;  
        int N = txt.length();  
        int M = pat.length();  
        int *next = (int *)malloc(sizeof(int)*M);  
        computeNextArray(pat, M, next);  
        cout<<"The value of next are:";  
        for ( i = 0; i < M; i++)  
        {  
            cout<<next[i]<<" ";  
        }  
        cout<<endl;  
        i = 0;//注意：i的值必须为0，因为从第一个字符开始比较  
        while(i<N && j<M)  
        {  
               if(j==-1 || txt[i]==pat[j])  
               {  
                      i++;  
                      j++;  
               }  
               else j=next[j];  
        }  
        if(j==M)cout<<"Found pattern at index:"<< i-j<<endl;  
        free(next);  
 }  
     
   
 int main()  
 {  
        string txt = "aacababc";  
        string pat = "abab";  
        kmpSearch(txt,pat);  
        system("pause");  
        return 0;  
 }  

参考资料：

《算法导论》

http://jakeboxer.com/blog/2009/12/13/the-knuth-morris-pratt-algorithm-in-my-own-words/

http://www.geeksforgeeks.org/searching-for-patterns-set-2-kmp-algorithm/

http://blog.csdn.net/v_july_v/article/details/7041827

http://www.ruanyifeng.com/blog/2013/05/Knuth%E2%80%93Morris%E2%80%93Pratt_algorithm.html

http://www.inf.fh-flensburg.de/lang/algorithmen/pattern/kmpen.htm

http://www.cnblogs.com/gaochundong/p/string_matching.html

http://dsqiu.iteye.com/blog/1700312

KMP-看毛片算法无休居士数据结构
#include#includevoidinsert(int*arr,inta,intn){/*0到n-1都已排好序*/inti;intkey=a;for(i=0;i=i;j--){arr[j+1]=arr[j];}arr[i]=key;return;}}arr[n]=key;return;}voidsort(int*arr,intsize){if(size<2)return;inti;for(i
KMP模式匹配的java实现星月梦瑾 code java 算法开发语言
importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){try(Scanners=newScanner(System.in)){Stringt=s.nextLine();Stringp=s.nextLine();solveMethod(t,p);}}privatestaticvoidsolveMethod
数据结构串的模式匹配算法--BF暴力匹配 Fms_Sa 算法数据结构 c语言
BF（Brute-Force，暴力匹配）算法是一种简单的字符串匹配算法，其基本思想是将目标串S逐个字符与模式串P进行比对，直到找到匹配或遍历完S为止。下面是一个使用C语言实现的BF算法示例：#include#include//BF算法实现//参数：text是文本串，pattern是模式串//返回值：如果找到模式串，则返回模式串在文本串中的起始位置（从0开始计数）；如果未找到，则返回-1intBF(
数据结构（邓俊辉）学习笔记】串 09——BM_BC算法：以终为始诸葛悠闲数据结构学习笔记
文章目录1.不对称性2.善待教训3.前轻后重4.以终为始1.不对称性上一节所介绍的KMP算法计算时间，在最坏情况下也可以保证不超过线性。这的确是一个好消息。然而，倘若我们因此就停下继续优化的脚步，那就大错特错了。实际上，串匹配问题与一般的搜索问题的确有着本质的区别。在我们此前所讨论的所有搜索算法中，每次比对都是一种一对一的模式，也就是一个目标与另一个候选者判定二者是否相等，的确只需常数的时间。而现
面试中需要熟知的字符串知识华南溜达虎数据结构与算法面试算法数据结构职场和发展
面试中需要熟知的字符串知识字符串介绍字符串是一串字符组成的序列，跟数组类似，处理数组的一些方法同样适用于字符串，建议读本文前先读一下面试中需要熟知的数组知识。查找字符串常用的数据结构有：前缀树后缀树常用的字符串算法：KMP算法，在字符串匹配时特别高效。时间复杂度字符串实际上就是一个字符数组，字符串操作和数组操作类似，所以复杂度也基本类似。操作时间复杂度访问O(1)搜索O(n)插入O(n)删除O(n
代码随想录算法训练营第九天 | LeetCode 28 Bingjiaokong 随想录刷题 leetcode 算法职场和发展
文章目录前言一、LeetCode28总结前言LeetCode题目：LeetCode28Takeaway：KMP算法。一、LeetCode28经典KMP算法题，理解很重要。我自己的理解是KMP其实用了回溯+动态规划的思路来减少无用功，让已经匹配过的字符串可以复用。classSolution{public:voidgetNext(int*next,conststring&s){//j就是前缀串的末尾i
【数据结构】BF和KMP算法小南知更鸟数据结构算法数据结构 c++
BF算法#includeusingnamespacestd;//#include//字符串处理#defineMAXSIZE255//串的定长顺序存储结构typedefstruct{charch[MAXSIZE+1];intlength;}SString;//bf算法intIndexBF(SStringS,SStringT){//从主串和模式串的第一个开始比较，因为第一个字符下标是0，所以i=0，j
vowfi中IPSEC port 500、4500端口解释 qq_25467441 网络
https://zhuanlan.zhihu.com/p/46495201关于IPSEC500、4500端口的问题，经过查阅相关RFC，做以下澄清1.port500是InternetSecurityAssociationandKeyManagementProtocol(ISAKMP）端口号2.UDPPORT4500是UDP-encapsulatedESPandIKE端口号刚开始用500，后面对方监
KMP算法（java、C#）以明志、 c#算法 java
文章目录kmp中的nextVal（代码用next数组表示）获取匹配成功的主串下标程序入口（示例）kmp中的nextVal（代码用next数组表示）namespaceTestmain{publicclassGetNext{int[]next;publicint[]getNextArray(char[]ch){next=newint[ch.Length];inti=0,j=-1;next[0]=-1;
算法学习07：KMP算法 Lhz326568 学习打卡算法学习笔记 c++开发语言
算法学习07：KMP算法文章目录算法学习07：KMP算法前言一、KMP算法1.kmp匹配过程：2.求解next数组（kmp算法重点）3.代码总结前言提示：以下是本篇文章正文内容：一、KMP算法1.kmp匹配过程：2.求解next数组（kmp算法重点）3.代码#includeusingnamespacestd;constintN=10000+10,m=100000+10;intn,m;intp[N]
KMP?next数组？前缀表？菜鸟重拾C++之算法阿卡西番茄酱 C++算法算法 c++leetcode
实现strStr（）知识点KMP（Knuth-Morris-Pratt）算法是一种用于字符串匹配的高效算法。其原理基于字符串匹配时的特性，通过预处理模式字符串（待匹配字符串）的信息，避免在匹配过程中重复比较已经匹配过的部分。前缀表记录了模式字符串中最长相同前后缀的长度前缀是指不包含最后一个字符的所有以第一个字符开头的连续子串。后缀是指不包含第一个字符的所有以最后一个字符结尾的连续子串。最长相同前后
28. Find the Index of the First Occurrence in a String(找出字符串中第一个匹配项的下标) apprentice_eye leetcode刷题日记算法数据结构开发语言 leetcode
问题描述给你两个字符串haystack和needle，请你在haystack字符串中找出needle字符串的第一个匹配项的下标（下标从0开始）。如果needle不是haystack的一部分，则返回-1。问题分析此问题时模式匹配问题可以采用暴力算法去查找，也可以使用kmp算法来进行查找。代码暴力算法：intstrStr(char*haystack,char*needle){inti,j;for(i=
KMPC++（Acwing） shady1972 c++算法数据结构
代码：#includeusingnamespacestd;constintN=100010,M=1000010;intn,m;intne[N];chars[M],p[N];intmain(){cin>>n>>p+1>>m>>s+1;for(inti=2,j=0;i<=n;i++){while(j&&p[i]!=p[j+1])j=ne[j];if(p[i]==p[j+1])j++;ne[i]=j;}
代码随想录算法训练营day09 羊角问蕊算法
题目：28.实现strStr()、459.重复的子字符串参考链接：代码随想录28.实现strStr()思路：KMP算法，这个比较复杂，主要是需要理解一个前缀表，即储存模式串needle的最长相等前后缀，注意前缀不包含末尾，后缀不包含开头。我们的第一步就是根据needle，计算出前缀表，这里可以先不用理解为什么，先记住前缀表的求法。前缀表就是一个长度和needle相同的数组，对于needle的每个字
KMP算法 Psycho social 字符串算法信息学竞赛 C++
目录KMP算法字符串匹配问题朴素算法简介思想做法例题KMP算法字符串匹配问题字符串匹配是一种计算机会频繁使用的算法。，例如有一个字符串主串S：knocktheheaven'sdoor，现在需要知道S中是否包含子串P：heaven。这是一个十分常见的问题，由于使用次数很多，所以算法的效率是十分重要的。朴素算法首先来讲，最朴素的方法莫过于是顺次比较，假定主串S的长度为n，子串P的长度是m，我们依次从主
【字符串算法】刷题总结一米の阳光算法字符串
文章目录字符串一、c++字符串基本操作二、字符串hash三、字典树四、KMP算法字符串笔记参考《算法竞赛从入门到进阶》《算法竞赛进阶指南》一、c++字符串基本操作相关博客输入与输出chars1[100],s2[1001000];intl1,l2;scanf("%s",s1);//输入遇到回车结束l1=strlen(s1);//获取长度strings1;cin>>s1;//遇到换行或者回车结束cin
蓝桥杯：C++贪心算法、字符串函数、朴素模式匹配算法、KMP算法 DaveVV 蓝桥杯c++蓝桥杯 c++贪心算法算法开发语言数据结构 c语言
贪心算法贪心(Greedy)算法的原理很容易理解：把整个问题分解成多个步骤，在每个步骤都选取当前步骤的最优方案，直到所有步骤结束；每个步骤都不考虑对后续步骤的影响，在后续步骤中也不再回头改变前面的选择。贪心算法虽然简单，但它有广泛的应用。例如图论中的最小生成树(MinimalSpanningTree，MST)算法、单源最短路径算法(Dijkstra)都是贪心算法的典型应用。贪心算法的主要问题是不一
代码随想录算法训练营第九天 | LeetCode 8. 找出字符串中第一个匹配项的下标、LeetCode 459. 重复的子字符串 Hsu琛君珩算法 leetcode 职场和发展
代码随想录算法训练营第九天|LeetCode8.找出字符串中第一个匹配项的下标、LeetCode459.重复的子字符串文章链接：代码随想录找出字符串中第一个匹配项的下标代码随想录重复的子字符串视频链接：代码随想录KMP算法理论代码随想录找出字符串中第一个匹配项的下标代码随想录重复的子字符串目录代码随想录算法训练营第九天|LeetCode8.找出字符串中第一个匹配项的下标、LeetCode459.重
Acwing（二）帝冰_genxi
第一节1、链表与邻接表2、栈与队列3、Kmp一、链表1、单链表：邻接表邻接表作用存储图和树2、双链表用来优化某些问题e[N]某个点的值ne[N]某个节点的next指针他们用下标关联起来最后一个元素的next指针指向空集ne[n-1]=-1单链表只能找到一个节点的下一个数，无法找到上一个数注意：下标是从0开始的，0是第一个插入的点第k个插入的点的下标是k-1#includeusingnamespac
KMP算法 Loboqui
一定注意读数据从1偏移开始#includeusingnamespacestd;constintN=1e6+5;chara[N],b[N];intnxt[N];intmain(){scanf("%s%s",b+1,a+1);intn=strlen(a+1),m=strlen(b+1);for(inti=2,l=0;i<=n;i++){while(l&&a[i]!=a[l+1])l=nxt[l];if
2.17状压dp有关考试总结 Flame♡ 考试
前言：该考试主要是对于寒假所学习的内容所进行的考试寒假所学习的内容主要是dp字符串相关（hashkmp而此次考试则侧重于考察寒假所学的dp内容包括但不只包括：区间dp，状压dp，树形dp，单调队列优化dp等-考试内容分析t1音量调节给定初始值在不超过最大值且不小于0的前提下，将初值加上或减去每个读入的数，使结果最大，若定会超过最大值或小于0，则输出-1分析：感觉是dp求最大值很有dp那味。但是感觉
算法分类合集 weixin_30784945
算法分类合集ACM所有算法数据结构栈，队列，链表哈希表，哈希数组堆，优先队列双端队列可并堆左偏堆二叉查找树Treap伸展树并查集集合计数问题二分图的识别平衡二叉树二叉排序树线段树一维线段树二维线段树树状数组一维树状数组N维树状数组字典树后缀数组，后缀树块状链表哈夫曼树桶，跳跃表Trie树(静态建树、动态建树)AC自动机LCA和RMQ问题KMP算法图论基本图算法图广度优先遍历深度优先遍历拓扑排序割边
ACM算法分类（要学习的东西还很多）还是太年轻
ACM所有算法数据结构栈，队列，链表哈希表，哈希数组堆，优先队列双端队列可并堆左偏堆二叉查找树Treap伸展树并查集集合计数问题二分图的识别平衡二叉树二叉排序树线段树一维线段树二维线段树树状数组一维树状数组N维树状数组字典树后缀数组，后缀树块状链表哈夫曼树桶，跳跃表Trie树(静态建树、动态建树)AC自动机LCA和RMQ问题KMP算法图论基本图算法图广度优先遍历深度优先遍历拓扑排序割边割点强连通分
ACM算法目录龍木
ACM所有算法数据结构栈，队列，链表哈希表，哈希数组堆，优先队列双端队列可并堆左偏堆二叉查找树Treap伸展树并查集集合计数问题二分图的识别平衡二叉树二叉排序树线段树一维线段树二维线段树树状数组一维树状数组N维树状数组字典树后缀数组，后缀树块状链表哈夫曼树桶，跳跃表Trie树(静态建树、动态建树)AC自动机LCA和RMQ问题KMP算法图论基本图算法图广度优先遍历深度优先遍历拓扑排序割边割点强连通分
力扣第 384 场周赛解题报告 | 珂学家 | 贪心构造 + KMP板子珂朵莉MM 力扣周赛解题报告 leetcode 算法职场和发展 java 开发语言矩阵
前言整体评价因为是新春过年，所以题目出的相对简单一些，T4和上周一样，是字符串匹配模板题。T1.修改矩阵思路:模拟按要求模拟即可classSolution{publicint[][]modifiedMatrix(int[][]matrix){inth=matrix.length;intw=matrix[0].length;int[]cols=newint[w];Arrays.fill(cols,I
KMP算法关于next数组详解 zjqqh 算法
j1234567abcabcdnext[j]0111234要求j=7的时候，next数组为多少，j=7的时候，就是看i=6的时候前缀和后缀的关系（因为求7的时候，和7没有关系，和7的前面有关系）当i=6的时候，j=3，KMP（看门牌算法）就看j=3和j=6对应的两个字符相不相等，相等，就j+1，就是next[7]，如果不相等，就继续看3对应的相不相等。因为j=6的next为3，则红色标注的两个字符
KMP算法 el psy congroo 算法算法
文章目录next数组代码实现next数组的优化KMP和BF不一样的地方在，主串的的下标i并不会回退,只需要让子串的下标j回退就够了(通过一个next数组找到回退的位置)next数组用来保存子串匹配失败后,回退的位置求法next数组0下标的值可以是任意数字,代码实现的时候会处理(之后都以next[0]==-1为例)next[1]==0一个真子串从子串的0下标开始，另一个真子串以子串的j-1下标的字符
【算法】字符串匹配算法柳下敲代码算法算法哈希算法数据结构
文章目录一、字符串匹配1.KMP2.字符串哈希一、字符串匹配记：主串sss长度为mmm，子串ppp长度为nnn。1.KMP暴力的做法，是在当前字符不匹配的时候，主串和子串都回溯，这样做显然是O(nm)O(nm)O(nm)的。KMPKMPKMP则是主串不回溯，子串回溯到特定位置，这个特定位置由子串的nextnextnext数组决定。该算法的时间复杂度是O(n+m)O(n+m)O(n+m)。chars
C++ | KMP算法模板 brilliantgby C/C++算法 c++
next数组初始化chara[1000006];//原串charp[1000006];//子串intpmt[1000006];voidgetNext(intm){intj=0;pmt[0]=0;for(inti=1;i0&&p[i]!=p[j])j=pmt[j-1];if(p[i]==p[j])++j;pmt[i]=j;}}以下实例基于上述getNext函数及数据结构执行：实例1：寻找并输出匹配位
【数据结构】02 字符串匹配&KMP算法 abutu999 数据结构 C\C++数据结构算法
字符串匹配有如下两个字符串S和P，需要判断出P是否为S的子串。简单的方法是以S的每个字符为匹配串的首个字符，将其与P串进行匹配。这个算法的时间复杂度为O(mn)，若遇到较大的字符串，耗时长。实现方法如下：//传入s起始boolcomparep_s(intj,char*p,char*s){intk=0;while(s[k]!='\0'){if(s[j+k]!=p[k]){returnfalse;}k
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D

KMP字符串匹配算法

前言

KMP字符串匹配算法实现

KMP算法预处理过程

KMP算法字符串匹配过程

数组next的优化

你可能感兴趣的:(KMP字符串匹配算法)