chenhanzhun

算法——字符串匹配之KMP算法

前言

前面博文分别介绍了字符串匹配算法《朴素算法》、《Rabin-Karp算法》和《有限自动机算法》；本节介绍Knuth-Morris-Pratt字符串匹配算法(简称KMP算法)。该算法最主要是构造出模式串pat的前缀和后缀的最大相同字符串长度数组next，和前面介绍的《朴素字符串匹配算法》不同，朴素算法是当遇到不匹配字符时，向后移动一位继续匹配，而KMP算法是当遇到不匹配字符时，不是简单的向后移一位字符，而是根据前面已匹配的字符数和模式串前缀和后缀的最大相同字符串长度数组next的元素来确定向后移动的位数，所以KMP算法的时间复杂度比朴素算法的要少，并且是线性时间复杂度，即预处理时间复杂度是O(m)，匹配时间复杂度是O(n)。

KMP字符串匹配算法实现

KMP算法预处理过程

首先介绍下前缀和后缀的基本概念：

前缀：字符串中除了最后一个字符，前面剩余的其他字符连续构成的字符或字符子串称为该字符串的前缀；

后缀：字符串中除了首个字符，后面剩余的其他字符连续构成的字符或字符子串称为该字符串的后缀；

注意：空字符是任何字符串的前缀，同时也是后缀；

例如：字符串“Pattern”的前缀是：“P”“Pa”“Pat”“Patt”“Patte”“Patter”；

后缀是：“attern”“ttern”“tern”“ern”“rn”“n”；

在进行KMP字符串匹配时，首先要求出模式串的前缀和后缀的最大相同字符串长度数组next；下面先看下例子模式串pat=abababca的数组next：其中value值即为next数组内的元素值，index是数组下标标号；注意：next[i]是pat[0..i]的最长前缀和后缀相同的字符串，包括当前位置i的字符。之所以是这样，是因为这里讲解的KMP算法是最基本的，没有经过优化的，若要进行优化，则必须优化next数组，下面会介绍优化数组。

char:  | a | b | a | b | a | b | c | a |
index: | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 
value: | 0 | 0 | 1 | 2 | 3 | 4 | 0 | 1 |

－" a "的前缀和后缀都为空集，最大相同字符子串的长度为 0 ；
－" ab "的前缀为[ a ]，后缀为[ b ]，不存在最大相同字符子串，则长度为 0 ；
－" aba "的前缀为[ a, ab ]，后缀为[ ba, a ]，最大相同字符子串[a]的长度为1；
－" abab "的前缀为[a, ab, aba]，后缀为[bab, ab, b]，最大相同字符子串[ab]的长度为 2 ；
－" ababa "的前缀为[ a, ab, aba, abab ]，后缀为[ baba, aba, ba, a ]，最大相同字符子串[ aba ]的长度为 3 ；
－" ababab "的前缀为[ a, ab, aba, abab, ababa ]，后缀为[ babab, abab, bab, ab, b ]，最大相同字符子串[ abab ]的长度为 4 ；
－" abababc "的前缀为[a, ab, aba, abab, ababa，ababab]，后缀为[bababc, ababc, babc, abc, bc, c]，不存在最大相同字符子串，则长度为0。

－"abababca"的前缀为[a, ab, aba, abab, ababa，ababab，abababc]，后缀为[bababca, ababca, babca, abca, bca, ca,a]，最大相同字符子串[a]的长度为1。

模式串的前缀和后缀的最大相同字符串长度数组next的递推求解

已知next[0..i-1]，求出next[i]：

若P[i]=P[len]，则next[i]=++len；i++继续查找下一个字符的next元素值；
若P[i]！=P[len]，则分为两步：

若len！=0，递归查找，即比较next前一个元素值所在位置的字符P[next[len-1]]与P[i]，因此i不变，而len=next[len-1]；
若len=0，则当前字符的next元素值为0，即next[i]=0；此时len不变，i++查找下一个位置字符的next元素值；

下面给出求解模式串 next 数组的代码：

void computeNextArray(const string &pat, int M, int *next)
{
    int len = 0;  // lenght of the previous longest prefix suffix
	int i = 1;
    next[0] = 0; // next[0] is always 0    
 
    // the loop calculates next[i] for i = 1 to M-1
    while(i < M)
    {
		   if(pat[i] == pat[len])
		   {
			 len++;
			 next[i] = len;
			 i++;
		   }
		   else // (pat[i] != pat[len])
		   {
				 if( len != 0 )
				 {// This is tricky. Consider the example AAACAAAA and i = 7.
				   len = next[len-1]; 
				   // Also, note that we do not increment i here
				 }
				 else // if (len == 0)
				 {
				   next[i] = 0;
				   i++;
				 }
		   }
    }
}

KMP算法字符串匹配过程

若当前对应字符匹配成功即pat[j] = txt[i]，则i++，j++，继续匹配下一个字符；
若当前对应字符匹配失败即pat[j] ！= txt[i]，则分为两步：

若模式串当前字符的位置j！=0时，此时，模式串相对于文本字符串向后移动j - next[j-1]位（即已成功匹配的字符个数减去最后一个成功匹配字符所对应的next数组元素值），文本字符串当前位置i不变，更新模式串当前字符的位置j = next[j-1]，继续匹配字符；
若模式串当前字符的位置j=0时，此时只需更新文本字符串的当前位置i++，其他不变，继续匹配下一个字符；

源码实现如下：

void KMPSearch(const string &pat, const string &txt)
{
    int M = pat.length();
    int N = txt.length();
 
    // create next[] that will hold the longest prefix suffix values for pattern
    int *next = (int *)malloc(sizeof(int)*M);
    int j  = 0;  // index for pat[]
 
    // Preprocess the pattern (calculate next[] array)
    computeNextArray(pat, M, next);
 
    int i = 0;  // index for txt[]
    while(i < N)
    {
      if(pat[j] == txt[i])
      {
        j++;
        i++;
      }
 
      if (j == M)
      {
        cout<<"Found pattern at index:"<< i-j<<endl;
        j = next[j-1];
      }
 
      // mismatch after j matches
      else if(pat[j] != txt[i])
      {
        // Do not match next[0..next[j-1]] characters,
        // they will match anyway
        if(j != 0)
         j = next[j-1];
        else
         i = i+1;
      }
    }
    free(next); // to avoid memory leak
}

下面举例，模式串 p at = “ abababca ” ，输入文本字符串 text = “ bacbababaabcbab ”。

由上面可知next表元素值如下

char:  | a | b | a | b | a | b | c | a |
index: | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 
value: | 0 | 0 | 1 | 2 | 3 | 4 | 0 | 1 |

下面是匹配过程

第一次匹配成功的字符为相对应字符a，由于模式串下一个字符b与文本字符c不匹配，且j=1、已匹配字符数为j=1，next[j-1]=0；所以下一次向后移动的位数为j-next[j-1]=1-0=1；文本字符串当前位置i不变，更新模式串当前字符的位置j = next[j-1]=0；

bacbababaabcbab
 |
 abababca

第二次匹配成功的是字符ababa；由于模式串下一个字符b与文本字符a不匹配，且j=5、已匹配字符数j=5、next[j-1]=3；所以下一次向后移动的位数为j-next[j-1]=5-3=2；即忽略两位文本字符；文本字符串当前位置i不变，更新模式串当前字符的位置j = next[j-1]=3；

bacbababaabcbab
    |||||
    abababca

经过上一步向后移动后的字符匹配为下面所示；由于模式串下一个字符 b 与文本字符 a 不匹配，且 j=3 、已匹配字符数 j=3 、 next[j-1]=1 ；则下一次匹配是向后移动位数为j-next[j-1]=3-1=2；即忽略两位文本字符；文本字符串当前位置i不变，更新模式串当前字符的位置j = next[j-1]=1；

// x denotes a skip

bacbababaabcbab
    xx|||
      abababca

经过前一步的移动后得到下面的匹配；由于模式串下一个字符 b 与文本字符 a 不匹配，且 j=1 、已匹配字符数 j=1 、 next[j-1]=0 ；则下一次匹配是向后移动位数为j-next[j-1]=1-0=1；但是此时，模式串的字符长度大于待匹配的文本字符长度，所以，模式串匹配失败，即在文本字符串中不存在与模式串相同的字符串；

// x denotes a skip

bacbababaabcbab
      xx|
        abababca

完整程序：

#include<iostream>
#include<string>
#include<stdlib.h>

using namespace std;
 
void computeNextArray(const string &pat, int M, int *next);
 
void KMPSearch(const string &pat, const string &txt)
{
    int M = pat.length();
    int N = txt.length();
 
    // create next[] that will hold the longest prefix suffix values for pattern
    int *next = (int *)malloc(sizeof(int)*M);
    int j  = 0;  // index for pat[]
 
    // Preprocess the pattern (calculate next[] array)
    computeNextArray(pat, M, next);
 
    int i = 0;  // index for txt[]
    while(i < N)
    {
      if(pat[j] == txt[i])
      {
        j++;
        i++;
      }
 
      if (j == M)
      {
        cout<<"Found pattern at index:"<< i-j<<endl;
        j = next[j-1];
      }
 
      // mismatch after j matches
      else if(pat[j] != txt[i])
      {
        // Do not match next[0..next[j-1]] characters,
        // they will match anyway
        if(j != 0)
         j = next[j-1];
        else
         i = i+1;
      }
    }
    free(next); // to avoid memory leak
}
 
void computeNextArray(const string &pat, int M, int *next)
{
    int len = 0;  // lenght of the previous longest prefix suffix
	int i = 1;
    next[0] = 0; // next[0] is always 0    
 
    // the loop calculates next[i] for i = 1 to M-1
    while(i < M)
    {
		   if(pat[i] == pat[len])
		   {
			 len++;
			 next[i] = len;
			 i++;
		   }
		   else // (pat[i] != pat[len])
		   {
				 if( len != 0 )
				 {// This is tricky. Consider the example AAACAAAA and i = 7.
				   len = next[len-1]; 
				   // Also, note that we do not increment i here
				 }
				 else // if (len == 0)
				 {
				   next[i] = 0;
				   i++;
				 }
		   }
    }
}
 
int main()
{
   string txt = "ABABDABACDABABCABAB";
   string pat = "ABABCABAB";
   KMPSearch(pat, txt);
   system("pause");
   return 0;
}

数组next的优化

优化求出模式串的前缀和后缀的最大相同字符串长度数组next；下面先看下例子模式串pat=abab的优化数组next：index是数组下标标号，shift标志value值向右移一位之后，并把第一个值初始化为-1的值，next数组内的元素值是对shift值进一步优化；注意：next[i]是pat[0..i]的最长前缀和后缀相同的字符串，不包括当前位置i的字符，所以这里是优化之后的next数组。

char:  | a  | b | a  | b |
index: | 0  | 1 | 2  | 3 | 
value: | 0  | 0 | 1  | 2 |
shift：| -1 | 0 | 0  | 1 |
next： | -1 | 0 | -1 | 0 |

下面通过例子讲解优化的过程，假设输入文本字符串和模式串分别为 txt = "abacababc"，pat = "abab"；

第一次匹配成功如下，若根据没有优化的数组进行匹配时，优化之前的数组为shift，则当前模式串字符b与文本字符c不匹配，当前匹配失败的字符位置是j=3；则模式串右移j-shift[j] = 3-1=2位，

abacababc
|||
abab

经过上一步骤后，模式串字符b还是与文本字符c失配。而且失配对应的字符和上一步骤完全一样。事实上，因为在上一步的匹配中，已经得知pat[3] = b，与txt[3] = c失配，而右移两位之后，让pat[shift[3]] = pat[1] = b再跟txt[3]匹配时，必然失配。

//x denotes a skip
abacababc
xx|
  abab

问题是因为出现 pat[shift [j]]=pat[j]；因为当pat[j] != txt[i]时，下次匹配必然是pat[shift[j]]跟txt[i]匹配，如果pat[shift[j]]=pat[j]，必然导致后一步匹配失败，所以不能允许pat[shift[j]]=pat[j]。如果出现了pat[shift[j]]=pat[j]，则需要再次递归，即令shift[j]=shift[shift[j]]。则优化后的数组shift就是数组next；

我们重新看下模式串pat=abab的优化数组next；下面是优化数组next的操作过程：

___________________________________________________________________________________
|char:    | a             | b                 | a               | b               |
|_________|_______________|___________________|_________________|_________________|
|index:   | 0             | 1                 | 2               | 3               | 
|_________|_______________|___________________|_________________|_________________|
|value:   | 0             | 0                 | 1               | 2               |
|_________|_______________|___________________|_________________|_________________|
|shift：  | -1            | 0                 | 0               | 1               |
|_________|_______________|___________________|_________________|_________________|
|reason:  | The initial   | p[1]!=p[shift[1]] | p[2]=p[shift[2]]| p[3]=p[shift[3]]|
|		  |value unchanged|					  |                 |				  |
|_________|_______________|___________________|_________________|_________________|
|operator:|do nothing     |do nothing         | shift[2]=       | shift[3]=       |
|		  |               |                   | shift[shift[2]] | shift[shift[3]] |
|_________|_______________|___________________|_________________|_________________|
|next：   | -1            | 0                 | -1              | 0               |
|_________|_______________|___________________|_________________|_________________|

下面给出优化后的程序：

#include <iostream>
#include <string>
#include<stdlib.h>
using namespace std;


void computeNextArray(const string &pat, int M, int *next)
{
       int j=0,k=-1;
       next[0]=-1;//优化next，初始值为-1
       while(j<M-1)
	   {
              if(k==-1 || pat[j]==pat[k])
			  {
                     ++j;
					 ++k;
                     if(pat[j]!=pat[k])next[j]=k;
					 //因为不能出现pat[j] = pat[ next[j ]]，所以当出现时需要继续递归
                     else next[j]=next[k];
              }
              else k=next[k];
       }
}
 

void kmpSearch(const string&txt,const string&pat)
{
       int i=0,j=0;
       int N = txt.length();
       int M = pat.length();
	   int *next = (int *)malloc(sizeof(int)*M);
	   computeNextArray(pat, M, next);
	   cout<<"The value of next are:";
	   for ( i = 0; i < M; i++)
	   {
		   cout<<next[i]<<" ";
	   }
	   cout<<endl;
	   i = 0;//注意：i的值必须为0，因为从第一个字符开始比较
       while(i<N && j<M)
	   {
              if(j==-1 || txt[i]==pat[j])
			  {
                     i++;
					 j++;
              }
              else j=next[j];
       }
       if(j==M)cout<<"Found pattern at index:"<< i-j<<endl;
	   free(next);
}
  

int main()
{
       string txt = "aacababc";
	   string pat = "abab";
	   kmpSearch(txt,pat);
       system("pause");
       return 0;
}

参考资料：

《算法导论》

http://jakeboxer.com/blog/2009/12/13/the-knuth-morris-pratt-algorithm-in-my-own-words/

http://www.geeksforgeeks.org/searching-for-patterns-set-2-kmp-algorithm/

http://blog.csdn.net/v_july_v/article/details/7041827

http://www.ruanyifeng.com/blog/2013/05/Knuth%E2%80%93Morris%E2%80%93Pratt_algorithm.html

http://www.inf.fh-flensburg.de/lang/algorithmen/pattern/kmpen.htm

http://www.cnblogs.com/gaochundong/p/string_matching.html

http://dsqiu.iteye.com/blog/1700312

正则表达式语法、运算符优先级 weixin_54668000 mvc
正则表达式(regularexpression)描述了一种字符串匹配的模式（pattern），可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。例如：runoo+b，可以匹配runoob、runooob、runoooooob
JS中正则表达式捕获组与反向引用详解 OEC小胖胖 JavaScript javascript 正则表达式开发语言前端 web ecmascript
正则表达式（RegularExpression，简称Regex）是一种强大的字符串匹配工具，它能够让我们通过模式来查找、匹配、替换字符串中的内容。而在正则表达式中，捕获组是一个非常重要的概念，常常用于将匹配到的内容保存下来供后续操作。今天我们就来详细讲解JavaScript中的捕获组、反向引用、以及替换操作中的$1、$2等符号。1.什么是捕获组（CaptureGroup）捕获组的定义捕获组是指通过
数据结构与算法Day25----字符串匹配（一）：借助哈希算法实现墨殇染泪
一、主串和模式串：假设在字符串A中查找字符串B，那字符串A就是主串，字符串B就是模式串。把主串的长度记作，模式串的长度记作。因为是在主串中查找模式串，所以。二、暴力匹配算法/朴素匹配算法/BF(BruteForce)算法：1、算法思想：在主串中，检查起始位置分别是0、1、2···且长度为的个子串，看有没有跟模式串匹配的。2、图示：3、时间复杂度：在极端情况下，每次都比对个字符，要比对次
数据结构串的模式匹配算法--BF暴力匹配 Fms_Sa 算法数据结构 c语言
BF（Brute-Force，暴力匹配）算法是一种简单的字符串匹配算法，其基本思想是将目标串S逐个字符与模式串P进行比对，直到找到匹配或遍历完S为止。下面是一个使用C语言实现的BF算法示例：#include#include//BF算法实现//参数：text是文本串，pattern是模式串//返回值：如果找到模式串，则返回模式串在文本串中的起始位置（从0开始计数）；如果未找到，则返回-1intBF(
数据结构（邓俊辉）学习笔记】串 09——BM_BC算法：以终为始诸葛悠闲数据结构学习笔记
文章目录1.不对称性2.善待教训3.前轻后重4.以终为始1.不对称性上一节所介绍的KMP算法计算时间，在最坏情况下也可以保证不超过线性。这的确是一个好消息。然而，倘若我们因此就停下继续优化的脚步，那就大错特错了。实际上，串匹配问题与一般的搜索问题的确有着本质的区别。在我们此前所讨论的所有搜索算法中，每次比对都是一种一对一的模式，也就是一个目标与另一个候选者判定二者是否相等，的确只需常数的时间。而现
正则表达式详解朱什么凡正则表达式 mysql 数据库
正则表达式（RegularExpression）1.定义与用途正则表达式是一种描述字符串匹配模式的工具，它可以用来检查一个字符串是否含有某种子串、将匹配的子串做替换或者从某个字符串中取出符合某个条件的子串等。正则表达式由普通字符（如a到z）和特殊字符（称为“元字符”）组成，用于定义搜索文本时要匹配的一个或多个字符串的模式。2.基本语法与规则2.1字符类备选字符集：用[]表示，匹配方括号中的任意字符
Python算法模糊匹配：FuzzyWuzzy深度剖析，从入门到精通，解决你所有需要匹配的需求长风清留扬 Python 人工智能算法 python 算法大数据网络 dba
在数据科学与机器学习的广阔领域中，处理不精确或模糊的数据是一项至关重要的技能。想象一下，当你面对的是一堆拼写错误、缩写、或是格式不一的文本数据时，如何高效地从中提取有价值的信息？这正是FuzzyWuzzy——Python中一个强大的模糊字符串匹配库，能够大展身手的地方。本文将为你全面介绍FuzzyWuzzy——Python中一个强大的通过算法模糊字符串匹配库，全网最全最新，一看就会，接下来带你走进
面试中需要熟知的字符串知识华南溜达虎数据结构与算法面试算法数据结构职场和发展
面试中需要熟知的字符串知识字符串介绍字符串是一串字符组成的序列，跟数组类似，处理数组的一些方法同样适用于字符串，建议读本文前先读一下面试中需要熟知的数组知识。查找字符串常用的数据结构有：前缀树后缀树常用的字符串算法：KMP算法，在字符串匹配时特别高效。时间复杂度字符串实际上就是一个字符数组，字符串操作和数组操作类似，所以复杂度也基本类似。操作时间复杂度访问O(1)搜索O(n)插入O(n)删除O(n
代码随想录算法训练营第九天 | LeetCode 28 Bingjiaokong 随想录刷题 leetcode 算法职场和发展
文章目录前言一、LeetCode28总结前言LeetCode题目：LeetCode28Takeaway：KMP算法。一、LeetCode28经典KMP算法题，理解很重要。我自己的理解是KMP其实用了回溯+动态规划的思路来减少无用功，让已经匹配过的字符串可以复用。classSolution{public:voidgetNext(int*next,conststring&s){//j就是前缀串的末尾i
【数据结构】BF和KMP算法小南知更鸟数据结构算法数据结构 c++
BF算法#includeusingnamespacestd;//#include//字符串处理#defineMAXSIZE255//串的定长顺序存储结构typedefstruct{charch[MAXSIZE+1];intlength;}SString;//bf算法intIndexBF(SStringS,SStringT){//从主串和模式串的第一个开始比较，因为第一个字符下标是0，所以i=0，j
JS中document.querySelector什么意思北原_春希 javascript 前端开发语言
document.querySelector是JavaScript中的一个DOM(DocumentObjectModel)方法，用于从文档中选择与指定选择器组或选择器字符串匹配的第一个Element。如果没有找到任何匹配的元素，则返回null。letelement=document.querySelector('selector');其中'selector'是一个CSS选择器，例如：'#myId'
KMP算法（java、C#）以明志、 c#算法 java
文章目录kmp中的nextVal（代码用next数组表示）获取匹配成功的主串下标程序入口（示例）kmp中的nextVal（代码用next数组表示）namespaceTestmain{publicclassGetNext{int[]next;publicint[]getNextArray(char[]ch){next=newint[ch.Length];inti=0,j=-1;next[0]=-1;
0101插入排序-算法基础-算法导论第三版 gaog2zh 数据结构和算法插入排序算法基础算法导论第三版
文章目录一插入排序二循环不变式与插入排序的正确性三伪代码中的一些约定四Java代码实现插入排序结语一插入排序输入：nnn个数订单一个序列(a1,a2,⋯ ,an)(a_1,a_2,\cdots,a_n)(a1,a2,⋯,an).**输出：**输入序列的一个排列(a1′,a2′,⋯ ,an′)(a^{'}_1,a^{'}_2,\cdots,a^{'}_n)(a1′,a2′,⋯,an′),满足a1′≤
正则表达式总结（校验数字,字符串及特殊需求的表达式） polaris9z JavaScript javascript
定义：正则表达式(regularexpression)描述了一种字符串匹配的模式（pattern），可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。正则表达式的组件可以是单个的字符、字符集合、字符范围、字符间的选择或者所有这些组件的任意组合。正则表达式是由普通字符（例如字符a到z）以及特殊字符（称为"元字符"）组成的文字模式。模式描述在搜索文本时要匹配的
算法学习07：KMP算法 Lhz326568 学习打卡算法学习笔记 c++开发语言
算法学习07：KMP算法文章目录算法学习07：KMP算法前言一、KMP算法1.kmp匹配过程：2.求解next数组（kmp算法重点）3.代码总结前言提示：以下是本篇文章正文内容：一、KMP算法1.kmp匹配过程：2.求解next数组（kmp算法重点）3.代码#includeusingnamespacestd;constintN=10000+10,m=100000+10;intn,m;intp[N]
KMP?next数组？前缀表？菜鸟重拾C++之算法阿卡西番茄酱 C++算法算法 c++leetcode
实现strStr（）知识点KMP（Knuth-Morris-Pratt）算法是一种用于字符串匹配的高效算法。其原理基于字符串匹配时的特性，通过预处理模式字符串（待匹配字符串）的信息，避免在匹配过程中重复比较已经匹配过的部分。前缀表记录了模式字符串中最长相同前后缀的长度前缀是指不包含最后一个字符的所有以第一个字符开头的连续子串。后缀是指不包含第一个字符的所有以最后一个字符结尾的连续子串。最长相同前后
LeetCode438.找到字符串中所有字母异位词 Stephen_Curry___ 算法数据结构 leetcode c++
题目给定两个字符串s和p，找到s中所有p的异位词的子串，返回这些子串的起始索引。不考虑答案输出的顺序。异位词指由相同字母重排列形成的字符串（包括相同的字符串）。示例输入:s="cbaebabacd",p="abc"输出:[0,6]解释:起始索引等于0的子串是"cba",它是"abc"的异位词。起始索引等于6的子串是"bac",它是"abc"的异位词。思路这是一道经典的字符串匹配问题，可以使用滑动窗
学算法要读《算法导论》吗？方圆想当图灵算法
大家好，我是方圆。这篇文章是我学习算法的心得，希望它能够给一些将要学习算法且准备要读大部头算法书籍的朋友一些参考，节省一些时间，也为了给经典的“黑皮书”祛魅，我觉得这些书籍在大部分互联网从业者心中已经不再是进步的阶梯，而是恐惧的阴影了，因为当一些学习路线中列出这些书目时，评论区多是调侃少是交流和讨论。在这之前我也这些书抱有读起来很困难的看法，但是在我参考过《算法导论》之后，我觉得它更像是一杯“鸡尾
Leo赠书活动-16期名校毕业生教材 LeoToJavaer CSDN送书活动送书福利
Leo赠书活动-16期名校毕业生教材✅作者简介：大家好，我是Leo，热爱Java后端开发者，一个想要与大家共同进步的男人个人主页：Leo的博客当前专栏：赠书活动专栏✨特色专栏：MySQL学习本文内容：Leo赠书活动-16期名校毕业生教材个人知识库：Leo知识库，欢迎大家访问目录Leo赠书活动-16期名校毕业生教材1.《深入理解计算机系统》2.《算法导论》3.《计算机程序的构造和解释》4.《数据库系
28. Find the Index of the First Occurrence in a String(找出字符串中第一个匹配项的下标) apprentice_eye leetcode刷题日记算法数据结构开发语言 leetcode
问题描述给你两个字符串haystack和needle，请你在haystack字符串中找出needle字符串的第一个匹配项的下标（下标从0开始）。如果needle不是haystack的一部分，则返回-1。问题分析此问题时模式匹配问题可以采用暴力算法去查找，也可以使用kmp算法来进行查找。代码暴力算法：intstrStr(char*haystack,char*needle){inti,j;for(i=
代码随想录算法训练营day09 羊角问蕊算法
题目：28.实现strStr()、459.重复的子字符串参考链接：代码随想录28.实现strStr()思路：KMP算法，这个比较复杂，主要是需要理解一个前缀表，即储存模式串needle的最长相等前后缀，注意前缀不包含末尾，后缀不包含开头。我们的第一步就是根据needle，计算出前缀表，这里可以先不用理解为什么，先记住前缀表的求法。前缀表就是一个长度和needle相同的数组，对于needle的每个字
KMP算法 Psycho social 字符串算法信息学竞赛 C++
目录KMP算法字符串匹配问题朴素算法简介思想做法例题KMP算法字符串匹配问题字符串匹配是一种计算机会频繁使用的算法。，例如有一个字符串主串S：knocktheheaven'sdoor，现在需要知道S中是否包含子串P：heaven。这是一个十分常见的问题，由于使用次数很多，所以算法的效率是十分重要的。朴素算法首先来讲，最朴素的方法莫过于是顺次比较，假定主串S的长度为n，子串P的长度是m，我们依次从主
【字符串算法】刷题总结一米の阳光算法字符串
文章目录字符串一、c++字符串基本操作二、字符串hash三、字典树四、KMP算法字符串笔记参考《算法竞赛从入门到进阶》《算法竞赛进阶指南》一、c++字符串基本操作相关博客输入与输出chars1[100],s2[1001000];intl1,l2;scanf("%s",s1);//输入遇到回车结束l1=strlen(s1);//获取长度strings1;cin>>s1;//遇到换行或者回车结束cin
蓝桥杯：C++贪心算法、字符串函数、朴素模式匹配算法、KMP算法 DaveVV 蓝桥杯c++蓝桥杯 c++贪心算法算法开发语言数据结构 c语言
贪心算法贪心(Greedy)算法的原理很容易理解：把整个问题分解成多个步骤，在每个步骤都选取当前步骤的最优方案，直到所有步骤结束；每个步骤都不考虑对后续步骤的影响，在后续步骤中也不再回头改变前面的选择。贪心算法虽然简单，但它有广泛的应用。例如图论中的最小生成树(MinimalSpanningTree，MST)算法、单源最短路径算法(Dijkstra)都是贪心算法的典型应用。贪心算法的主要问题是不一
代码随想录算法训练营第九天 | LeetCode 8. 找出字符串中第一个匹配项的下标、LeetCode 459. 重复的子字符串 Hsu琛君珩算法 leetcode 职场和发展
代码随想录算法训练营第九天|LeetCode8.找出字符串中第一个匹配项的下标、LeetCode459.重复的子字符串文章链接：代码随想录找出字符串中第一个匹配项的下标代码随想录重复的子字符串视频链接：代码随想录KMP算法理论代码随想录找出字符串中第一个匹配项的下标代码随想录重复的子字符串目录代码随想录算法训练营第九天|LeetCode8.找出字符串中第一个匹配项的下标、LeetCode459.重
世界顶级名校计算机专业，都在用哪些书当教材？(文末送书) 小尘要自信 java 开发语言数据库算法赠书计算机组成
目录01《深入理解计算机系统》02《算法导论》03《计算机程序的构造和解释》04《数据库系统概念》05《计算机组成与设计：硬件/软件接口》06《离散数学及其应用》07《组合数学》08《斯坦福算法博弈论二十讲》参与规则清华、北大、MIT、CMU、斯坦福的学霸们在新学期里要学什么？今天我们来盘点一下那些世界名校计算机专业采用的教材。01《深入理解计算机系统》原书第3版）作者：兰德尔E.布莱恩特大卫R.
KMP算法 Loboqui
一定注意读数据从1偏移开始#includeusingnamespacestd;constintN=1e6+5;chara[N],b[N];intnxt[N];intmain(){scanf("%s%s",b+1,a+1);intn=strlen(a+1),m=strlen(b+1);for(inti=2,l=0;i<=n;i++){while(l&&a[i]!=a[l+1])l=nxt[l];if
爬虫之正则表达式 Lei宝啊 Python(语法爬虫数据分析)正则表达式
个人主页：Lei宝啊愿所有美好如期而遇概念：正则表达式(regularexpression)描述了一种字符串匹配的模式（pattern），正则匹配是一个模糊的匹配(不是精确匹配)如下四个方法经常使用：match()search()findall()finditer()匹配单个字符或数字：匹配说明.匹配除换行符以外的任意字符，当flags被设置为re.S时，可以匹配包含换行符以内的所有字符[]里面是
算法分类合集 weixin_30784945
算法分类合集ACM所有算法数据结构栈，队列，链表哈希表，哈希数组堆，优先队列双端队列可并堆左偏堆二叉查找树Treap伸展树并查集集合计数问题二分图的识别平衡二叉树二叉排序树线段树一维线段树二维线段树树状数组一维树状数组N维树状数组字典树后缀数组，后缀树块状链表哈夫曼树桶，跳跃表Trie树(静态建树、动态建树)AC自动机LCA和RMQ问题KMP算法图论基本图算法图广度优先遍历深度优先遍历拓扑排序割边
ACM算法分类（要学习的东西还很多）还是太年轻
ACM所有算法数据结构栈，队列，链表哈希表，哈希数组堆，优先队列双端队列可并堆左偏堆二叉查找树Treap伸展树并查集集合计数问题二分图的识别平衡二叉树二叉排序树线段树一维线段树二维线段树树状数组一维树状数组N维树状数组字典树后缀数组，后缀树块状链表哈夫曼树桶，跳跃表Trie树(静态建树、动态建树)AC自动机LCA和RMQ问题KMP算法图论基本图算法图广度优先遍历深度优先遍历拓扑排序割边割点强连通分
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v [email protected] 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l

算法——字符串匹配之KMP算法

前言

KMP字符串匹配算法实现

KMP算法预处理过程

KMP算法字符串匹配过程

数组next的优化

你可能感兴趣的:(字符串匹配,算法导论,kmp算法)