weixin_33828101

字符串匹配算法——KMP算法

　　转自——【经典算法】——KMP，深入讲解next数组的求解

一、字符串匹配

　　字符串匹配是计算机的基本任务之一。

　　字符串匹配是什么？举例来说，有一个字符串"BBC ABCDAB ABCDABCDABDE"，我想知道，里面是否包含另一个字符串"ABCDABD"？

　　许多算法可以完成这个任务，Knuth-Morris-Pratt算法（简称KMP）是最常用的之一。它以三个发明者命名，起头的那个K就是著名科学家Donald Knuth（《计算机程序设计艺术》的作者）。

二、KMP算法

　　这个算法不太容易理解，网上有很多解释，但读起来都很费劲。直到读到Jake Boxer的文章，我才真正理解这种算法。下面，我用自己的语言，试图写一篇比较好懂的KMP算法解释。

　1、

　　首先，字符串"BBC ABCDAB ABCDABCDABDE"的第一个字符与搜索词"ABCDABD"的第一个字符，进行比较。因为B与A不匹配，所以搜索词后移一位。

　2、

　　因为B与A不匹配，搜索词再往后移。

　3、

　　就这样，直到字符串有一个字符，与搜索词的第一个字符相同为止。

　4、

　　接着比较字符串和搜索词的下一个字符，还是相同。

　5、

　　直到字符串有一个字符，与搜索词对应的字符不相同为止。

　6、

　　这时，最自然的反应是，将搜索词整个后移一位，再从头逐个比较。这样做虽然可行，但是效率很差，因为你要把"搜索位置"移到已经比较过的位置，重比一遍。

　7、

　　一个基本事实是，当空格与D不匹配时，你其实知道前面六个字符是"ABCDAB"。KMP算法的想法是，设法利用这个已知信息，不要把"搜索位置"移回已经比较过的位置，继续把它向后移，这样就提高了效率。

　8、

　　怎么做到这一点呢？可以针对搜索词，算出一张《部分匹配表》（Partial Match Table）。这张表是如何产生的，后面再介绍，这里只要会用就可以了。

　9、

　　已知空格与D不匹配时，前面六个字符"ABCDAB"是匹配的。查表可知，最后一个匹配字符B对应的"部分匹配值"为2，因此按照下面的公式算出向后移动的位数：

移动位数 = 已匹配的字符数 - 对应的部分匹配值

　　因为 6 - 2 等于4，所以将搜索词向后移动4位。

　10、

　　因为空格与Ｃ不匹配，搜索词还要继续往后移。这时，已匹配的字符数为2（"AB"），对应的"部分匹配值"为0。所以，移动位数 = 2 - 0，结果为 2，于是将搜索词向后移2位。

　11、

　　因为空格与A不匹配，继续后移一位。

　12、

　　逐位比较，直到发现C与D不匹配。于是，移动位数 = 6 - 2，继续将搜索词向后移动4位。

　13、

　　逐位比较，直到搜索词的最后一位，发现完全匹配，于是搜索完成。如果还要继续搜索（即找出全部匹配），移动位数 = 7 - 0，再将搜索词向后移动7位，这里就不再重复了。

　14、

　　下面介绍《部分匹配表》是如何产生的。

　　首先，要了解两个概念："前缀"和"后缀"。 "前缀"指除了最后一个字符以外，一个字符串的全部头部组合；"后缀"指除了第一个字符以外，一个字符串的全部尾部组合。

　15、

　　"部分匹配值"就是"前缀"和"后缀"的最长的共有元素的长度。以"ABCDABD"为例，

   －　"A"的前缀和后缀都为空集，共有元素的长度为0；

　 －　"AB"的前缀为[A]，后缀为[B]，共有元素的长度为0；

　 －　"ABC"的前缀为[A, AB]，后缀为[BC, C]，共有元素的长度0；

　 －　"ABCD"的前缀为[A, AB, ABC]，后缀为[BCD, CD, D]，共有元素的长度为0；

　 －　"ABCDA"的前缀为[A, AB, ABC, ABCD]，后缀为[BCDA, CDA, DA, A]，共有元素为"A"，长度为1；

　　－　"ABCDAB"的前缀为[A, AB, ABC, ABCD, ABCDA]，后缀为[BCDAB, CDAB, DAB, AB, B]，共有元素为"AB"，长度为2；

　　－　"ABCDABD"的前缀为[A, AB, ABC, ABCD, ABCDA, ABCDAB]，后缀为[BCDABD, CDABD, DABD, ABD, BD, D]，共有元素的长度为0。

　16、

　　"部分匹配"的实质是，有时候，字符串头部和尾部会有重复。比如，"ABCDAB"之中有两个"AB"，那么它的"部分匹配值"就是2（"AB"的长度）。搜索词移动的时候，第一个"AB"向后移动4位（字符串长度-部分匹配值），就可以来到第二个"AB"的位置。

　　算法时间复杂度为O(m+n)（其中m为字符段长度，n为匹配模式的长度）。

三、算法实现

　　1、next数组的求解思路

　　通过上文完全可以对kmp算法的原理有个清晰的了解，那么下一步就是编程实现了，其中最重要的就是如何根据待匹配的模版字符串求出对应每一位的最大相同前后缀的长度。我先给出我的代码：

/*
若模板字符串P为"ABCABDDABCABC",要求最后一个字符‘C’的最大前后缀长度
1、首先得到其前面12个字符的最大前后缀长度为5，即k=5
2、按照程序的流程，此时执行while(k > 0 && P[q] != P[k]),q=12（数组下标从0开始）
因为P[q]=P[12]!=P[k]=P[5](P[12]='C',P[5]='D');
3、满足while循环，执行语句k = next[k - 1];因为next数组下标从0开始，所以k=next[5-1]=next[4]
实际代表的是第五个字符的最大前后缀长度；因为"ABCAB"的最大前后缀长度为2，所以k=next[4]=2;
4、然后再执行while条件while(k > 0 && P[q] != P[k])，此时P[q]=P[12]='C'=P[k]=P[2];所以此时while条件不成立，
跳出while，往下执行，k++,k=3;next[q] = k;即next[12]=3;实际情况也是如此，
字符串"ABCABDDABCABC"的最大前后缀长度为3，即"ABC"
5、如此，即完成了一次for循环的判断
*/
void makeNext(const char P[], int next[])
{
    int q, k;//q:模版字符串下标；k:当前定位的字符串的最大前后缀长度
    int m = strlen(P);//模版字符串长度
    next[0] = 0;//因为数组下标从0开始，所以使用next[0]表示模版字符串的第一个字符的最大前后缀长度为0
    //for循环，从第二个字符开始，依次计算每一个字符对应的next值
    for (q = 1, k = 0; q < m; ++q)
    {
        //递归的求出P[0]···P[q]的最大的相同的前后缀长度k
        while (k > 0 && P[q] != P[k])//当下一个字符与当前最大前后缀长度所对应的字符(其实是最大前后缀长度所对应字符的下一个字符，因为数组下标从0开始)不一致时，说明此时失配 将会继续迭代，直到找到能匹配的字符或最大前后缀长度为0时结束while
            //数组下标从0开始，所以k-1才是k串长字符串
            k = next[k - 1];//则将重新定位某位置处的最大前后缀长度，此处的“某位置处”指的是单纯的k串长字符串;此处求的即是k串长字符串的最大前后缀长度，因为为了避免失配时能进行跳跃式匹配，所以要不断迭代，找到上一个的最大前后缀长度
        //如果相等，说明此时仍然能配对，那么最大相同前后缀长度加1
        if (P[q] == P[k])
        {
            k++;
        }
        next[q] = k;//赋值得到当前模板P的第q+1个字符（因为数组下标从0开始）的最大前后缀长度
    }
}

　　现在我着重讲解一下while循环所做的工作：

　　已知前一步计算时最大相同的前后缀长度为k（k>0），即P[0]···P[k-1]；
　　此时比较第k项P[k]与P[q],如图1所示
如果P[K]等于P[q]，那么很简单跳出while循环;
关键！关键有木有！关键如果不等呢？？？那么我们应该利用已经得到的next[0]···next[k-1]来求P[0]···P[k-1]这个子串中最大相同前后缀，可能有同学要问了——为什么要求P[0]···P[k-1]的最大相同前后缀呢？？？是啊！为什么呢？原因在于P[k]已经和P[q]失配了，而且P[q-k] ··· P[q-1]又与P[0] ···P[k-1]相同，看来P[0]···P[k-1]这么长的子串是用不了了，那么我要找个同样也是P[0]打头、P[k-1]结尾的子串即P[0]···P[j-1](j==next[k-1])，看看它的下一项P[j]是否能和P[q]匹配。如图2所示

　　2、KMP算法完整代码

#include 
#include
#include<string.h>
using namespace std;
/*
若模板字符串P为"ABCABDDABCABC",要求最后一个字符‘C’的最大前后缀长度
1、首先得到其前面12个字符的最大前后缀长度为5，即k=5
2、按照程序的流程，此时执行while(k > 0 && P[q] != P[k]),q=12（数组下标从0开始）
因为P[q]=P[12]!=P[k]=P[5](P[12]='C',P[5]='D');
3、满足while循环，执行语句k = next[k - 1];因为next数组下标从0开始，所以k=next[5-1]=next[4]
实际代表的是第五个字符的最大前后缀长度；因为"ABCAB"的最大前后缀长度为2，所以k=next[4]=2;
4、然后再执行while条件while(k > 0 && P[q] != P[k])，此时P[q]=P[12]='C'=P[k]=P[2];所以此时while条件不成立，
跳出while，往下执行，k++,k=3;next[q] = k;即next[12]=3;实际情况也是如此，
字符串"ABCABDDABCABC"的最大前后缀长度为3，即"ABC"
5、如此，即完成了一次for循环的判断
*/
void makeNext(const char P[], int next[])
{
    int q, k;//q:模版字符串下标；k:当前定位的字符串的最大前后缀长度
    int m = strlen(P);//模版字符串长度
    next[0] = 0;//因为数组下标从0开始，所以使用next[0]表示模版字符串的第一个字符的最大前后缀长度为0
    //for循环，从第二个字符开始，依次计算每一个字符对应的next值
    for (q = 1, k = 0; q < m; ++q)
    {
        //递归的求出P[0]···P[q]的最大的相同的前后缀长度k
        while (k > 0 && P[q] != P[k])//当下一个字符与当前最大前后缀长度所对应的字符(其实是最大前后缀长度所对应字符的下一个字符，因为数组下标从0开始)不一致时，说明此时失配 将会继续迭代，直到找到能匹配的字符或最大前后缀长度为0时结束while
            //数组下标从0开始，所以k-1才是k串长字符串
            k = next[k - 1];//则将重新定位某位置处的最大前后缀长度，此处的“某位置处”指的是单纯的k串长字符串;此处求的即是k串长字符串的最大前后缀长度，因为为了避免失配时能进行跳跃式匹配，所以要不断迭代，找到上一个的最大前后缀长度
        //如果相等，说明此时仍然能配对，那么最大相同前后缀长度加1
        if (P[q] == P[k])
        {
            k++;
        }
        next[q] = k;//赋值得到当前模板P的第q+1个字符（因为数组下标从0开始）的最大前后缀长度
    }
}

int kmp(const char T[], const char P[], int next[])
{
    int n, m;//目标字符串和模板字符串的长度
    int i, q;//q表示上一次迭代匹配了多少个字符，i表示这次迭代从T的哪个字符开始比较
    n = strlen(T);
    m = strlen(P);
    makeNext(P, next);
    cout << "模板P各子串的最大前后缀长度：" << endl;
    for (i = 0; i < strlen(P); ++i)
    {
        cout << next[i] << " ";
    }
    cout << endl;
    for (i = 0, q = 0; i < n; ++i)
    {
        while (q > 0 && P[q] != T[i])
            q = next[q - 1];//找到上一次迭代匹配了多少个字符，即不重头开始查找，进行跳跃式匹配
        if (P[q] == T[i])//若匹配
        {
            q++;//已匹配的字符数+1
        }
        if (q == m)//已匹配的字符数与模板P的长度一致时，说明目标T中包含模板P
        {
            cout << "Pattern occurs with shift:" << (i - m + 1) << endl;
            return 0;//能找到，返回0
        }
    }
    return 1;//找不到，返回1
}

int main()
{
    int i;
    int next[20] = { 0 };
    char T[] = "ababxbababcadfdsss";
//    char P[] = "abcdabd";//找不到的情形
    char P[] = "abcad";//能找到的情形
    cout << "T:" << endl;
    cout << T << endl;
    cout << "P:" << endl;
    cout << P << endl;
    int flag=kmp(T, P, next);//是否包含P的标志变量
    cout << "匹配结果：" << endl;
    if (flag != 0)
        cout << "Pattern " << "\"" << P << "\"" << " does not occurs in string " << "\"" << T << "\"" << endl;
    else
        cout << "Pattern " << "\"" << P << "\"" << " occurs in string " << "\"" << T << "\"" << endl;

    return 0;
}

运行结果：

　　匹配成功：

　　匹配失败：

数据结构学习——KMP算法 uwvwko 算法数据结构学习 c++kmp
//KMP算法#include#include#include#includeusingnamespacestd;//next数组值的推导voidgetNext(string&str,vector&next){intstrlong=str.size();//next数组的0位为0next[0]=0;//i为当前字符的位置，从1位（第2个开始）inti=1;//length为当前字符之前的最长匹配子
Power Strings POJ - 2406（kmp算法求最小循环节）
poj-2406题目大意：给出一个字符串问它最多由多少相同的字串组成如abababab由4个ab组成题目分析：要用到KMP中的next数组来计算最小循环节。KMP最小循环节、循环周期：定理：假设S的长度为len，则S存在最小循环节，循环节的长度L为len-next[len]，子串为S[0…len-next[len]-1]。（1）如果len可以被len-next[len]整除，则表明字符串S可以完全
《算法笔记》12.2小节——字符串专题-＞KMP算法问题 C: 剪花布条圣保罗的大教堂《算法笔记》算法
题目描述一块花布条，里面有些图案，另有一块直接可用的小饰条，里面也有一些图案。对于给定的花布条和小饰条，计算一下能从花布条中尽可能剪出几块小饰条来呢？输入输入中含有一些数据，分别是成对出现的花布条和小饰条，其布条都是用可见ASCII字符表示的，可见的ASCII字符有多少个，布条的花纹也有多少种花样。花纹条和小饰条不会超过1000个字符长。如果遇见#字符，则不再进行工作。输出输出能从花纹布中剪出的最
如何理解KMP算法中的next数组 jackson凌 C语言算法实现专栏算法 c语言
对KMP算法的理解一、辅助理解的资料KMP动画图解（b站）CSDN博客对求next数组的理解（b站）补充：对next数组的初步理解天勤考研（易懂版本）提醒：按照顺序依次往下看，就会逐渐理解next数组的推到过程和代码的原理二、KMP基本思想回顾为了充分利用已经匹配的字符信息，避免多次回溯造成的重复比较而降低了时间效率两个关键点(1)主串指针不回溯(2)字串指针回溯有讲究在大多数理解的材料中都会以模
【数据结构与算法】KMP算法 4Forsee 算法
引言字符串查找的朴素算法中，我们每次对目标字符串的查找失败后，目标字符串的指针回到0初始位置，这样的解法在处理大规模数据时往往不尽人意。为了避免朴素算法的低效，D.E.Knuth、J.H.MorTis和V.R.Pratt联合发表了一个模式匹配算法即KMP算法——分别取三位学者名字的首字母得名，它可以一定程度上避免重复遍历的时间问题。前缀和后缀在了解KMP算法前，我们需要补充一个概念即字符串的前缀和
2019AndroidBATJ面试题设计模式&算法专题总结 m0_64314318 程序员面试 android 移动开发
10.给阿里2万多名员工按年龄排序应该选择哪个算法？11.GC算法(各种算法的优缺点以及应用场景)12.蚁群算法与蒙特卡洛算法13.子串包含问题(KMP算法)写代码实现14.一个无序，不重复数组，输出N个元素，使得N个元素的和相加为M，给出时间复杂度、空间复杂度。手写算法15.万亿级别的两个URL文件A和B，如何求出A和B的差集C(提示：Bit映射->hash分组->多文件读写效率->磁盘寻址以及
Java语言常用的算法 TPBoreas 算法 java 算法开发语言
Java语言常用的算法包括：排序算法：冒泡排序、选择排序、插入排序、希尔排序、归并排序、快速排序、堆排序等。查找算法：顺序查找、二分查找、哈希查找等。字符串匹配算法：暴力匹配、KMP算法、Boyer-Moore算法等。图论算法：最短路径算法、最小生成树算法、拓扑排序等。动态规划算法：背包问题、最长公共子序列、最长上升子序列等。贪心算法：最小生成树、单源最短路径等。分治算法：快速排序、归并排序等。网
4月30日算法刷题新生农民 java 算法开发语言
importjavax.xml.stream.events.Characters;importjava.util.*;publicclasstest_04_27{//KMP算法//替换空格publicstaticvoidtest1(Strings){StringBuilderstringBuilder=newStringBuilder();for(inti=0;ihashMap=newTreeMa
数据结构c+java--------模式匹配算法 javaisC 算法数据结构
c语言实现，普通模式匹配和KMP算法匹配(未实现next数组)#include#include#includeintcommon(char*target,intlen,char*t,intn);intkmp(char*target,char*t,intnext[]);intmain(void){char*target="googlogoogoogle";char*t="google";//朴素模式
题解：蓝桥杯 2024 总决赛重复的串凛冻蓝桥杯算法 c++数据结构
题目链接思路看到字符串匹配，方案数关键字，自然想到dp与kmp算法的结合，看到nnn的数量比较大，不用慌，先把朴素的方程想出来再优化。一般地可以想到方程dp[i][j][k]dp[i][j][k]dp[i][j][k]为字符串序列长度为iii并且当前匹配到模式串的长度为jjj，总匹配次数恰好为kkk次的方案数。转移的方式就是，我们枚举每个i,j,ki,j,ki,j,k再枚举当前状态下填的字母，通过
leetcode算法题459——重复的子字符串 KMP算法实现诶你爱我吗 LeetCode leetcode 算法职场和发展
参考资料KMP算法易懂版从头到尾彻底理解KMPKMP算法之求next数组代码讲解我觉得最主要是理解这个图，理解为什么要递归next[k]给定一个非空的字符串s，检查是否可以通过由它的一个子串重复多次构成。解法一枚举遍历所有可能的情况，算法超时classSolution{public:boolrepeatedSubstringPattern(strings){intlen=s.length();if
LeetCode[28]找出字符串中第一个匹配项的下标（KMP版本）月亮被咬碎成星星新坑刷题 leetcode 算法
思路：一开始我使用暴力过的，但是感觉还是不完美，想学习一下KMP的写法，所以这篇笔记就来了，首先KMP算法就要先维护一个最长相等前后缀的一个数组（统称前缀表），那么这个数组为什么能找出相等字符串呢？因为这个前缀表是维护了当前模式串最长前后缀，一旦出现不相等的情况，就可以根据不相等的位置的前一个位置的下标的值，就是需要回退的次数。我的理解就是先想KMP算法的时间复杂度，是O（n+m），那么就是一个串
Day9:KMP算法总结 LeetCode 28. 找出字符串中第一个匹配项的下标 459.重复的子字符串魔法少女小严 java 算法
28.找出字符串中第一个匹配项的下标给你两个字符串haystack和needle，请你在haystack字符串中找出needle字符串的第一个匹配项的下标（下标从0开始）。如果needle不是haystack的一部分，则返回-1。示例1：输入：haystack="sadbutsad",needle="sad"输出：0解释："sad"在下标0和6处匹配。第一个匹配项的下标是0，所以返回0。示例2：输
DAY 45 leetcode 28的kmp算法实现 Fantasydg leetcode 算法职场和发展
KMP算法的思路例：文本串：aabaabaaf模式串：aabaaf两个指针分别指向上下两串，当出现分歧时，并不将上下的都重新回退，而是利用“next数组”获取已经比较过的信息，上面的指针不动，而下面的回退到第n个如：i指向b文本串：aabaabaaf模式串：aabaafj0&&s.charAt(j)!=s.charAt(i)){j=arr[j-1];}//如果相同，j先往前移动一格，再将arr[i
Python字符串匹配算法详解闲人编程进阶算法案例 python 算法开发语言字符串匹配朴素算法 Rabin-Karp Boyer-Moore
目录Python字符串匹配算法详解引言一、字符串匹配的基本概念1.1字符串匹配的定义1.2字符串匹配的应用二、常见的字符串匹配算法2.1朴素匹配算法2.1.1算法原理2.1.2Python实现2.1.3使用案例2.2KMP算法2.2.1算法原理2.2.2Python实现2.2.3使用案例2.3Boyer-Moore算法2.3.1算法原理2.3.2Python实现2.3.3使用案例2.4Rabin-
考研数据结构之串的模式匹配算法——KMP算法详解（包含真题及解析）老北京儿码农数据结构与算法考研数据结构算法
考研数据结构之串的模式匹配算法——KMP算法详解一、KMP算法背景与核心思想KMP算法（Knuth-Morris-Pratt算法）是字符串匹配领域的经典算法，由三位科学家共同提出。相较于传统的暴力匹配算法（BF算法），KMP通过预处理模式串生成部分匹配表（next数组），在匹配失败时跳过已知不可能匹配的位置，从而将时间复杂度优化至O(n+m)（主串长度n，模式串长度m）。二、KMP算法核心概念1.
【刷题2025】贪心算法+KMP算法+暴力枚举+扫描树线段树+LFU缓存 cIlIegia_1234 算法贪心算法
1.贪心算法（1）火锅题目描述入职后，导师会请你吃饭，你选择了火锅。火锅里会在不同时间下很多菜.不同食材要煮不同的时间，才能变得刚好合适。你希望吃到最多的刚好合适的菜，但你的手速不够快，用m代表手速，每次下手捞菜后至少要过m秒才能再捞(每次只能捞一个)。那么用最合理的策略，最多能吃到多少刚好合适的菜?输入描述第一行两个整数n，m，其中n代表往锅里下的菜的个数，m代表手速。(1=m:ans+=1pr
3.数据结构-串、数组和广义表这一wa是晚安数据结构-考研数据结构 c++算法
串、数组和广义表3.1串3.1.1串的类型定义、存储结构及其运算串的顺序存储串的堆式顺序存储结构串的链式存储3.1.2串的模式匹配算法BF算法*KMP算法（待更新）3.2数组3.2.1数组的顺序存储3.2.2特殊矩阵的压缩存储对称矩阵三角矩阵对角矩阵3.3广义表*案例病毒感染检测3.1串串是由零个或多个字符组成的有限序列，一般记为s="a1a2...an"(n≥0)s="a_1a_2...a_n"
数据结构与算法丨串 Want595 C语言数据结构与算法算法数据结构串模式匹配
目录一、概述1.1串的概念1.2几个术语二、串的表示和实现2.1串的顺序存储表示2.1.1串初始化2.1.2求串长2.1.3判断串是否为空2.1.4串赋值2.1.5串复制2.1.6串比较2.1.7取子串2.1.8串连接2.2串的链式存储表示三、串的模式匹配1.概念2.模式匹配的基本算法（BF算法）3.KMP算法3.1next数组3.2KMP算法4.Horspool算法4.1概念4.2Horspoo
KMP 算法（C++实现）饕餮怪程序猿 C++算法设计与实现算法 c++开发语言
本文实现一个KMP算法案例，用于字符串匹配。KMP算法通过预处理模式串，避免在匹配过程中重复比较字符，从而提高效率。问题描述给定一个文本串text和一个模式串pattern，如何高效地在文本串中查找模式串的所有出现位置？算法思想KMP算法的核心思想是利用部分匹配表（PartialMatchTable,PMT），也称为next数组，来跳过不必要的比较。具体步骤如下：预处理模式串，生成next数组。n
猛攻大模拟day2！想跑步的小弱鸡 c++
字符串匹配纯粹的kmp算法，让我顺便又复习了一下，然后加上了一个大小写模糊匹配代码如下中间卡了一个点，后面发现是next数组得在m不同状态更新。但acwing上有更简洁得做法，决定学习一下find函数（服了何必写这个kmp呢）大小写转换还是一个个换吧没必要用高级函数（其实就是懒得背了）#includeusingnamespacestd;constintN=105;stringstr;intn,m;
kmp算法洞阳数据结构与算法算法数据结构
kmp算法C语言实现#include#include#include//构建部分匹配表（next数组）voidcomputeLPSArray(constchar*pattern,intpattern_len,int*lps){intlength=0;//当前最长公共前后缀长度lps[0]=0;//首字符无前缀，直接置0inti=1;while(i
Unity开发中KMP算法的理解和应用 unityのkiven 算法 unity
1.KMP算法简介KMP（Knuth-Morris-Pratt）算法是一种用于字符串匹配的高效算法，相比于暴力匹配，它能在O(n+m)时间复杂度下完成匹配，其中n是文本串长度，m是模式串长度。其核心思想是部分匹配表（next数组），用于在匹配失败时减少回溯，从而提升匹配效率。2.KMP算法的核心原理KMP算法主要包含两个部分：构建部分匹配表（next数组）：计算模式串自身的重复前后缀信息，减少匹配
常见算法模板（python）雨拾 python 算法深度优先
常见算法模板（python）二分搜索（实数搜索、整数搜索）前缀和、差分数组深度优先搜索DFS宽度优先搜索BFS并查集树状数组线段树稀疏表动态规划（矩阵）快速幂字符串匹配算法-KMPFloyd算法Dijkstra算法Bellman-Ford算法SPFA算法Prim算法Kruskal算法二分搜索（实数搜索、整数搜索）#-*-coding:utf-8-*-#@Author:BYW-yuwei#@Soft
Boyer - Moore 字符串匹配算法与 C# 代码实现 CoreFMEA软件技术算法算法 c#开发语言
介绍Boyer-Moore算法是一种高效的字符串搜索算法，由RobertS.Boyer和JStrotherMoore在1977年提出。该算法在搜索模式串时，利用了两种启发式规则，即坏字符规则（BadCharacterRule）和好后缀规则（GoodSuffixRule），以此来跳过尽可能多的字符，从而减少比较次数，提高搜索效率。坏字符规则当在文本串和模式串进行比较时，若出现不匹配的字符（即坏字符）
P3375 【模板】KMP 好好学习^按时吃饭算法
题目来自洛谷网站：思路：从题目名字知道这是KMP模板题目，对于KMP算法，就两步，1、构造next数组。2、在s1中找到s2出现的位置。KMP代码：#includeusingnamespacestd;constintN=1e6+10;chars1[N],s2[N];//全局变量名字不能定义为next//C++标准库中有一个函数名字是nextintnext1[N];//ne数组intmain(){/
字符串模式匹配——Brute-Force暴力查找算法以及KMP算法具象图解，超级详细！！ Elnaij 算法数据结构 c语言
目录前言1.串的模式匹配算法目的1.1Brute-Force算法图解Brute-force算法Brute-force暴力查找算法的弊端1.2KMP算法next数组1.2.1Getnext——求next数组的函数图解Getnext函数Getnext函数总结1.2.2KMP模式匹配操作KMP匹配过程图解KMP算法总结结束语：前言这两个算法，尤其是KMP算法，可以说是让许多算法小白头痛的了。如果你也十分
KMP算法详解--C语言实现爱钻的嵌小白算法数据结构
1.KMP的工作原理在匹配主串之前，先计算出模式串每个字符的最长公共前后缀保存在next数组中。然后使用两个变量分别指向模式串与主串，依次进行比较，如果遇到不相等的情况，模式串前移到最长公共前后缀+1的位置继续与主串进行比较。2.KMP的算法思想通过记录下模式串每个字符的最长公共前后缀，在匹配失败后不必回溯至开始位置，而是回溯到最长公共前后缀位置继续比较，节省时间。我们把模式串的每个字符的最长公共
哈希基础例题稠密的连通图算法复习之字符串字符串算法哈希数据结构 hash
文章目录例题一：子串查找例题二：字符串的删除操作例题三：字符串合并操作的应用哈希前置知识请戳这里->哈希绪论昨天我们对哈希的基础知识有了一定的了解，并已经知道了如何求子串、拼接子串的哈希值，今天我们就这两个操作分析一些基础例题，加深理解和掌握。例题一：子串查找LOJ#103.子串查找显然这是一道kmp算法的模板题朴素的做法是枚举文本串的每一个位置作为模式串开始比较的位置。设枚举到主串的位置是iii
LeetCode——1910. 删除一个字符串中所有出现的给定子字符串(Remove All Occurrences of a Substring)[中等]——分析及代码（Java）江南土豆数据结构与算法 LeetCode Java 题解
LeetCode——1910.删除一个字符串中所有出现的给定子字符串[RemoveAllOccurrencesofaSubstring][中等]——分析及代码[Java]一、题目二、分析及代码1.KMP算法（1）思路（2）代码（3）结果三、其他一、题目给你两个字符串s和part，请你对s反复执行以下操作直到所有子字符串part都被删除：找到s中最左边的子字符串part，并将它从s中删除。请你返回从
JAVA中的Enum 周凡杨 java enum 枚举
Enum是计算机编程语言中的一种数据类型---枚举类型。在实际问题中，有些变量的取值被限定在一个有限的范围内。例如，一个星期内只有七天我们通常这样实现上面的定义： public String monday; public String tuesday; public String wensday; public String thursday
赶集网mysql开发36条军规 Bill_chen mysql 业务架构设计 mysql调优 mysql性能优化
(一)核心军规 (1)不在数据库做运算 cpu计算务必移至业务层； (2)控制单表数据量 int型不超过1000w，含char则不超过500w；合理分表；限制单库表数量在300以内； (3)控制列数量字段少而精，字段数建议在20以内
Shell test命令 daizj shell 字符串 test 数字文件比较
Shell test命令 Shell中的 test 命令用于检查某个条件是否成立，它可以进行数值、字符和文件三个方面的测试。数值测试参数说明 -eq 等于则为真 -ne 不等于则为真 -gt 大于则为真 -ge 大于等于则为真 -lt 小于则为真 -le 小于等于则为真实例演示： num1=100 num2=100if test $[num1]
XFire框架实现WebService(二) 周凡杨 java webservice
有了XFire框架实现WebService(一)，就可以继续开发WebService的简单应用。 Webservice的服务端(WEB工程)：两个java bean类： Course.java package cn.com.bean; public class Course { private
重绘之画图板朱辉辉33 画图板
上次博客讲的五子棋重绘比较简单，因为只要在重写系统重绘方法paint（）时加入棋盘和棋子的绘制。这次我想说说画图板的重绘。画图板重绘难在需要重绘的类型很多，比如说里面有矩形，园，直线之类的，所以我们要想办法将里面的图形加入一个队列中，这样在重绘时就
Java的IO流西蜀石兰 java
刚学Java的IO流时，被各种inputStream流弄的很迷糊，看老罗视频时说想象成插在文件上的一根管道，当初听时觉得自己很明白，可到自己用时，有不知道怎么代码了。。。每当遇到这种问题时，我习惯性的从头开始理逻辑，会问自己一些很简单的问题，把这些简单的问题想明白了，再看代码时才不会迷糊。 IO流作用是什么？答：实现对文件的读写，这里的文件是广义的； Java如何实现程序到文件
No matching PlatformTransactionManager bean found for qualifier 'add' - neither 林鹤霄
java.lang.IllegalStateException: No matching PlatformTransactionManager bean found for qualifier 'add' - neither qualifier match nor bean name match! 网上找了好多的资料没能解决，后来发现：项目中使用的是xml配置的方式配置事务，但是
Row size too large (> 8126). Changing some columns to TEXT or BLOB aigo column
原文：http://stackoverflow.com/questions/15585602/change-limit-for-mysql-row-size-too-large 异常信息： Row size too large (> 8126). Changing some columns to TEXT or BLOB or using ROW_FORMAT=DYNAM
JS 格式化时间 alxw4616 JavaScript
/** * 格式化时间 2013/6/13 by 半仙 [email protected] * 需要 pad 函数 * 接收可用的时间值. * 返回替换时间占位符后的字符串 * * 时间占位符:年 Y 月 M 日 D 小时 h 分 m 秒 s 重复次数表示占位数 * 如 YYYY 4占4位 YY 占2位<p></p> * MM DD hh mm
队列中数据的移除问题百合不是茶队列移除
队列的移除一般都是使用的remov();都可以移除的,但是在昨天做线程移除的时候出现了点问题,没有将遍历出来的全部移除, 代码如下; // package com.Thread0715.com; import java.util.ArrayList; public class Threa
Runnable接口使用实例 bijian1013 java thread Runnable java多线程
Runnable接口 a. 该接口只有一个方法：public void run(); b. 实现该接口的类必须覆盖该run方法 c. 实现了Runnable接口的类并不具有任何天
oracle里的extend详解 bijian1013 oracle 数据库 extend
扩展已知的数组空间，例： DECLARE TYPE CourseList IS TABLE OF VARCHAR2(10); courses CourseList; BEGIN -- 初始化数组元素，大小为3 courses := CourseList('Biol 4412 ', 'Psyc 3112 ', 'Anth 3001 '); --
【httpclient】httpclient发送表单POST请求 bit1129 httpclient
浏览器Form Post请求浏览器可以通过提交表单的方式向服务器发起POST请求，这种形式的POST请求不同于一般的POST请求 1. 一般的POST请求，将请求数据放置于请求体中，服务器端以二进制流的方式读取数据，HttpServletRequest.getInputStream()。这种方式的请求可以处理任意数据形式的POST请求，比如请求数据是字符串或者是二进制数据 2. Form
【Hive十三】Hive读写Avro格式的数据 bit1129 hive
1. 原始数据 hive> select * from word; OK 1 MSN 10 QQ 100 Gtalk 1000 Skype 2. 创建avro格式的数据表 hive> CREATE TABLE avro_table(age INT, name STRING)STORE
nginx+lua+redis自动识别封解禁频繁访问IP ronin47
在站点遇到攻击且无明显攻击特征，造成站点访问慢，nginx不断返回502等错误时，可利用nginx+lua+redis实现在指定的时间段内，若单IP的请求量达到指定的数量后对该IP进行封禁，nginx返回403禁止访问。利用redis的expire命令设置封禁IP的过期时间达到在指定的封禁时间后实行自动解封的目的。一、安装环境： CentOS x64 release 6.4(Fin
java-二叉树的遍历-先序、中序、后序（递归和非递归）、层次遍历 bylijinnan java
import java.util.LinkedList; import java.util.List; import java.util.Stack; public class BinTreeTraverse { //private int[] array={ 1, 2, 3, 4, 5, 6, 7, 8, 9 }; private int[] array={ 10,6,
Spring源码学习-XML 配置方式的IoC容器启动过程分析 bylijinnan java spring IOC
以FileSystemXmlApplicationContext为例，把Spring IoC容器的初始化流程走一遍： ApplicationContext context = new FileSystemXmlApplicationContext ("C:/Users/ZARA/workspace/HelloSpring/src/Beans.xml&q
[科研与项目]民营企业请慎重参与军事科技工程 comsci 企业
军事科研工程和项目并非要用最先进，最时髦的技术，而是要做到“万无一失” 而民营科技企业在搞科技创新工程的时候，往往考虑的是技术的先进性，而对先进技术带来的风险考虑得不够，在今天提倡军民融合发展的大环境下，这种“万无一失”和“时髦性”的矛盾会日益凸显。。。。。。所以请大家在参与任何重大的军事和政府项目之前，对
spring 定时器-两种方式 cuityang spring quartz 定时器
方式一：间隔一定时间运行 <bean id="updateSessionIdTask" class="com.yang.iprms.common.UpdateSessionTask" autowire="byName" /> <bean id="updateSessionIdSchedule
简述一下关于BroadView站点的相关设计 damoqiongqiu view
终于弄上线了，累趴，戳这里http://www.broadview.com.cn 简述一下相关的技术点前端：jQuery+BootStrap3.2+HandleBars，全站Ajax（貌似对SEO的影响很大啊！怎么破？），用Grunt对全部JS做了压缩处理，对部分JS和CSS做了合并（模块间存在很多依赖，全部合并比较繁琐，待完善）。后端：U
运维 PHP问题汇总 dcj3sjt126com windows2003
1、Dede(织梦)发表文章时,内容自动添加关键字显示空白页解决方法：后台>系统>系统基本参数>核心设置>关键字替换（是/否），这里选择“是”。后台>系统>系统基本参数>其他选项>自动提取关键字，这里选择“是”。 2、解决PHP168超级管理员上传图片提示你的空间不足网站是用PHP168做的，反映使用管理员在后台无法
mac 下安装php扩展 - mcrypt dcj3sjt126com PHP
MCrypt是一个功能强大的加密算法扩展库，它包括有22种算法，phpMyAdmin依赖这个PHP扩展，具体如下：下载并解压libmcrypt-2.5.8.tar.gz。在终端执行如下命令： tar zxvf libmcrypt-2.5.8.tar.gz cd libmcrypt-2.5.8/ ./configure --disable-posix-threads --
MongoDB更新文档 [四] eksliang mongodb Mongodb更新文档
MongoDB更新文档转载请出自出处：http://eksliang.iteye.com/blog/2174104 MongoDB对文档的CURD，前面的博客简单介绍了，但是对文档更新篇幅比较大，所以这里单独拿出来。语法结构如下： db.collection.update( criteria, objNew, upsert, multi) 参数含义参数
Linux下的解压，移除，复制，查看tomcat命令 y806839048 tomcat
重复myeclipse生成webservice有问题删除以前的，干净 1、先切换到：cd usr/local/tomcat5/logs 2、tail -f catalina.out 3、这样运行时就可以实时查看运行日志了 Ctrl+c 是退出tail命令。有问题不明的先注掉 cp /opt/tomcat-6.0.44/webapps/g
Spring之使用事务缘由(3-XML实现) ihuning spring
用事务通知声明式地管理事务事务管理是一种横切关注点。为了在 Spring 2.x 中启用声明式事务管理，可以通过 tx Schema 中定义的 <tx:advice> 元素声明事务通知，为此必须事先将这个 Schema 定义添加到 <beans> 根元素中去。声明了事务通知后，就需要将它与切入点关联起来。由于事务通知是在 <aop:
GCD使用经验与技巧浅谈啸笑天 GC
前言 GCD(Grand Central Dispatch)可以说是Mac、iOS开发中的一大“利器”，本文就总结一些有关使用GCD的经验与技巧。 dispatch_once_t必须是全局或static变量这一条算是“老生常谈”了，但我认为还是有必要强调一次，毕竟非全局或非static的dispatch_once_t变量在使用时会导致非常不好排查的bug，正确的如下： 1
linux（Ubuntu）下常用命令备忘录1 macroli linux 工作 ubuntu
在使用下面的命令是可以通过--help来获取更多的信息1,查询当前目录文件列表：ls ls命令默认状态下将按首字母升序列出你当前文件夹下面的所有内容，但这样直接运行所得到的信息也是比较少的，通常它可以结合以下这些参数运行以查询更多的信息： ls / 显示/.下的所有文件和目录 ls -l 给出文件或者文件夹的详细信息 ls -a 显示所有文件，包括隐藏文
nodejs同步操作mysql qiaolevip 学习永无止境每天进步一点点 mysql nodejs
// db-util.js var mysql = require('mysql'); var pool = mysql.createPool({ connectionLimit : 10, host: 'localhost', user: 'root', password: '', database: 'test', port: 3306 });
一起学Hive系列文章 superlxw1234 hive Hive入门
[一起学Hive]系列文章目录贴，入门Hive，持续更新中。 [一起学Hive]之一—Hive概述，Hive是什么 [一起学Hive]之二—Hive函数大全-完整版 [一起学Hive]之三—Hive中的数据库(Database)和表(Table) [一起学Hive]之四-Hive的安装配置 [一起学Hive]之五-Hive的视图和分区 [一起学Hive
Spring开发利器：Spring Tool Suite 3.7.0 发布 wiselyman spring
Spring Tool Suite(简称STS)是基于Eclipse，专门针对Spring开发者提供大量的便捷功能的优秀开发工具。在3.7.0版本主要做了如下的更新：将eclipse版本更新至Eclipse Mars 4.5 GA Spring Boot(JavaEE开发的颠覆者集大成者，推荐大家学习)的配置语言YAML编辑器的支持(包含自动提示，

字符串匹配算法——KMP算法

字符串匹配算法——KMP算法

一、字符串匹配

二、KMP算法

三、算法实现

你可能感兴趣的:(字符串匹配算法——KMP算法)