子串查找

不想贴网页这道题搞得我筋疲力尽。
虽然是道kmp模板题但对于我这种渣渣真的读了好久代码。
首先,我们发现因为有重叠的情况,暴力会一次又一次地寻找与开头毫不相关的字符,于是kmp就来了。。。它是用来跳过已判断的合法区间的。
先举个栗子:

abccccjhabcbb

可以发现,串中有2组abc可作为开头。(与大字符串匹配时要用整条小字符串,可这也意味着大字符串中必包含2个abc,都可作为小串的开头)

因此,我们定义nex数组来表示i号位之前与开头串匹配的串的长度。至于为什么是while循环?为了找到与i号位相匹配的前面位置,因为i号位只有一次机会访问,故不能漏解。

再来个数据理解一下:

abcxabcyWSEBWabcxabcx

首先,第一个y的nex为第一个x,那遍历到第一个y和第三个x时,j就会跳回第一个x,通过之前的性质我们可以判断这是一定合法的。

接下来就好好研读代码吧!(嘿嘿嘿

#include
#include
using namespace std;
string a, b;
int len, nex[1000002];
int kmp() {
	int cnt = 0;
	len = b.length();
	for(int i = 1, j = 0; b[i]; i ++) {
		while(j && b[i] != b[j])
			j = nex[j];
		nex[i + 1] = (b[i] == b[j]) ? ++ j : 0;
	}
	for(int i = 0, j = 0; a[i]; i ++) {
		while(j && b[j] != a[i])
			j = nex[j];
		if(b[j] == a[i] && ++ j == len) {
			cnt ++;
			j = nex[j];
		}
	}
	return cnt;
}
int main() {
	cin >> a >> b;
	printf("%d\n", kmp());
	return 0;
}

最后的话:
为什么第2个for循环中匹配成功了不会为j = 0?

我们再来一组数据理解一下。

abababa

来来来,其实呢,一个串的最后一个可能是另一个串的第一个。

好了我要离开这个世界了大家不要缅怀我 ,如有问题,请大佬在评论区指出,siesie!

你可能感兴趣的:(#,KMP)