PS: 要不是我刚才脑残把电源踢掉,现在这个博文估计已经写完····:(
KMP算法呢我就不介绍了,说说为什么学KMP,为了学AC自动机....
KMP算法的主要在于求next数组,大家可能对next数组不理解,这也是一直困惑我的地方,今天搜了好多篇博文,只有 A_B_C_ABC这位大神把我讲明白了Orz.
KMP算法的核心思想是利用已经得到的部分匹配信息来进行后面的匹配过程
第二种表示方法,虽然也定义next[0]= -1,但后面绝不会出现 -1,除了next[0],其他模式值next[j]=k(0≤k<j)的意义可以简单看成是:
下标为j的字符的前面最多k个字符与开始的k个字符相同,这里并不要求T[j] != T[k]。其实next[0]也可以定义为0(后面给出的求串的模式值的函数和串的模式匹配的函数,是next[0]=0的),这样,next[j]=k(0≤k<j)的意义都可以简单看成是:下标为j的字符的前面最多k个字符与开始的k个字符相同。
这两段让我明白了next函数的真正意义!!所以以后不懂的呢,会回来看看。
说完了next的含义,再说说next数组各值得含义
定义:
(1)next[0]= -1 意义:任何串的第一个字符的模式值规定为-1。
(2)next[j]= -1 意义:模式串T中下标为j的字符,如果与首字符
相同,且j的前面的1—k个字符与开头的1—k
个字符不等(或者相等但T[k]==T[j])(1≤k<j)。
如:T=”abCabCad” 则 next[6]=-1,因T[3]=T[6]
(3)next[j]=k 意义:模式串T中下标为j的字符,如果j的前面k个
字符与开头的k个字符相等,且T[j] != T[k] (1≤k<j)。
即T[0]T[1]T[2]。。。T[k-1]==
T[j-k]T[j-k+1]T[j-k+2]…T[j-1]
且T[j] != T[k].(1≤k<j);
(4) next[j]=0 意义:除(1)(2)(3)的其他情况。
这里也是引用。。但是跟我说的思想不一样···这个是第一种思想。我推荐还是主要理解第二种思想,也是最容易的思想,接下来呢,我把我自己的模板贴上····
int next[MAX];
char a[MAX];
char b[MAX];
void getnext(char* P,int P1)
{
int j ,k;
j = 0;
k = -1;
next[0] = -1;
while(j<P1)
{
if(k==-1||P[j]==P[k])
{
j++;
k++;
next[j] = k;
}
else
k = next[k];
}
}
int Kmp(char* p,int p1,char* f,int f1)
{
int j,k;
int cnt = 0;
j = 0;// 文本循环变量
k = 0;// 模板循环变量
getnext(f,f1);//求next数组
while(j<p1)
{
if(k==-1||p[j]==f[k])
{
j++;
k++;
}
else
k = next[k];//跳到下个状态
if(k==f1)//匹配上了
{
cnt++;
}
}
return cnt;
}