KMP模式匹配算法

在准备一些实习笔试时,发现编程题的重点都落在了字符串上,题目各异,但却着重考察了对字符串的掌握程度。故专门复习了字符串匹配算法。
在字符串的匹配算法中,最好理解的就是朴素匹配算法,即通过字符串1和字符串2点对点式的暴力匹配,得到匹配结果。还有一种是KMP模式匹配算法,它分析了朴素匹配算法中不必要的匹配情况,更好的为匹配节省了时间。

1.朴素匹配算法
其匹配过程如下图所示,非常清晰明了。从src的第一个字符和dst的第一个字符串比较,一旦出现不匹配,则从src的第二个字符串开始比较,如2,直到匹配上所有,如5。

KMP模式匹配算法_第1张图片KMP模式匹配算法_第2张图片KMP模式匹配算法_第3张图片

程序代码如下:注(所有的位置起始为0,所以当标记为第7位时,是从0开始的第7位)
int BoliPiPei(string src, string dst)
{
	int len = src.size();
	int len2 = dst.size();
	int i = 0;
	for (; i < (len - len2 + 1); ++i)
	{
		int j = 0;
		for (; j < len2; ++j)
		{
			if (src[i + j] != dst[j])
				break;
		}
		if (j == len2)
			return (i );
	}
	return -1;
}
int main()
{
	string src("goodglesifsalesifa");
	string dst("lesifa");
	int pos=BoliPiPei(src, dst);
	cout << src << endl;
	cout << dst << endl;
	cout << pos;
	return 0;
}

2.KMP匹配算法
KMP匹配算法的核心是next数组。也就是说我们为要匹配的字符串dst找到其对应的next数组,那么我们就可以省去大量的无效匹配动作。
next数组的作用:在朴素匹配失败时,被匹配的主串src后向后挪动一个元素,匹配的子串dst会回到起始位置重新新的一轮的匹配。而dst拥有next数组后,我们就不需要每次将子串回到起始位置,而是回到子串当前j所对应的next[j]所指的位置。

如何得到next数组:next[0]=0,next[1]=1;这个是确定的规律。next[i]的值由dst的【0,i-1】的子串确定。举例如下:
KMP模式匹配算法_第4张图片

next[i]值一般规律如下:如果其子串前后缀一个字符相等,k值为2,两个字符相等,k值为3,n个字符相等,k值为n+1。
代码如下:
int Next(char* ss)//求取当前字串的next[i]的值
{
	int len = strlen(ss);
	int i = 0;
	for (; i < len-1; ++i)
	{
		if (ss[i] != ss[len - 1 - i])
			break;
	}
	if (i == 0)
		return 1;
	return i;
}
void getnext(string str,int *next)//获取当前整个字符串的next数组
{
	next[0] = 0;
	next[1] = 1;
	int len = str.size();//获得当前字符串的next数组
	for (int i = 1; i < len; ++i)
	{
		char  ss[50];
		basic_string::pointer itss = ss;
		int len=str.copy(itss, (i+1));//首先将str中的前i个元素拷贝给ss
		next[i+1] = Next(ss);//下一个数组值是当前字串计算值
	}
}
int PuSuPiPei(string src, string dst)
{
	int len1 = src.size();
	int len2 = dst.size();
	int i = 0, j = 0;
	int next[255];
	getnext(dst, next);
	for (; i < (len1 - len2 + 1); ++i)
	{
		for (; j < len2; ++j)
		{
			if (src[i + j] != dst[j])
			{
				j = next[j];//将j退回到next[j]所指位置
				break;
			}
		}
		if (j == len2)
		{
			return i;
		}
	}
	return -1;
}
int main()
{
	string ss("abcabx");
	string st("abx");
	int pos = PuSuPiPei(ss, st);
	cout << ss << endl;
	cout << st << endl;
	cout << pos;
	return 0;
}

你可能感兴趣的:(数据结构)