数据结构---KMP模式匹配病毒感染人的DNA检测

数据结构—KMP模式匹配病毒感染人的DNA检测

原理:参考趣学数据结构

代码:

#include
#include
#define N 100
int next[N];
void getNext(char *T, int *next, int m) {//求解当前字符前面的最大公共前缀和后缀
	int j = 1, k = 0;
	next[j] = 0;//从1开始计算
	while (j <= m) {
		if (k == 0 || T[k] == T[j]) {//从下标0开始计算
			++j;
			++k;
			if (T[k] == T[j]) {//改进的更新next数组的方法,减少不必要的回退
				next[j] = next[k];//没比较的可能
			}
			else {//也就是只有不相等的时候才有比较的可能
				next[j]=k;//与当前k位置的字符比较
			}
		}
		else {
			k = next[k];//回退查找前面的最大公共前缀和后缀
		}
	}
	printf("next数组值:");
	for (int i = 1; i <= m; i++) {
		printf("%d ", next[i]);
	}
	printf("\n");
}
int KMP(char * S, char* T, int pos, int n, int m) {//KMP算法进行模式匹配
	int i = pos, j = 1;
	while (i <= n&& j <= m) {//不能在这里使用i<=n-m+1,否则可能会破坏(截断)匹配成功
		if (i > n - m + 1 && j == 1) {
			break;//再减少一点比较的次数
		}
		if (j == 0 || S[i] == T[j]) {
			i++;
			j++;
		}
		else {
			j = next[j];//根据最大公共前缀和后缀计算的next数组,j回退而i不回退
		}
	}
	//printf("\n---  %d ---\n", j);
	if (j ==m+1) {//返回查找成功子串的初始位置 ==不能写成=   写>更安全
		printf("查找成功子串的初始位置为:%d\n", i - j);
		return i - j;
	}
	printf("查找子串失败!\n");
	return -1;
}
void haveAffectionV(char *S,char* T,int n,int m) {//检查人的DNA是否被病毒的变种感染
	char TT[10];//存储病毒的变种 m个变种,不采用二倍线性扩展变种,使用循环取余变种
	for (int i = 0; i <= m-1; i++) {//移动的步数
		for (int j = 1; j <= m; j++) {
			if (i + j <= m) {
				TT[j] = T[i + j];
			}
			else {//对循环重新开始的数取%(m+1)再加1对应下标的字符
				TT[j] = T[(i + j) % (m + 1)+1];
			}
		}
		for (int k = 1; k <= n; k++) {//遍历主串
			printf("%c", S[k]);
		}
		printf("\n");
		for (int k = 1; k <= m; k++) {//遍历子串
			printf("%c", TT[k]);
		}
		printf("\n");
		getNext(TT, next, m);//计算next数组(最大公共前缀和后缀长度)
		printf("\n");
		KMP(S, TT, 1, n, m);//模式匹配
		printf("\n");
	}
}
int main() {
	char S[18] = "-adecadecadcbadcb";
	char T[10] = "-adecadcb";//'\0'字符串结束的标识
	haveAffectionV(S, T, 16, 8);
	system("pause");
	return 0;
}

测试截图:

数据结构---KMP模式匹配病毒感染人的DNA检测_第1张图片
彩蛋:留一个问题:为什么kmp函数的while条件里面不能写i<=n-m+1来降低几次比较???

时间复杂度O(m x (m+n)),空间复杂度O(m)

如果存在什么问题!欢迎批评指正!谢谢!

你可能感兴趣的:(数据结构,数据结构,c语言,算法)