找出在长输入串A1A2……AN中串P1P2……PK的第一次出现

数据结构与算法分析——c语言描述 练习5.11 a b d 答案


求散列模式串的散列值,Hp,然后和长输入串的各长度和短串长度相等的子串求出的散列值来比较。若相等再比较字符串。


a的答案:

若有abcdefg

a*32*32+b*32+c已经求出来

那么b*32*32+c*32+d=((a*32*32+b*32+c)-a*32*32)*32+d


有一点就是不需要取余数,第一不用储存。第二取余数反而增加了碰撞的概率。其实不取余数实际上取了unsigned int 的最大值的余数,溢出就是取余了。

证明都不会做证啊。概率论,高数没学好,回想起来只是不停刷题记公式罢了。。。。真正的思想却没学到。。。。。



c e f小问有人知道的话请告诉我。我在网上都搜不到答案。作者的也没给答案思路。


#include<stdio.h>
#include<string.h>
#include<math.h>
#define MAXN 100

unsigned int hash(char* key, int charNum) {
	unsigned int hashVal = 0;
	while (charNum--)
		hashVal = (hashVal << 5) + *key++;
	return hashVal;
}

unsigned int mypow(int n) {
	unsigned int ans = 1;
	while (n--)
		ans = ans << 5;
	return ans;
}


int main() {
	char a[MAXN];
	char p[MAXN];
	
	unsigned int hashRecord[MAXN];
	scanf("%s", a);
	scanf("%s", p);

	int len1 = strlen(a);
	int len2 = strlen(p);

	hashRecord[0] = hash(a,  len2);//O(k)

	for (int i = 1; i < len1 - len2 + 1; i++) {//O(N-k)
		hashRecord[i] = ((hashRecord[i - 1] - a[i - 1] * mypow(len2 - 1)) * 32 + a[i + len2 - 1]) ;
	}

	unsigned int hashOfp = hash(p,  len2);//O(k)

	for (int i = 0; i < len1 - len2 + 1; i++) {//O(n-k)
		if (hashRecord[i] == hashOfp) {
			int flag = 0;
			for (int j = 0; j < len2; j++)
				if (a[i + j] != p[j]) {
					flag = 1;
					break;
				}
			if (!flag) {
				printf("the position is %d", i + 1);
				break;
			}
		}
	}

}


你可能感兴趣的:(找出在长输入串A1A2……AN中串P1P2……PK的第一次出现)