题意分析:
给出一个字符串s,寻找满足下列两个条件的子串(我们称之为D串)个数:1、长度为m * l;2、将这个子串切割成长度为l,首尾相连的m个子串,这些子串各不相同。
解题思路:
从第一位开始,每一个长度为m*l的子串都去判断。可以发现,从0开始的子串,和从l开始的子串,前者比后者多了子串[0, l),后者比前者多了子串[0 + m * l, 0 + m * l + l)。所以我们只需要预处理出,从位置0、1、2.....l - 1开始的子串,后面的子串只需利用前面的结果即可。
剩下的问题是怎么哈希。将字符串看成是个31进制数,(取素数冲突概率能减少,强有力的证据目前自己找不到)。hs[i]记录从i之后的字符代表的hash值,那么段[i, i + l)的hash值就为:hash[i] - hash[i + l] * base[l],base[i]为基底31的i次方。(这里为什么这么减就能代表该段的hash值,也不大理解)
个人感受:
想着写题解,发现一写好多疑问,希望明白的朋友能不吝啬赐教Orz
具体代码如下:
#include<algorithm> #include<cctype> #include<cmath> #include<cstdio> #include<cstring> #include<iomanip> #include<iostream> #include<map> #include<queue> #include<set> #include<sstream> #include<stack> #include<string> #define ull unsigned long long #define pr(x) cout << #x << " = " << (x) << '\n'; using namespace std; const int INF = 0x7f7f7f7f; const int MAXN = 1e5 + 111; char s[MAXN]; ull hs[MAXN], base[MAXN]; map<ull, int> mp[MAXN]; void init() { base[0] = 1; for (int i = 1; i < MAXN; ++i) base[i] = base[i - 1] * 31; } ull getVal(int st, int len) { return hs[st] - hs[st + len] * base[len]; } int main() { init(); int m, l; while (~scanf("%d%d", &m, &l)) { scanf("%s", s); int len = strlen(s); hs[len] = 0; for (int i = len - 1; i >= 0; --i) { hs[i] = hs[i + 1] * base[1] + s[i] - 'a'; } int ans = 0, up = m * l; for (int i = 0; i < l && i + up - 1 < len; ++i) { mp[i].clear(); int st = i; for (int j = 0; j < m; st += l, ++j) { ull val = getVal(st, l); if (mp[i].count(val)) ++mp[i][val]; else mp[i].insert(make_pair(val, 1)); } if (mp[i].size() == m) ++ans; } for (int i = l; i + up - 1 < len; ++i) { ull val = getVal(i - l, l); int v = i % l; --mp[v][val]; if (mp[v][val] == 0) mp[v].erase(val); val = getVal(i + up - l, l); if (mp[v].count(val)) ++mp[v][val]; else mp[v].insert(make_pair(val, 1)); if (mp[v].size() == m) ++ans; } printf("%d\n", ans); } return 0; }