题目大意:
现在定义如果一个字符串S可以被写成UVU的形式(U, V是两个非空字符串), 且V的长度是L, 那么串S是L-Gap串
一个字符串可能既是L1-Gap串又是L2-Gap串, 现在给出一个字符串S(其长度不超过50000)
给定整数G, 求给出的字符串的所有子串中G-Gap字符串的数量(如果多个子串相同但是出现位置不同视为不同子串)
大致思路:
刚开始我想的是枚举G-Gap子串可能的启示位置然后根据位置i, j分别是两次U段首字符出现位置来判断, 如果|i - j| - LCP(rank[i], rank[j]) <= G <= |i - j| - 1则i,j可以成为一组UGU形式的串, 但是这种思路需要枚举i, j, 利用RMQ与处理之后复杂度也在O(|S|^2), 后来查找题解的时候发现用到了和POJ 3693那题类似的思想
枚举的是U段的长度, 假设其长度为L, 那么UVU形式的串中第一个U一定会覆盖到串S中的S[0, L, 2*L, .... k*L]中的一个, 且只会覆盖一个
那么枚举U段的长度之后枚举会覆盖到的位置(0, L, 2*L, .... k*L), 对于每个位置 i 对应的第二个U出现的位置 i + G + L
那么对于位置i和位置i + G + L向前和向后求出LCP(为了每次枚举起点是得到的情况是第一个U覆盖到位置i, 向后匹配的LCP1不超过L, 向前LCP2也是, 那么覆盖位置i的U的起点可能性便是 (LCP1 + LCP2 - 1) - L + 1
这样枚举的时间复杂度是O(|S|log|S|), 后缀数组和RMQ预处理我都用的是O(|S|log|S|)的算法
看来枚举长度的技巧很常用, 需要留意
具体细节可以参见代码注释
代码如下:
Result : Accepted Memory : ? KB Time : 585 ms
/* * Author: Gatevin * Created Time: 2015/2/13 13:04:15 * File Name: Mononobe_Mitsuki.cpp */ #include<iostream> #include<sstream> #include<fstream> #include<vector> #include<list> #include<deque> #include<queue> #include<stack> #include<map> #include<set> #include<bitset> #include<algorithm> #include<cstdio> #include<cstdlib> #include<cstring> #include<cctype> #include<cmath> #include<ctime> #include<iomanip> using namespace std; const double eps(1e-8); typedef long long lint; #define maxn 100233 /* * Doubling Algorithm求后缀数组 */ int wa[maxn], wb[maxn], wv[maxn], Ws[maxn]; int cmp(int *r, int a, int b, int l) { return r[a] == r[b] && r[a + l] == r[b + l]; } void da(int *r, int *sa, int n, int m) { int *x = wa, *y = wb, *t, i, j, p; for(i = 0; i < m; i++) Ws[i] = 0; for(i = 0; i < n; i++) Ws[x[i] = r[i]]++; for(i = 1; i < m; i++) Ws[i] += Ws[i - 1]; for(i = n - 1; i >= 0; i--) sa[--Ws[x[i]]] = i; for(j = 1, p = 1; p < n; j *= 2, m = p) { for(p = 0, i = n - j; i < n; i++) y[p++] = i; for(i = 0; i < n; i++) if(sa[i] >= j) y[p++] = sa[i] - j; for(i = 0; i < n; i++) wv[i] = x[y[i]]; for(i = 0; i < m; i++) Ws[i] = 0; for(i = 0; i < n; i++) Ws[wv[i]]++; for(i = 1; i < m; i++) Ws[i] += Ws[i - 1]; for(i = n - 1; i >= 0; i--) sa[--Ws[wv[i]]] = y[i]; for(t = x, x = y, y = t, p = 1, x[sa[0]] = 0, i = 1; i < n; i++) x[sa[i]] = cmp(y, sa[i - 1], sa[i], j) ? p - 1 : p++; } return; } int rank[maxn], height[maxn]; void calheight(int *r, int *sa, int n) { int i, j, k = 0; for(i = 1; i <= n; i++) rank[sa[i]] = i; for(i = 0; i < n; height[rank[i++]] = k) for(k ? k-- : 0, j = sa[rank[i] - 1]; r[i + k] == r[j + k]; k++); return; } /* * RMQ预处理 */ int dp[maxn][20]; void initRMQ(int n) { for(int i = 1; i <= n; i++) dp[i][0] = height[i]; for(int j = 1; (1 << j) <= n; j++) for(int i = 1; i + (1 << j) - 1 <= n; i++) dp[i][j] = min(dp[i][j - 1], dp[i + (1 << (j - 1))][j - 1]); return; } int askRMQ(int a, int b) { int ra = rank[a], rb = rank[b]; if(ra > rb) swap(ra, rb); int k = 0; while((1 << (k + 1)) <= rb - ra) k++; return min(dp[ra + 1][k], dp[rb - (1 << k) + 1][k]); } char in[maxn]; int s[maxn], sa[maxn]; int G; int main() { int t; lint ans; scanf("%d", &t); for(int cas = 1; cas <= t; cas++) { ans = 0; scanf("%d%s", &G, in); int len = strlen(in); for(int i = 0; i < len; i++)//反过来一次一起求后缀数组方便向前求LCP s[2*len - i] = s[i] = in[i] - 'a' + 1; s[len] = 27; s[2*len + 1] = 0; int n = 2*len + 1; da(s, sa, n + 1, 28); calheight(s, sa, n); initRMQ(n); for(int U = 1; U*2 + G <= len; U++)//枚举U的长度 for(int i = 0; i + G + U < len; i += U)//枚举前面的U覆盖到的点 { int j = i + G + U; if(in[i] != in[j]) continue; int L = min(U, askRMQ(i, j)) + min(U, askRMQ(2*len - i, 2*len - j)) - 1; if(L >= U) ans += L - U + 1; } printf("Case %d: %lld\n", cas, ans); } return 0; }