题目大意:
就是现在给出一个N*M的字符矩阵, 包含N*M个大写字母, 求其有多少个本质不同的子矩阵N, M <= 128
大致思路:
这个题目当时想的时候以为是AC自动机来进行匹配, 但是128*128*128*128的复杂度太高了
当时还是没有仔细想这个题, 其实考虑一维的字符串中计算不同的子串个数的时候, 用到的后缀数组的方法, 就应该知道这题怎么做的
首先需要降维, 我们枚举当前寻找的不同数量的矩阵的宽度w, 那么枚举一共M次,
对于每一次枚举, 根据不同的起始列 i, 那么对于字符串矩阵S[N][M], 处理成这样的形式: S[0][0~w - 1], S[1][0~w - 1].... S[N - 1][0~w - 1], S[0][1~w], S[1][1~w].. S[N - 1][1~w], S[0][2~w + 1]...... S[N - 1][M - w ~ M - 1] 那么用对应的Hash值对应这些串的话, 将hash值离散化之后就能得到一个正常的整数序列, 将每N个整数中插入一个没有出现过的数作为分隔符, 那么宽度为w的不同矩阵个数就正好是这个整数序列的不同子串个数了, 当然要求不包含分隔符
于是剩下的就是一个简单的后缀数组解决的问题了, 总体时间复杂度 128*128*128*log128
降维的思想很重要, 将问题与低维度的类似问题进行类比也是很有用的思想
代码如下:
Result : Accepted Memory : 3172 KB Time : 1903 ms
/*
* Author: Gatevin
* Created Time: 2015/7/20 20:14:23
* File Name: A.cpp
*/
#include<iostream>
#include<sstream>
#include<fstream>
#include<vector>
#include<list>
#include<deque>
#include<queue>
#include<stack>
#include<map>
#include<set>
#include<bitset>
#include<algorithm>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<cctype>
#include<cmath>
#include<ctime>
#include<iomanip>
using namespace std;
const double eps(1e-8);
typedef long long lint;
typedef unsigned long long ulint;
#define maxn 130*130
#define rank rrank
#define ws Ws
#define end eeeeend
int wa[maxn], wb[maxn], wv[maxn], ws[maxn];
int cmp(int* r, int a, int b, int l)
{
return r[a] == r[b] && r[a + l] == r[b + l];
}
void da(int *r, int *sa, int n, int m)
{
int *x = wa, *y = wb, *t, i, j, p;
for(i = 0; i < m; i++) ws[i] = 0;
for(i = 0; i < n; i++) ws[x[i] = r[i]]++;
for(i = 1; i < m; i++) ws[i] += ws[i - 1];
for(i = n - 1; i >= 0; i--) sa[--ws[x[i]]] = i;
for(j = 1, p = 1; p < n; j <<= 1, m = p)
{
for(p = 0, i = n - j; i < n; i++) y[p++] = i;
for(i = 0; i < n; i++) if(sa[i] >= j) y[p++] = sa[i] - j;
for(i = 0; i < n; i++) wv[i] = x[y[i]];
for(i = 0; i < m; i++) ws[i] = 0;
for(i = 0; i < n; i++) ws[wv[i]]++;
for(i = 1; i < m; i++) ws[i] += ws[i - 1];
for(i = n - 1; i >= 0; i--) sa[--ws[wv[i]]] = y[i];
for(t = x, x = y, y = t, p = 1, x[sa[0]] = 0, i = 1; i < n; i++)
x[sa[i]] = cmp(y, sa[i - 1], sa[i], j) ? p - 1 : p++;
}
return;
}
int rank[maxn], height[maxn];
void calheight(int *r, int *sa, int n)
{
int i, j, k = 0;
for(i = 1; i <= n; i++) rank[sa[i]] = i;
for(i = 0; i < n; height[rank[i++]] = k)
for(k ? k-- : 0, j = sa[rank[i] - 1]; r[i + k] == r[j + k]; k++);
return;
}
ulint seed = 50009uLL;
ulint H[130][130];
ulint xp[130];
int n, m;
void init()
{
xp[0] = 1;
for(int i = 1; i < 130; i++)
xp[i] = xp[i - 1]*seed;
}
ulint askHash(int i, int l, int r)
{
if(l == 0) return H[i][r];
else return H[i][r] - H[i][l - 1]*xp[r - l + 1];
}
char maz[130][130];
ulint h[130*130];
map<ulint, int> M;
int s[130*130], sa[130*130];
int end[130*130];
int main()
{
init();
int T;
scanf("%d", &T);
for(int cas = 1; cas <= T; cas++)
{
scanf("%d %d", &n, &m);
for(int i = 0; i < n; i++)
scanf("%s", maz[i]);
for(int i = 0; i < n; i++)
{
H[i][0] = maz[i][0] - 'A' + 1;
for(int j = 1; j < m; j++)
H[i][j] = H[i][j - 1]*seed + maz[i][j] - 'A' + 1;
}
lint ans = 0;
for(int w = 1; w <= m; w++)//枚举矩阵的宽度
{
M.clear();
int cnt = 1;
int len = 0;
for(int j = 0; j + w - 1 < m; j++)//多列的起点
{
for(int i = 0; i < n; i++)//
{
h[j*n + i] = askHash(i, j, j + w - 1);
if(M[h[j*n + i]] == 0)
M[h[j*n + i]] = cnt++;
s[len++] = M[h[j*n + i]];
}
for(int i = 0; i <= n; i++)
end[len - i] = len;
s[len++] = cnt++;
}
len--;
s[len] = 0;
da(s, sa, len + 1, cnt);
calheight(s, sa, len);
for(int i = 1; i <= len; i++)
ans += end[sa[i]] - sa[i] - height[i];
}
printf("Case #%d: %I64d\n", cas, ans);
}
return 0;
}