HDU 4029 Distinct Sub-matrix 后缀数组 + Hash 2011年上海网络赛I题

题目大意:

就是现在给出一个N*M的字符矩阵, 包含N*M个大写字母, 求其有多少个本质不同的子矩阵N, M <= 128


大致思路:

这个题目当时想的时候以为是AC自动机来进行匹配, 但是128*128*128*128的复杂度太高了
当时还是没有仔细想这个题, 其实考虑一维的字符串中计算不同的子串个数的时候, 用到的后缀数组的方法, 就应该知道这题怎么做的
首先需要降维, 我们枚举当前寻找的不同数量的矩阵的宽度w, 那么枚举一共M次, 
对于每一次枚举, 根据不同的起始列 i, 那么对于字符串矩阵S[N][M], 处理成这样的形式: S[0][0~w - 1], S[1][0~w - 1].... S[N - 1][0~w - 1], S[0][1~w], S[1][1~w].. S[N - 1][1~w], S[0][2~w + 1]...... S[N - 1][M - w ~ M - 1] 那么用对应的Hash值对应这些串的话, 将hash值离散化之后就能得到一个正常的整数序列, 将每N个整数中插入一个没有出现过的数作为分隔符, 那么宽度为w的不同矩阵个数就正好是这个整数序列的不同子串个数了, 当然要求不包含分隔符
于是剩下的就是一个简单的后缀数组解决的问题了, 总体时间复杂度 128*128*128*log128
降维的思想很重要, 将问题与低维度的类似问题进行类比也是很有用的思想

代码如下:
Result  :  Accepted     Memory  :  3172 KB     Time  :  1903 ms
/*
 * Author: Gatevin
 * Created Time:  2015/7/20 20:14:23
 * File Name: A.cpp
 */
#include<iostream>
#include<sstream>
#include<fstream>
#include<vector>
#include<list>
#include<deque>
#include<queue>
#include<stack>
#include<map>
#include<set>
#include<bitset>
#include<algorithm>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<cctype>
#include<cmath>
#include<ctime>
#include<iomanip>
using namespace std;
const double eps(1e-8);
typedef long long lint;
typedef unsigned long long ulint;

#define maxn 130*130
#define rank rrank
#define ws Ws
#define end eeeeend

int wa[maxn], wb[maxn], wv[maxn], ws[maxn];
int cmp(int* r, int a, int b, int l)
{
    return r[a] == r[b] && r[a + l] == r[b + l];
}

void da(int *r, int *sa, int n, int m)
{
    int *x = wa, *y = wb, *t, i, j, p;
    for(i = 0; i < m; i++) ws[i] = 0;
    for(i = 0; i < n; i++) ws[x[i] = r[i]]++;
    for(i = 1; i < m; i++) ws[i] += ws[i - 1];
    for(i = n - 1; i >= 0; i--) sa[--ws[x[i]]] = i;
    for(j = 1, p = 1; p < n; j <<= 1, m = p)
    {
        for(p = 0, i = n - j; i < n; i++) y[p++] = i;
        for(i = 0; i < n; i++) if(sa[i] >= j) y[p++] = sa[i] - j;
        for(i = 0; i < n; i++) wv[i] = x[y[i]];
        for(i = 0; i < m; i++) ws[i] = 0;
        for(i = 0; i < n; i++) ws[wv[i]]++;
        for(i = 1; i < m; i++) ws[i] += ws[i - 1];
        for(i = n - 1; i >= 0; i--) sa[--ws[wv[i]]] = y[i];
        for(t = x, x = y, y = t, p = 1, x[sa[0]] = 0, i = 1; i < n; i++)
            x[sa[i]] = cmp(y, sa[i - 1], sa[i], j) ? p - 1 : p++;
    }
    return;
}

int rank[maxn], height[maxn];
void calheight(int *r, int *sa, int n)
{
    int i, j, k = 0;
    for(i = 1; i <= n; i++) rank[sa[i]] = i;
    for(i = 0; i < n; height[rank[i++]] = k)
        for(k ? k-- : 0, j = sa[rank[i] - 1]; r[i + k] == r[j + k]; k++);
    return;
}

ulint seed = 50009uLL;
ulint H[130][130];
ulint xp[130];
int n, m;

void init()
{
    xp[0] = 1;
    for(int i = 1; i < 130; i++)
        xp[i] = xp[i - 1]*seed;
}

ulint askHash(int i, int l, int r)
{
    if(l == 0) return H[i][r];
    else return H[i][r] - H[i][l - 1]*xp[r - l + 1];
}

char maz[130][130];
ulint h[130*130];
map<ulint, int> M;
int s[130*130], sa[130*130];
int end[130*130];

int main()
{
    init();
    int T;
    scanf("%d", &T);
    for(int cas = 1; cas <= T; cas++)
    {
        scanf("%d %d", &n, &m);
        for(int i = 0; i < n; i++)
            scanf("%s", maz[i]);
        for(int i = 0; i < n; i++)
        {
            H[i][0] = maz[i][0] - 'A' + 1;
            for(int j = 1; j < m; j++)
                H[i][j] = H[i][j - 1]*seed + maz[i][j] - 'A' + 1;
        }
        lint ans = 0;
        for(int w = 1; w <= m; w++)//枚举矩阵的宽度
        {
            M.clear();
            int cnt = 1;
            int len = 0;
            for(int j = 0; j + w - 1 < m; j++)//多列的起点
            {
                for(int i = 0; i < n; i++)//
                {
                    h[j*n + i] = askHash(i, j, j + w - 1);
                    if(M[h[j*n + i]] == 0)
                        M[h[j*n + i]] = cnt++;
                    s[len++] = M[h[j*n + i]];
                }
                for(int i = 0; i <= n; i++)
                    end[len - i] = len;
                s[len++] = cnt++;
            }
            len--;
            s[len] = 0;
            da(s, sa, len + 1, cnt);
            calheight(s, sa, len);
            for(int i = 1; i <= len; i++)
                ans += end[sa[i]] - sa[i] - height[i];
            
        }
        printf("Case #%d: %I64d\n", cas, ans);
    }
    return 0;
}


你可能感兴趣的:(distinct,hash,后缀数组,HDU,4029,Sub-matrix,2011年上海网络赛I题)