leetcode1044

求最长公共子串(可重叠)

 

分析:求出后缀数组的height数组,最大值即为最长公共子串的长度。假设height[i]最大,sa[i]表示的是在原字符串的起始位置

可以作为模板题目.

 

//挑战程序设计 p378 4.7.3 后缀数组
#include 
#include 
#include 
using namespace std;


const int MAX_N = 100010;
int n, k;
int rak[MAX_N + 1];//rank
int tmp[MAX_N + 1];
int sa[MAX_N + 1];
int lcp[MAX_N + 1];

//比较 (rank[i], rank[i+k]) 和 (rank[j], rank[j+k])
bool compare_sa(int i, int j) {
    if(rak[i] != rak[j]) return rak[i] < rak[j];
    else {
        int ri = i + k <= n ? rak[i + k]  : -1;
        int rj = j + k <= n ? rak[j + k]  : -1;
        return ri < rj;
    }
}

//计算字符串S的后缀数组
void construct_sa(string S) {
    n = S.length();
    //初始长度为1, rank直接取字符的编码
    for(int i = 0; i <= n; i++) {
        sa[i] = i;
        rak[i] = i < n ? S[i] : -1;
    }
    //利用对长度为k的排序结果对长度为2k的排序
    for(k = 1; k <= n; k <<= 1) {
        sort(sa, sa + n + 1, compare_sa);
        //先在tmp中临时存储新计算的rank,再转存回rank中
        tmp[sa[0]] = 0;
        for(int i = 1; i <= n; i++) {
            tmp[sa[i]] = tmp[sa[i - 1]] + (compare_sa(sa[i - 1], sa[i]) ? 1 : 0);
        }
        for(int i = 0; i <= n; i++) {
            rak[i] = tmp[i];
        }
    }
}

void construct_lcp(string S) {
    n = S.length();
    for(int i = 0; i < n ; i++) rak[sa[i]] = i;
    int h = 0;
    //lcp[i] = S[sa[i]]和S[sa[i+1]]的最长公共前缀
    lcp[0] = 0;
    for(int i = 0; i < n; i++) {
        //计算字符串中从位置i开始的后缀及其在后缀数组中的前一个后缀的lco
        int j = sa[rak[i] - 1];
        //将h先减去首字母的1长度,在保持前缀相同的前提下不断增加
        if(h > 0) h--;
        for(; j + h < n && i + h < n; h++) {
            if(S[j + h] != S[i + h]) break;
        }
        lcp[rak[i] - 1] = h;
    }
}

string longestDupSubstring(string S) {
    construct_sa(S);
    construct_lcp(S);
    cout << "s.length = " << S.length() << endl;
    int res = -1;
    int pos;
    //for(int i = 0; i <= n; i++) cout << i << ", " << "sa[" << i << "]:" << sa[i] << " " << lcp[i] << " " << S.substr(sa[i]) << endl;
    for(int i = 0; i < n; i++) {
        if(lcp[i] > res) {
            res = lcp[i];
            pos = sa[i];
        }
    }
    cout << S.substr(pos, res);
    return S.substr(pos, res);
}

int main() {
    string s = "abracadabra";
    //string s = "banana";
    longestDupSubstring(s);
    return 0;
}

 

你可能感兴趣的:(后缀数组,leetcode)