后缀数组的初步认识

      百度之星资格赛的H题~~实在不会阿~~后来听说是POJ的原题~~去搜了搜~~发现确实有没接触过的知识~~就先从后缀数组入手了~~顺便自己写了一个求排好序的后缀数组的程序~~因为关键的排序地方是用O(nlogn)的快排~而还不会用O(n)的桶排~~所以当数据量有100000时~~很接近1s才能出解~但这也说明了除开快排和桶排区别~~我的后缀数组构造是没有问题的...

      写的这个程序输入为一行~~一个字符串~~

      输出为按从小到大输出后缀串~~

      我只是看了论文和课件后自己码的代码~~没有参考别人的~~所以关于论文中提到的字符串最后一位后加"$"..我没加~~并且还没明白这个地方要如何进行桶排序~~

      网上有不少文章和课件了~~但觉得都还不太透彻~~总而言之~~只要对原串的字符进行一次比较~~再用不断倍增的方法来完善排序~~


Program:

#include<iostream>
#include<algorithm>
#include<stdio.h>
#include<string.h>
#include<cmath>
#include<queue>
#define oo 2000000000
#define ll long long
using namespace std;  
char str[100005];
int len,m,p,temp[200005],rank[200005],s[100005];
bool cmp1(int a,int b)
{
       return str[a]<str[b];
}
bool cmp2(int a,int b)
{
       if (rank[a]!=rank[b]) return rank[a]<rank[b];
       a+=p-1; b+=p-1;
       if (a>=len) return true;           
       if (b>=len) return false;
       return rank[a]<rank[b];
}
int main()
{      
       int i;
       memset(rank,0,sizeof(rank));
       gets(str);
       len=strlen(str); 
       for (i=0;i<len;i++) s[i]=i;
       sort(s,s+len,cmp1);
       m=1;  
       rank[s[0]]=1;
       for (i=1;i<len;i++) 
       {
              if (str[s[i-1]]!=str[s[i]]) m++;
              rank[s[i]]=m;
       }  
       p=2;
       while (p<len)
       {
              for (i=0;i<len;i++) s[i]=i; 
              sort(s,s+len,cmp2);  // 用的快排..用桶排更高效
              m=1;  
              temp[s[0]]=1;
              for (i=1;i<len;i++) 
              {
                      if (rank[i-1]!=rank[i] || rank[i+p-2]!=rank[i+p-1]) m++;
                      temp[s[i]]=m;
              }
              for (i=0;i<len;i++) rank[i]=temp[i];  
              p*=2;
       }
       for (i=0;i<len;i++)  printf("%s\n",str+s[i]); 
       return 0;
}


你可能感兴趣的:(百度,OO)