2013长春网赛1005 hdu 4763 Theme Section(kmp应用)

题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=4763

题意:给出一个字符串,问能不能在该串的前中后部找到相同的子串,输出最长的字串的长度。

分析:kmp的next[]数组应用。

next[i]=k表示在位置i之前有k个字符与字符串前k个字符相同,利用这个性质,先求出next[]数组,注意next[len]也要求出来,next[i]就表示字符串的后部与前部相同的长度,这样就只需找有没有中部就可以了。在next[i]到len-next[i]之间找有没有和next[i]相同的值就行了,找到就表示有中部,否则没有,这时i=next[i],然后继续找有没有中部,一直到next[i]==0为止。

之前的做法是错的,因为题目要求前缀,中缀,后缀不能出现重叠,之前的做法会导致3个错误:

1.可能会导致求出来的前缀和中缀重叠导致错误;

2.在next[i]到len-next[i]中间可能出现长度与前缀相同但是字符不一样的字串,比如:aaaaabbbbaaaa,这样用之前的做法会得出错误的答案;

3.如果前缀和中缀是连续的,那么next[len]就有可能是前缀和中缀的总长度和了,这样也会错误。

所以不能仅仅依靠next[]数组来求解

正确的做法是:

在next[i]到len-next[i]之间用kmp匹配前缀,如果匹配成功,则说明能找到中部,否则不能,i=next[i]然后继续查找中部,直到next[i]==0即可.

根据next[]数组的性质,循环的次数不超过3次,因为如果后部和前部不相同的话,next[i]==0,这样很快就可以跳出循环了。

还可以加个优化:前中后部字串的长度最多为len/3,如果next[i]>len/3的话就可以直接跳过查找中部,进入下一次循环了。但是优化不大,因为循环次数非常少。

AC代码:

 1 #include<cstdio>

 2 #include<cstring>

 3 const int N=1000000+5;

 4 int next[N];

 5 char s[N],c[N],d[N];

 6 void get_next(char s[])

 7 {

 8     int len=strlen(s);

 9     int i=0;

10     int j=-1;

11     next[0]=-1;

12     while(i<=len)    //注意要==

13     {

14         if(j==-1||s[i]==s[j])

15         {

16             i++;

17             j++;

18             next[i]=j;

19         }

20         else

21             j=next[j];

22     }

23 }

24 int kmp(char t[],char s[])

25 {

26     int i,j,k,m,n;

27     m=strlen(s);

28     n=strlen(t);

29     i=j=k=0;

30     while(i<m&&j<n)

31     {

32         if(j==-1 || t[j]==s[i])

33         {

34             i++;

35             j++;

36         }

37         else

38             j=next[j];

39     }

40     if(j>=n)

41         return 1;

42     else

43         return 0;

44 }

45 int main()

46 {

47     int t,j,k;

48     scanf("%d",&t);

49     while(t--)

50     {

51         scanf("%s",s);

52         get_next(s);

53         int len=strlen(s);

54         int i=next[len];

55         int flag=0;

56         while(i>0)

57         {

58             while(i>len/3)

59                 i=next[i];

60             if(i<=0)

61                 break;

62             /********************************

63             错误解法:

64             for(j=i;j<=len-i;j++)   //找中部

65                 if(next[j]==i)

66                 {

67                     flag=1;

68                     break;

69                 }

70             ********************************/

71             for(k=0,j=0;j<i;j++)

72                 c[k++]=s[j];

73             c[k]='\0';

74             for(k=0;j<len-i;j++)

75                 d[k++]=s[j];

76             d[k]='\0';

77             flag=kmp(c,d);

78             if(flag==1)    //找到了

79                 break;

80             else

81                 i=next[i];    //找不到,循环继续

82         }

83         if(flag)

84             printf("%d\n",i);

85         else

86             printf("0\n");

87     }

88     return 0;

89 }
View Code

 

你可能感兴趣的:(theme)