Manacher算法:最长回文子串O(n)

*文章大部分内容转载自其它博客。


首先:大家都知道什么叫回文串吧,这个算法要解决的就是一个字符串中最长的回文子串有多长。这个算法可以在On)的时间复杂度内既线性时间复杂度的情况下,求出以每个字符为中心的最长回文有多长,
    这个算法有一个很巧妙的地方,它把奇数的回文串和偶数的回文串统一起来考虑了。这一点一直是在做回文串问题中时比较烦的地方。这个算法还有一个很好的地方就是充分利用了字符匹配的特殊性,避免了大量不必要的重复匹配。
    算法大致过程是这样。先在每两个相邻字符中间插入一个分隔符,当然这个分隔符要在原串中没有出现过。一般可以用‘#’分隔。这样就非常巧妙的将奇数长度回文串与偶数长度回文串统一起来考虑了(见下面的一个例子,回文串长度全为奇数了),然后用一个辅助数组P记录以每个字符为中心的最长回文串的信息。Pid]记录的是以字符strid]为中心的最长回文串,当以strid]为第一个字符,这个最长回文串向右延伸了Pid]个字符。
    原串:    w aa bwsw f d
    新串:   # w# a # a # b# w # s # w # f # d #
辅助数组P:  1 2 1 2 3 2 1 2 1 2 1 4 1 2 1 2 1 2 1
    这里有一个很好的性质,Pid-1就是该回文子串在原串中的长度(包括‘#’)。如果这里不是特别清楚,可以自己拿出纸来画一画,自己体会体会。当然这里可能每个人写法不尽相同,不过我想大致思路应该是一样的吧。
    好,我们继续。现在的关键问题就在于怎么在On)时间复杂度内求出P数组了。只要把这个P数组求出来,最长回文子串就可以直接扫一遍得出来了。
    由于这个算法是线性从前往后扫的。那么当我们准备求Pi]的时候,i以前的Pj]我们是已经得到了的。我们用mx记在i之前的回文串中,延伸至最右端的位置。同时用id这个变量记下取得这个最优mx时的id值。(注:为了防止字符比较的时候越界,我在这个加了‘#’的字符串之前还加了另一个特殊字符‘$’,故我的新串下标是从1开始的)
好,到这里,我们可以先贴一份代码了。

void pk()
{
    int i;
    int mx = 0;
    int id;
    for(i=1; i<n; i++)
    {
        if( mx > i )
            p[i] = MIN( p[2*id-i], mx-i );        
        else
            p[i] = 1;
        for(; str[i+p[i]] == str[i-p[i]]; p[i]++)
            ;
        if( p[i] + i > mx )
        {
            mx = p[i] + i;
            id = i;
        }
    }
}

Manacher算法:最长回文子串O(n)_第1张图片

p:以S[i]为中心的最长回文串的半径为p[i]。

mx:已经找出的回文子串的最靠右的结束位置。

id:此时mx对应的最长回文子串(即结束位置最靠右的回文字串)的中心点。

     算法的主要思想是:先找出所有的p[i],最大的p[i]即为所求。在求p[j] (j>i)时,利用已经求出的p[i]减少比较次数。


POJ3974:

在字符串中添加#来解决奇偶性的问题,若字符串为aa(偶数长度),则会变成#a#a#,变成了奇数,因此只需要考虑奇数的情况。

注意只能写成#a#a#,即头尾也要补上#,不能写成a#a。(因为这个错误WA了好久)

为什么是O(n)?可以看到只有一层的for,for里面的while在整个过程中最多也只是将字符串扫一遍,复杂度大概n+n这样。

#include <iostream>
#include <cstdio>
#include <cstring>
#include <cmath>
#include <string>
#include <map>
#include <vector>
#include <queue>
#include <algorithm>
using namespace std;

char temp[2000005],str[2000005];
int p[2000005];
int mx,idx;
int length;
void convert()
{
	for (int i=0;i<length;i++)
	{
		str[2*i]='#';
		str[2*i+1]=temp[i];
	}
	str[2*length]='#';
	str[2*length+1]='\0';
	length=length*2+1;
}

int main()
{
	int T=0;
	while (1)
	{
		scanf("%s",temp);
		if (temp[0]=='E') break;
		length=strlen(temp);
		convert();
		memset(p,0,sizeof(p));

		mx=idx=0;
		int maxn=0;
		for (int i=0;i<length;i++)
		{
			if (mx>i)
				p[i]=min(p[2*idx-i],mx-i);
			while (i+p[i]<length && i-p[i]>=0 && str[i-p[i]]==str[i+p[i]])
				p[i]++;
			if (i+p[i]>mx)
			{
				mx=i+p[i];
				idx=i;
			}
			if (p[idx]>maxn)
				maxn=p[idx];
		}
		printf("Case %d: %d\n",++T,maxn-1);
	}
}


你可能感兴趣的:(Manacher算法:最长回文子串O(n))