数据结构学习笔记4-最长回文子串(Manacher算法)

!!!本文参考了文章《最长回文子串》

题目描述

给定一个字符串,求它的最长回文子串的长度。

分析与解法

最容易想到的办法是枚举所有的子串,分别判断其是否为回文。这个思路初看起来是正确的,但却做了很多无用功,如果一个长的子串包含另一个短一些的子串,那么对子串的回文判断其实是不需要的。

解法1:

普通解法:按照常规思路。
如果假设回文长度是奇数,那么从下标为1开始执行轮询,检测回文数,看是否是最大回文数;
如果假设回文长度是偶数,也是一样的道理,思路很简单;

解法2:

Manacher算法:
在上文的解法一:枚举中心位置中,我们需要特别考虑字符串的长度是奇数还是偶数,所以导致我们在编写代码实现的时候要把奇数和偶数的情况分开编写,是否有一种方法,可以不用管长度是奇数还是偶数,而统一处理呢?比如是否能把所有的情况全部转换为奇数处理?

答案还是肯定的。这就是下面我们将要看到的Manacher算法,且这个算法求最长回文子串的时间复杂度是线性O(N)的。

首先通过在每个字符的两边都插入一个特殊的符号,将所有可能的奇数或偶数长度的回文子串都转换成了奇数长度。比如 abba 变成 #a#b#b#a#, aba变成 #a#b#a#。

此外,为了进一步减少编码的复杂度,可以在字符串的开始加入另一个特殊字符,这样就不用特殊处理越界问题,比如$#a#b#a#。

以字符串12212321为例,插入#和 S[]=" #1#2#2#1#2#3#2#1#”,然后用一个数组 P[i] 来记录以字符S[i]为中心的最长回文子串向左或向右扩张的长度(包括S[i])。

比如S和P的对应关系:

S # 1 # 2 # 2 # 1 # 2 # 3 # 2 # 1 #
P 1 2 1 2 5 2 1 4 1 2 1 6 1 2 1 2 1
可以看出,P[i]-1正好是原字符串中最长回文串的总长度,为5。

此Manacher算法使用id、mx做配合,可以在每次循环中,直接对P[i]的快速赋值,从而在计算以i为中心的回文子串的过程中,不必每次都从1开始比较,减少了比较次数,最终使得求解最长回文子串的长度达到线性O(N)的时间复杂度。

接下来怎么计算P[i]呢?Manacher算法增加两个辅助变量id和mx,其中id表示最大回文子串中心的位置,mx则为id+P[id],也就是最大回文子串的边界。得到一个很重要的结论:

如果mx > i,那么P[i] >= Min(P[2 * id - i], mx - i)

下面,令j = 2*id - i,也就是说j是i关于id的对称点。

当 mx - i > P[j] 的时候,以S[j]为中心的回文子串包含在以S[id]为中心的回文子串中,由于i和j对称,以S[i]为中心的回文子串必然包含在以S[id]为中心的回文子串中,所以必有P[i] = P[j];
数据结构学习笔记4-最长回文子串(Manacher算法)_第1张图片

当 P[j] >= mx - i 的时候,以S[j]为中心的回文子串不一定完全包含于以S[id]为中心的回文子串中,但是基于对称性可知,下图中两个绿框所包围的部分是相同的,也就是说以S[i]为中心的回文子串,其向右至少会扩张到mx的位置,也就是说 P[i] >= mx - i。至于mx之后的部分是否对称,再具体匹配。
数据结构学习笔记4-最长回文子串(Manacher算法)_第2张图片

此外,对于 mx <= i 的情况,因为无法对 P[i]做更多的假设,只能让P[i] = 1,然后再去匹配。

我写的代码如下:

#include
#include
#include
int p[1000];

int min(int a,int b)  //return the smaller int
{
    return aint huiWen(char *str)
{
    int mx=0,id=0;
    memset(p,0,sizeof(p));
    for(int i=1;str[i]!='\0';i++)//i从1开始轮询,直到遇到'\0'
        {
            p[i] = mx>i? min(p[2*id-i],mx-i):1;//只是在mx>i的时候才赋值min(p[2*id-i],mx-i)
            while(str[i+p[i]]==str[i-p[i]])//以i为核心向外扩展p[i]位
                p[i]++;
            if(i+p[i]>mx)//检测是否需要更换最大回文串长度以及中心位置
                {
                    mx=i+p[i];
                    id=i;
                }
        }
    return mx;
}

int main()
{
    int j=0;
    int num=0;
    char *str1="ababa aba";
    char *str2 = (char *) malloc(strlen(str1)*2+1);
    for(int i=0;i<strlen(str2);i=i+2,j++)
        {
            str2[i]='#';
            str2[i+1]=str1[j];
        }   
    huiWen(str2);

    for(int jj=0;jj<strlen(str2);jj++)
        {
            if(p[jj]>num)
                num=p[jj];
        }
    printf("%d\n",num-1);

    free(str2);
    str2=NULL;
    return 0;
}

参考:http://www.felix021.com/blog/read.php?2040 。另外,这篇文章也不错:http://leetcode.com/2011/11/longest-palindromic-substring-part-ii.html 。

你可能感兴趣的:(数据结构)