参考地址:http://www.cnblogs.com/bitzhuwei/p/Longest-Palindromic-Substring-Part-II.html#_label1
首先我们把字符串S改造一下变成T,改造方法是:在S的每个字符之间和S首尾都插入一个"#"。这样做的理由你很快就会知道。
例如,S="abaaba",那么T="#a#b#a#a#b#a#"。
想一下,你必须在以Ti为中心左右扩展才能确定以Ti为中心的回文长度d到底是多少。(就是说这一步是无法避免的)
为了改进最坏的情况,我们把各个Ti处的回文半径存储到数组P,用P[i]表示以Ti为中心的回文长度。那么当我们求出所有的P[i],取其中最大值就能找到最长回文子串了。
对于上文的示例,我们先直接写出所有的P研究一下。
i = 0 1 2 3 4 5 6 7 8 9 A B C |
T = # a # b # a # a # b # a # |
P = 0 1 0 3 0 1 6 1 0 3 0 1 0 |
显然最长子串就是以P[6]为中心的"abaaba"。
你是否发现了,在插入"#"后,长度为奇数和偶数的回文都可以优雅地处理了?这就是其用处。
现在,想象你在"abaaba"中心画一道竖线,你是否注意到数组P围绕此竖线是中心对称的?再试试"aba"的中心,P围绕此中心也是对称的。这当然不是巧合,而是在某个条件下的必然规律。我们将利用此规律减少对数组P中某些元素的重复计算。
我们来看一个重叠得更典型的例子,即S="babcbabcbaccba"。
上图展示了把S转换为T的样子。假设你已经算出了一部分P。竖实线表示回文"abcbabcba"的中心C,两个虚实线表示其左右边界L和R。你下一步要计算P[i],i围绕C的对称点是i’。你有办法高效地计算P[i]吗?
我们先看一下i围绕C的对称点i’(此时i’=9)。
据上图所示,很明显P[i]=P[i’]=1。这是因为i和i’围绕C对称。同理,P[12]=P[10]=0,P[14]=P[8]=0。
现在再看i=15处。此时P[15]=P[7]=7?错了,你逐个字符检测一下会发现此时P[15]应该是5。
为什么此时规则变了?
如上图所示,两条绿色实线划定的范围必定是对称的,两条绿色虚线划定的范围必定也是对称的。此时请注意P[i’]=7,超过了左边界L。超出的部分就不对称了。此时我们只知道P[i]>=5,至于P[i]还能否扩展,只有通过逐个字符检测才能判定了。
在此例中,P[21]≠P[9],所以P[i]=P[15]=5。
我们总结一下上述分析过程,就是这个算法的关键部分了。
if P[ i' ] < R – i, then P[ i ] ← P[ i' ] else P[ i ] ≥ R - i. (此时要穿过R逐个字符判定P[i]). |
通过了leetcode第5题测试,用时15ms。
private static String preProcess(String str){ int len=str.length(); if(len==0){ return "^$"; } StringBuilder s=new StringBuilder("^"); for(int i=0; i<str.length(); i++){ s.append("#").append(str.charAt(i)); } s.append("#$"); return s.toString(); } /* * T为处理后的字符串,P[]为T中对应字符的最长字串长度 */ public static String longestPalindrome(String s) { String T=preProcess(s); int len=T.length(); int[] P=new int[len]; int C=0, R=0; for(int i=1; i<len-1; i++){ int j=C-(i-C); int diff=R-i; if(diff>=0&&diff>P[j]){ P[i]=P[j]; }else{ P[i]=diff>=0? diff:0; while(T.charAt(i+P[i]+1)==T.charAt(i-P[i]-1)){ P[i]++; } C=i; R=i+P[i]; } } int max=0; C=0; for(int i=1; i<len-1; i++){ if(P[i]>max){ max=P[i]; C=i; } } int start=(C-max)/2; return s.substring(start, start+max); }