给定一个字符串 s,找到 s 中最长的回文子串。你可以假设 s 的最大长度为1000。
示例 1:
输入: "babad" 输出: "bab" 注意: "aba"也是一个有效答案。
示例 2:
输入: "cbbd" 输出: "bb"
摘要
这篇文章是为中级读者而写的。它介绍了回文,动态规划以及字符串处理。请确保你理解什么是回文。回文是一个正读和反读都相同的字符串,例如,“aba”\textrm{“aba”}“aba” 是回文,而 “abc”\textrm{“abc”}“abc” 不是。
解决方案
方法一:最长公共子串
常见错误
有些人会忍不住提出一个快速的解决方案,不幸的是,这个解决方案有缺陷(但是可以很容易地纠正):
反转 SSS,使之变成 S′S'S′。找到 SSS 和 S′S'S′ 之间最长的公共子串,这也必然是最长的回文子串。
这似乎是可行的,让我们看看下面的一些例子。
例如,S=“caba”S = \textrm{“caba”}S=“caba” , S′=“abac”S' = \textrm{“abac”}S′=“abac”:
SSS 以及 S′S'S′ 之间的最长公共子串为 “aba”\textrm{“aba”}“aba”,恰恰是答案。
让我们尝试一下这个例子:S=“abacdfgdcaba”S = \textrm{“abacdfgdcaba”}S=“abacdfgdcaba” , S′=“abacdgfdcaba”S' = \textrm{“abacdgfdcaba”}S′=“abacdgfdcaba”:
SSS 以及 S′S'S′ 之间的最长公共子串为 “abacd”\textrm{“abacd”}“abacd”,显然,这不是回文。
算法
我们可以看到,当 SSS 的其他部分中存在非回文子串的反向副本时,最长公共子串法就会失败。为了纠正这一点,每当我们找到最长的公共子串的候选项时,都需要检查子串的索引是否与反向子串的原始索引相同。如果相同,那么我们尝试更新目前为止找到的最长回文子串;如果不是,我们就跳过这个候选项并继续寻找下一个候选。
这给我们提供了一个复杂度为 O(n2)O(n^2)O(n2) 动态规划解法,它将占用 O(n2)O(n^2)O(n2) 的空间(可以改进为使用 O(n)O(n)O(n) 的空间)。请在这里阅读更多关于最长公共子串的内容。
方法二:暴力法
很明显,暴力法将选出所有子字符串可能的开始和结束位置,并检验它是不是回文。
复杂度分析
时间复杂度:O(n3)O(n^3)O(n3),假设 nnn 是输入字符串的长度,则 (n2)=n(n−1)2\binom{n}{2} = \frac{n(n-1)}{2}(2n)=2n(n−1) 为此类子字符串(不包括字符本身是回文的一般解法)的总数。因为验证每个子字符串需要 O(n)O(n)O(n) 的时间,所以运行时间复杂度是 O(n3)O(n^3)O(n3)。
空间复杂度:O(1)O(1)O(1)。
方法三:动态规划
为了改进暴力法,我们首先观察如何避免在验证回文时进行不必要的重复计算。考虑 “ababa”\textrm{“ababa”}“ababa” 这个示例。如果我们已经知道 “bab”\textrm{“bab”}“bab” 是回文,那么很明显,“ababa”\textrm{“ababa”}“ababa” 一定是回文,因为它的左首字母和右尾字母是相同的。
我们给出 P(i,j)P(i,j)P(i,j) 的定义如下:
P(i,j)={true,false,如果子串Si…Sj是回文子串其它情况
因此,
P(i,j)=(P(i+1,j−1) and Si==Sj) P(i, j) = ( P(i+1, j-1) \text{ and } S_i == S_j ) P(i,j)=(P(i+1,j−1) and Si==Sj)
基本示例如下:
P(i,i)=true P(i, i) = true P(i,i)=true
P(i,i+1)=(Si==Si+1) P(i, i+1) = ( S_i == S_{i+1} ) P(i,i+1)=(Si==Si+1)
这产生了一个直观的动态规划解法,我们首先初始化一字母和二字母的回文,然后找到所有三字母回文,并依此类推…
复杂度分析
时间复杂度:O(n2)O(n^2)O(n2), 这里给出我们的运行时间复杂度为 O(n2)O(n^2)O(n2) 。
空间复杂度:O(n2)O(n^2)O(n2), 该方法使用 O(n2)O(n^2)O(n2) 的空间来存储表。
补充练习
你能进一步优化上述解法的空间复杂度吗?
方法四:中心扩展算法
事实上,只需使用恒定的空间,我们就可以在 O(n2)O(n^2)O(n2) 的时间内解决这个问题。
我们观察到回文中心的两侧互为镜像。因此,回文可以从它的中心展开,并且只有 2n−12n - 12n−1 个这样的中心。
你可能会问,为什么会是 2n−12n - 12n−1 个,而不是 nnn 个中心?原因在于所含字母数为偶数的回文的中心可以处于两字母之间(例如 “abba”\textrm{“abba”}“abba” 的中心在两个 ‘b’\textrm{‘b’}‘b’ 之间)。
复杂度分析
时间复杂度:O(n2)O(n^2)O(n2), 由于围绕中心来扩展回文会耗去 O(n)O(n)O(n) 的时间,所以总的复杂度为 O(n2)O(n^2)O(n2)。
空间复杂度:O(1)O(1)O(1)。
方法五:Manacher 算法
还有一个复杂度为 O(n)O(n)O(n) 的 Manacher 算法,你可以在这里找到详尽的解释。然而,这是一个非同寻常的算法,在45分钟的编码时间内提出这个算法将会是一个不折不扣的挑战。但是,请继续阅读并理解它,我保证这将是非常有趣的。
public class Solution {
public String longestPalindrome(String s) {
if (s.isEmpty()) {
return null;
}
if (s.length() == 1) {
return s;
}
String longest = s.substring(0, 1);
for (int i = 0; i < s.length(); i++) {
// get longest palindrome with center of i
String tmp = helper(s, i, i);
if (tmp.length() > longest.length()) {
longest = tmp;
}
// get longest palindrome with center of i, i+1
tmp = helper(s, i, i + 1);
if (tmp.length() > longest.length()) {
longest = tmp;
}
}
return longest;
}
// Given a center, either one letter or two letter,
// Find longest palindrome
public String helper(String s, int begin, int end) {
while (begin >= 0 && end <= s.length() - 1 && s.charAt(begin) == s.charAt(end)) {
begin--;
end++;
}
return s.substring(begin + 1, end);
}
}
执行效率