题目描述(困难难度)
给定两个字符串 S
和T
,从 S
中选择字母,使得刚好和 T
相等,有多少种选法。
解法一 递归之分治
S 中的每个字母就是两种可能选他或者不选他。我们用递归的常规思路,将大问题化成小问题,也就是分治的思想。
如果我们求 S[0,S_len - 1]
中能选出多少个 T[0,T_len - 1]
,个数记为 n
。那么分两种情况,
-
S[0] == T[0]
,需要知道两种情况- 从
S
中选择当前的字母,此时S
跳过这个字母,T
也跳过一个字母。
去求
S[1,S_len - 1]
中能选出多少个T[1,T_len - 1]
,个数记为n1
-
S
不选当前的字母,此时S
跳过这个字母,T
不跳过字母。
去求
S[1,S_len - 1]
中能选出多少个T[0,T_len - 1]
,个数记为n2
- 从
-
S[0] != T[0]
S
只能不选当前的字母,此时S
跳过这个字母,T
不跳过字母。去求
S[1,S_len - 1]
中能选出多少个T[0,T_len - 1]
,个数记为n1
也就是说如果求 S[0,S_len - 1]
中能选出多少个 T[0,T_len - 1]
,个数记为 n。转换为数学式就是
if(S[0] == T[0]){
n = n1 + n2;
}else{
n = n1;
}
推广到一般情况,我们可以先写出递归的部分代码。
public int numDistinct(String s, String t) {
return numDistinctHelper(s, 0, t, 0);
}
private int numDistinctHelper(String s, int s_start, String t, int t_start) {
int count = 0;
//当前字母相等
if (s.charAt(s_start) == t.charAt(t_start)) {
//从 S 选择当前的字母,此时 S 跳过这个字母, T 也跳过一个字母。
count = numDistinctHelper(s, s_start + 1, t, t_start + 1, map)
//S 不选当前的字母,此时 S 跳过这个字母,T 不跳过字母。
+ numDistinctHelper(s, s_start + 1, t, t_start, map);
//当前字母不相等
}else{
//S 只能不选当前的字母,此时 S 跳过这个字母, T 不跳过字母。
count = numDistinctHelper(s, s_start + 1, t, t_start, map);
}
return count;
}
递归出口的话,因为我们的S
和T
的开始下标都是增长的。
如果S[s_start, S_len - 1]
中, s_start
等于了 S_len
,意味着S
是空串,从空串中选字符串T
,那结果肯定是0
。
如果T[t_start, T_len - 1]
中,t_start
等于了 T_len
,意味着T
是空串,从S
中选择空字符串T
,只需要不选择 S
中的所有字母,所以选法是1
。
综上,代码总体就是下边的样子
public int numDistinct(String s, String t) {
return numDistinctHelper(s, 0, t, 0);
}
private int numDistinctHelper(String s, int s_start, String t, int t_start) {
//T 是空串,选法就是 1 种
if (t_start == t.length()) {
return 1;
}
//S 是空串,选法是 0 种
if (s_start == s.length()) {
return 0;
}
int count = 0;
//当前字母相等
if (s.charAt(s_start) == t.charAt(t_start)) {
//从 S 选择当前的字母,此时 S 跳过这个字母, T 也跳过一个字母。
count = numDistinctHelper(s, s_start + 1, t, t_start + 1)
//S 不选当前的字母,此时 S 跳过这个字母,T 不跳过字母。
+ numDistinctHelper(s, s_start + 1, t, t_start);
//当前字母不相等
}else{
//S 只能不选当前的字母,此时 S 跳过这个字母, T 不跳过字母。
count = numDistinctHelper(s, s_start + 1, t, t_start);
}
return count;
}
遗憾的是,这个解法对于如果S
太长的 case
会超时。
原因就是因为递归函数中,我们多次调用了递归函数,这会使得我们重复递归很多的过程,解决方案就很简单了,Memoization
技术,把每次的结果利用一个map
保存起来,在求之前,先看map
中有没有,有的话直接拿出来就可以了。
map
的key
的话就标识当前的递归,s_start
和 t_start
联合表示,利用字符串 s_start + '@' + t_start
。
value
的话就保存这次递归返回的count
。
public int numDistinct(String s, String t) {
HashMap map = new HashMap<>();
return numDistinctHelper(s, 0, t, 0, map);
}
private int numDistinctHelper(String s, int s_start, String t, int t_start, HashMap map) {
//T 是空串,选法就是 1 种
if (t_start == t.length()) {
return 1;
}
//S 是空串,选法是 0 种
if (s_start == s.length()) {
return 0;
}
String key = s_start + "@" + t_start;
//先判断之前有没有求过这个解
if (map.containsKey(key)) {
return map.get(key);
}
int count = 0;
//当前字母相等
if (s.charAt(s_start) == t.charAt(t_start)) {
//从 S 选择当前的字母,此时 S 跳过这个字母, T 也跳过一个字母。
count = numDistinctHelper(s, s_start + 1, t, t_start + 1, map)
//S 不选当前的字母,此时 S 跳过这个字母,T 不跳过字母。
+ numDistinctHelper(s, s_start + 1, t, t_start, map);
//当前字母不相等
}else{
//S 只能不选当前的字母,此时 S 跳过这个字母, T 不跳过字母。
count = numDistinctHelper(s, s_start + 1, t, t_start, map);
}
//将当前解放到 map 中
map.put(key, count);
return count;
}
解法二 递归之回溯
回溯的思想就是朝着一个方向找到一个解,然后再回到之前的状态,改变当前状态,继续尝试得到新的解。可以类比于二叉树的DFS
,一路走到底,然后回到之前的节点继续递归。
对于这道题,和二叉树的DFS
很像了,每次有两个可选的状态,选择S
串的当前字母和不选择当前字母。
当S
串的当前字母和T
串的当前字母相等,我们就可以选择S
的当前字母,进入递归。
递归出来以后,继续尝试不选择S
的当前字母,进入递归。
代码可以是下边这样。
public int numDistinct3(String s, String t) {
numDistinctHelper(s, 0, t, 0);
}
private void numDistinctHelper(String s, int s_start, String t, int t_start) {
//当前字母相等,选中当前 S 的字母,s_start 后移一个
//选中当前 S 的字母,意味着和 T 的当前字母匹配,所以 t_start 后移一个
if (s.charAt(s_start) == t.charAt(t_start)) {
numDistinctHelper(s, s_start + 1, t, t_start + 1);
}
//出来以后,继续尝试不选择当前字母,s_start 后移一个,t_start 不后移
numDistinctHelper(s, s_start + 1, t, t_start);
}
递归出口的话,就是两种了。
当
t_start == T_len
,那么就意味着当前从S
中选择的字母组成了T
,此时就代表一种选法。我们可以用一个全局变量count
,count
计数此时就加一。然后return
,返回到上一层继续寻求解。当
s_start == S_len
,此时S
到达了结尾,直接 return。
int count = 0;
public int numDistinct(String s, String t) {
numDistinctHelper(s, 0, t, 0);
return count;
}
private void numDistinctHelper(String s, int s_start, String t, int t_start) {
if (t_start == t.length()) {
count++;
return;
}
if (s_start == s.length()) {
return;
}
//当前字母相等,s_start 后移一个,t_start 后移一个
if (s.charAt(s_start) == t.charAt(t_start)) {
numDistinctHelper(s, s_start + 1, t, t_start + 1);
}
//出来以后,继续尝试不选择当前字母,s_start 后移一个,t_start 不后移
numDistinctHelper(s, s_start + 1, t, t_start);
}
好吧,这个熟悉的错误又出现了,同样是递归中调用了两次递归,会重复计算一些解。怎么办呢?Memoization
技术。
map
的key
和之前一样,标识当前的递归,s_start
和 t_start
联合表示,利用字符串 s_start + '@' + t_start
。
map
的value
的话?存什么呢。区别于解法一,我们每次都得到了当前条件下的count
,然后存起来了。而现在我们只有一个全局变量,该怎么办呢?存全局变量count
吗?
如果递归过程中
if (map.containsKey(key)) {
... ...
}
遇到了已经求过的解该怎么办呢?
我们每次得到一个解后增加全局变量count
,所以我们map
的value
存两次递归后 count
的增量。这样的话,第二次遇到同样的情况的时候,就不用递归了,把当前增量加上就可以了。
if (map.containsKey(key)) {
count += map.get(key);
return;
}
综上,代码就出来了
int count = 0;
public int numDistinct(String s, String t) {
HashMap map = new HashMap<>();
numDistinctHelper(s, 0, t, 0, map);
return count;
}
private void numDistinctHelper(String s, int s_start, String t, int t_start,
HashMap map) {
if (t_start == t.length()) {
count++;
return;
}
if (s_start == s.length()) {
return;
}
String key = s_start + "@" + t_start;
if (map.containsKey(key)) {
count += map.get(key);
return;
}
int count_pre = count;
//当前字母相等,s_start 后移一个,t_start 后移一个
if (s.charAt(s_start) == t.charAt(t_start)) {
numDistinctHelper(s, s_start + 1, t, t_start + 1, map);
}
//出来以后,继续尝试不选择当前字母,s_start 后移一个,t_start 不后移
numDistinctHelper(s, s_start + 1, t, t_start, map);
//将增量存起来
int count_increment = count - count_pre;
map.put(key, count_increment);
}
解法三 动态规划
让我们来回想一下解法一做了什么。s_start
和 t_start
不停的增加,一直压栈,压栈,直到
//T 是空串,选法就是 1 种
if (t_start == t.length()) {
return 1;
}
//S 是空串,选法是 0 种
if (s_start == s.length()) {
return 0;
}
T
是空串或者 S
是空串,我们就直接可以返回结果了,接下来就是不停的出栈出栈,然后把结果通过递推关系取得。
递归的过程就是由顶到底再回到顶。
动态规划要做的就是去省略压栈的过程,直接由底向顶。
这里我们用一个二维数组 dp[m][n]
对应于从 S[m,S_len)
中能选出多少个 T[n,T_len)
。
当 m == S_len
,意味着S
是空串,此时dp[S_len][n]
,n 取 0 到 T_len - 1
的值都为 0
。
当 n == T_len
,意味着T
是空串,此时dp[m][T_len]
,m 取 0 到 S_len
的值都为 1
。
然后状态转移的话和解法一分析的一样。如果求dp[s][t]
。
-
S[s] == T[t]
,当前字符相等,那就对应两种情况,选择S
的当前字母和不选择S
的当前字母dp[s][t] = dp[s+1][t+1] + dp[s+1][t]
-
S[s] != T[t]
,只有一种情况,不选择S
的当前字母dp[s][t] = dp[s+1][t]
代码就可以写了。
public int numDistinct(String s, String t) {
int s_len = s.length();
int t_len = t.length();
int[][] dp = new int[s_len + 1][t_len + 1];
//当 T 为空串时,所有的 s 对应于 1
for (int i = 0; i <= s_len; i++) {
dp[i][t_len] = 1;
}
//倒着进行,T 每次增加一个字母
for (int t_i = t_len - 1; t_i >= 0; t_i--) {
dp[s_len][t_i] = 0; // 这句可以省去,因为默认值是 0
//倒着进行,S 每次增加一个字母
for (int s_i = s_len - 1; s_i >= 0; s_i--) {
//如果当前字母相等
if (t.charAt(t_i) == s.charAt(s_i)) {
//对应于两种情况,选择当前字母和不选择当前字母
dp[s_i][t_i] = dp[s_i + 1][t_i + 1] + dp[s_i + 1][t_i];
//如果当前字母不相等
} else {
dp[s_i][t_i] = dp[s_i + 1][t_i];
}
}
}
return dp[0][0];
}
对比于解法一和解法二,如果Memoization
技术我们不用hash
,而是用一个二维数组,会发现其实我们的递归过程,其实就是在更新下图中的二维表,只不过更新的顺序没有动态规划这么归整。这也是不用Memoization
技术会超时的原因,如果把递归的更新路线画出来,会发现很多路线重合了,意味着我们进行了很多没有必要的递归,从而造成了超时。
我们画一下动态规划的过程。
S = "babgbag", T = "bag"
T 为空串时,所有的 s 对应于 1。
S 为空串时,所有的 t 对应于 0。
此时我们从 dp[6][2]
开始求。根据公式,因为当前字母相等,所以 dp[6][2] = dp[7][3] + dp[7][2] = 1 + 0 = 1 。
接着求dp[5][2]
,当前字母不相等,dp[5][2] = dp[6][2] = 1
。
一直求下去。
求当前问号的地方的值的时候,我们只需要它的上一个值和斜对角的值。
换句话讲,求当前列的时候,我们只需要上一列的信息。比如当前求第1
列,第3
列的值就不会用到了。
所以我们可以优化算法的空间复杂度,不需要二维数组,需要一维数组就够了。
此时需要解决一个问题,就是当求上图的dp[1][1]
的时候,需要dp[2][1]
和dp[2][2]
的信息。但是如果我们是一维数组,dp[2][1]
之前已经把dp[2][2]
的信息覆盖掉了。所以我们需要一个pre
变量保存之前的值。
public int numDistinct(String s, String t) {
int s_len = s.length();
int t_len = t.length();
int[]dp = new int[s_len + 1];
for (int i = 0; i <= s_len; i++) {
dp[i] = 1;
}
//倒着进行,T 每次增加一个字母
for (int t_i = t_len - 1; t_i >= 0; t_i--) {
int pre = dp[s_len];
dp[s_len] = 0;
//倒着进行,S 每次增加一个字母
for (int s_i = s_len - 1; s_i >= 0; s_i--) {
int temp = dp[s_i];
if (t.charAt(t_i) == s.charAt(s_i)) {
dp[s_i] = dp[s_i + 1] + pre;
} else {
dp[s_i] = dp[s_i + 1];
}
pre = temp;
}
}
return dp[0];
}
利用temp
和pre
两个变量实现了保存之前的值。
其实动态规划优化空间复杂度的思想,在 5题,10题,53题,72题 等等都已经用了,是非常经典的。
上边的动态规划是从字符串末尾倒着进行的,其实我们只要改变dp
数组的含义,用dp[m][n]
表示S[0,m)
和T[0,n)
,然后两层循环我们就可以从 1
往末尾进行了,思想是类似的,leetcode
高票答案也都是这样的,如果理解了上边的思想,代码其实也很好写。这里只分享下代码吧。
public int numDistinct(String s, String t) {
int s_len = s.length();
int t_len = t.length();
int[] dp = new int[s_len + 1];
for (int i = 0; i <= s_len; i++) {
dp[i] = 1;
}
for (int t_i = 1; t_i <= t_len; t_i++) {
int pre = dp[0];
dp[0] = 0;
for (int s_i = 1; s_i <= s_len; s_i++) {
int temp = dp[s_i];
if (t.charAt(t_i - 1) == s.charAt(s_i - 1)) {
dp[s_i] = dp[s_i - 1] + pre;
} else {
dp[s_i] = dp[s_i - 1];
}
pre = temp;
}
}
return dp[s_len];
}
总
这道题太经典了,从递归实现回溯,递归实现分治,Memoization
技术对递归的优化,从递归转为动态规划再到动态规划空间复杂度的优化,一切都是理所当然,不需要什么特殊技巧,一切都是这么优雅,太棒了。
自己一开始是想到回溯的方法,然后卡到了超时的问题上,看了这篇 和 这篇 的题解后才恍然大悟,一切才都联通了,解法一、解法二、解法三其实本质都是在填充那个二维矩阵,最终殊途同归,不知为什么脑海中有宇宙大爆炸,然后万物产生联系的画面,2333。
这里自己需要吸取下教训,自己开始在回溯卡住了以后,思考了动态规划的方法,dp
数组的含义已经定义出来了,想状态转移方程的时候在脑海里一直想,又卡住了。所以对于这种稍微复杂的动态规划还是拿纸出来画一画比较好。
更多详细通俗题解详见 leetcode.wang 。