原题链接:https://leetcode-cn.com/problems/predict-the-winner/description/
该题,在解法上可以使用递归与动归两种思路解决,而这里选择的使用动归来实现。
首先要注意到题目中,假设每个玩家的玩法都会使他的分数最大化
,并且玩家 1 为先手
。
public boolean PredictTheWinner(int[] nums) {
int[][] dp = new int[nums.length][nums.length];
dp[dp.length - 1][dp.length - 1] = nums[nums.length - 1];
for (int left = dp.length - 2; left >= 0; left--) {
for (int right = left; right < dp.length; right++) {
if (left == right) {
dp[left][right] = nums[left];
} else {
int pickLeft = nums[left] - dp[left + 1][right];
int pickRight = nums[right] - dp[left][right - 1];
dp[left][right] = Math.max(pickLeft, pickRight);
}
}
}
return dp[0][nums.length - 1] >= 0;
}
双方拿到到分数的总和是一定的,这里的动态规划算法考虑的是两者的差值。也就是说,玩家 1 拿到的分数总和减去玩家 2 拿到的分数总和,如果最后大于0就获胜。
上面即为 AC 过的算法,其中对于辅助数组 dp[left][right]
,有转移方程:
dp[left][right] = max(
nums[left] - dp[left + 1][right], nums[right] - dp[left][right - 1])
这就表示玩家 1 和玩家 2 在区间 [left,right]
中,玩家 1 总得分与玩家 2 总得分的差值。其中 dp[left][right]
的值又是动态
依赖于 dp[left + 1][right]
与 dp[left][right - 1]
,具体的关系如上,如果此时玩家 1 选择最左边的分数,则玩家 2 就只能从最左边 + 1 到最右边的区间去动态选择来,此时玩家 2 也会根据剩余的区间选择最优的答案
;当玩家 1 选择最右边的分数时,亦是如此。
当 玩家 1 选择最左边的分数
时,有 nums[left] - dp[left + 1][right]
,这里表示玩家 1 选择了最左边的分数 nums[left]
,然后减去玩家 2 在剩余区间 [left - 1][right]
中获得的最优选择时与玩家 1 总得分的差值 dp[left + 1][right]
,此时就是玩家 1 与玩家 2 在区间 [left,right]
两者相差分别总得分的差值了。其中,被减去的 dp[left + 1][right]
(或者 dp[left][right - 1]
)是动态的代表 玩家 1
与 玩家 2
二者互斥其一的 与对方玩家的差值。
对于上面那一段,肯能会有疑惑,下面以一个具体的例子讲解:
对于数组 {1,2,3}
,有:
dp[1,3] = max(1 - dp[2][3], 3 - dp[1][2])
dp[2,3] = max(3 - dp[2][2], 2 - dp[3][3])
= max(3 - 2, 2 - 3)
= 3 - 2
dp[1,2] = max(1 - dp[2][2], 2 - dp[1][1])
= max(1 - 2, 2 - 1)
= 2 - 1
则
dp[1,3] = max(1 - (3 - 2), 3 - (2 - 1))
= max(1 - 3 + 2, 3 - 2 + 1)
1 - (3 - 2)
进一步变为 1 - 3 + 2
其中中的正符号对应的数 1
和 2
即为玩家 1 的选择,负符号对应的数 3
即为玩家 2 的选择,1 - 3 + 2
的结果即为玩家 1 总得分减去玩家 2 总得分的差值,且需要注意在 max(1 - dp[2][2], 2 - dp[1][1])
式中,dp[2][2]
代表在整体数组{1,2,3}
的部分区间 {2}
中玩家 2 总分减去玩家 1 总分的差值,因为在整体数组 {1,2,3}
中的部分区间{1,2}
中玩家 1 选择了 1
之后,玩家 2 就只剩 2
可以选择了,此时 dp[2][2]
是针对于玩家 2 来说的。
但是对于如果数组整体只有 {1,2}
时,此时 dp[2][2]
是针对玩家 1 的。