预测赢家
给定一个表示分数的非负整数数组。 玩家1从数组任意一端拿取一个分数,随后玩家2继续从剩余数组任意一端拿取分数,然后玩家1拿,……。每次一个玩家只能拿取一个分数,分数被拿取之后不再可取。直到没有剩余分数可取时游戏结束。最终获得分数总和最多的玩家获胜。
给定一个表示分数的数组,预测玩家1是否会成为赢家。你可以假设每个玩家的玩法都会使他的分数最大化。
示例 1:
输入: [1, 5, 2]
输出: False
解释: 一开始,玩家1可以从1和2中进行选择。
如果他选择2(或者1),那么玩家2可以从1(或者2)和5中进行选择。如果玩家2选择了5,那么玩家1则只剩下1(或者2)可选。
所以,玩家1的最终分数为 1 + 2 = 3,而玩家2为 5。
因此,玩家1永远不会成为赢家,返回 False。
示例 2:
输入: [1, 5, 233, 7]
输出: True
解释: 玩家1一开始选择1。然后玩家2必须从5和7中进行选择。无论玩家2选择了哪个,玩家1都可以选择233。
最终,玩家1(234分)比玩家2(12分)获得更多的分数,所以返回 True,表示玩家1可以成为赢家。
注意:
- 1 <= 给定的数组长度 <= 20.
- 数组里所有分数都为非负数且不会大于10000000。
- 如果最终两个玩家的分数相等,那么玩家1仍为赢家。
该题,在解法上可以使用递归与动归两种思路解决,而这里选择的使用动归来实现。
首先要注意到题目中,假设每个玩家的玩法都会使他的分数最大化,并且玩家 1 为先手。
双方拿到到分数的总和是一定的,这里的动态规划算法考虑的是两者的差值。也就是说,玩家 1 拿到的分数总和减去玩家 2 拿到的分数总和,如果最后大于0就获胜。
上面即为 AC 过的算法,其中对于辅助数组 dp[left][right],有转移方程:
这就表示玩家 1 和玩家 2 在区间 [left,right] 中,玩家 1 总得分与玩家 2 总得分的差值。其中 dp[left][right] 的值又是动态依赖于 dp[left + 1][right] 与 dp[left][right - 1] ,具体的关系如上,如果此时玩家 1 选择最左边的分数,则玩家 2 就只能从最左边 + 1 到最右边的区间去动态选择来,此时玩家 2 也会根据剩余的区间选择最优的答案;当玩家 1 选择最右边的分数时,亦是如此。
当 玩家 1 选择最左边的分数 时,有 nums[left] - dp[left + 1][right],这里表示玩家 1 选择了最左边的分数 nums[left],然后减去玩家 2 在剩余区间 [left - 1][right] 中获得的最优选择时与玩家 1 总得分的差值 dp[left + 1][right],此时就是玩家 1 与玩家 2 在区间 [left,right] 两者相差分别总得分的差值了。其中,被减去的 dp[left + 1][right] (或者 dp[left][right - 1] )是动态的代表 玩家 1 与 玩家 2 二者互斥其一的 与对方玩家的差值。
对于上面那一段,肯能会有疑惑,下面以一个具体的例子讲解:
对于数组 {1,2,3},有:
1 - (3 - 2) 进一步变为 1 - 3 + 2 其中中的正符号对应的数 1 和 2 即为玩家 1 的选择,负符号对应的数 3 即为玩家 2 的选择,1 - 3 + 2的结果即为玩家 1 总得分减去玩家 2 总得分的差值,且需要注意在 max(1 - dp[2][2], 2 - dp[1][1]) 式中,dp[2][2] 代表在整体数组{1,2,3} 的部分区间 {2} 中玩家 2 总分减去玩家 1 总分的差值,因为在整体数组 {1,2,3} 中的部分区间{1,2} 中玩家 1 选择了 1 之后,玩家 2 就只剩 2 可以选择了,此时 dp[2][2] 是针对于玩家 2 来说的。
但是对于如果数组整体只有 {1,2} 时,此时 dp[2][2] 是针对玩家 1 的。
1 class Solution { 2 3 public boolean PredictTheWinner(int[] nums) { 4 int[][] dp = new int[nums.length][nums.length]; 5 dp[dp.length - 1][dp.length - 1] = nums[nums.length - 1]; 6 for (int left = dp.length - 2; left >= 0; left--) { 7 for (int right = left; right < dp.length; right++) { 8 if (left == right) { 9 dp[left][right] = nums[left]; 10 } else { 11 int pickLeft = nums[left] - dp[left + 1][right]; 12 int pickRight = nums[right] - dp[left][right - 1]; 13 dp[left][right] = Math.max(pickLeft, pickRight); 14 } 15 } 16 } 17 return dp[0][nums.length - 1] >= 0; 18 } 19 20 }