硬币游戏

来源:USACO 2009年11月

农夫约翰的奶牛喜欢玩硬币游戏,因此他发明了一种称为“Xoinc”的两人硬币游戏。

初始时,一个有N(5 <= N <= 2,000)枚硬币的堆栈放在地上,从堆顶数起的第I枚硬币的币值为C_i (1 <= C_i <= 100,000)。

开始玩游戏时,第一个玩家可以从堆顶拿走一枚或两枚硬币。如果第一个玩家只拿走堆顶的一枚硬币,那么第二个玩家可以拿走随后的一枚或两枚硬币。如果第一个玩家拿走两枚硬币,则第二个玩家可以拿走1,2,3,或4枚硬币。在每一轮中,当前的玩家至少拿走一枚硬币,至多拿走对手上一次所拿硬币数量的两倍。当没有硬币可拿时,游戏结束。 两个玩家都希望拿到最多钱数的硬币。请问,当游戏结束时,第一个玩家最多能拿多少钱呢?

按一个人正常的逻辑思维来讲,这题的倒序做法要比正序做法好理解的多,所以本文采用倒序做法。

设f[i][j]表示其中一个人从第i个开始往后拿j个时的最大价值,注意i是倒序。

因为每次拿双方都采用最优策略,显然f[i][j] = max{sum[i] - f[i - k][k]},初值为f[i][j] = f[i][j - 1],其中k表示前一个人拿了k个硬币.

硬币游戏_第1张图片

显然红色部分就是sum[i] - f[i - k][k].

那么这样算这应该是一个O(n^3)的做法。

但是我们会发现f[i][j] = max{sum[i] - f[i - k][k]}这个转移方程中转移得到f[i][j]和f[i][j - 1]的式子非常接近,就是f[i][j]比f[i][j - 1]多了一种2*j和2*j - 1,那么我们只需要进行当k=2*j和k=2*j - 1的转移。

硬币游戏_第2张图片

其中c[i]表示硬币币值的前缀和,就是sum[i].

目标状态为dp[n][0].

你可能感兴趣的:(博弈动态规划)