ZJU1607 Varacious Steve - 博弈&动态规划★

题目描述:

游戏者AB分享N个面包圈,由A开始轮流取面包,每次不超过M个。当某人取得最后一个面包圈时为胜利者。胜利者可以吃掉已经取得的面包圈,失败者将自己取得的面包圈拿出来重新开始游戏,并由失败者开始取。假设AB两人都使用最佳决策,问A最多能吃到多少面包圈。

 

题目分析:

想了好久,DP思路还是不清晰,在网上搜了一下才豁然开朗。不过网上那个公式比较冗余,我把他的公式降了一维下来。

设f[s][d][r]表示当前游戏者取得s个,对手取得d个,剩余r个面包圈时,当前游戏者最终最多能吃到面包圈的数量。

当r>m时,f[s][d][r] = max{ s+d+r - f[d][s+k][r-k] (1<=k<=m) },当前游戏者不能一次将剩下的都取走;

当r<=m时,f[s][d][r] = s+d+r - f[0][0][d],当前游戏者可以取走剩下的面包圈获得胜利,开始新的一轮。

 

后记:

开始考虑的时候,列的方程太宏观了,似乎以前很多次都是这样。

有时候表示的状态不能有效地写出递推或递归方程的时候,一定要考虑增加状态表示的维度

 

/*
ZJU1607 Varacious Steve
*/

#include 
  
   
#include 
   
     #define N 105 #define clr(a) memset(a,0,sizeof(a)) int n,m; int f[N][N][N] = {0}; //f[s][d][r]表示当前游戏者取得s个、对手取得d个,剩余r个时,最终能获得的最大数目。 int MAX(int a,int b){ return a>b?a:b; } int F(int s,int d,int r){ if(f[s][d][r]) return f[s][d][r]; if(r<=m){ if(s==0 && d==0) f[s][d][r] = r; else f[s][d][r] = s+d+r-F(0,0,d); } else{ int k; for(k=1;k<=m;k++){ f[s][d][r] = MAX(f[s][d][r], s+d+r-F(d,s+k,r-k)); } } return f[s][d][r]; } int main() { int i,j,k; while(scanf("%d%d",&n,&m)!=EOF){ clr(f); printf("%d/n",F(0,0,n)); } return 0; }
   
  

 

 

你可能感兴趣的:(游戏)