jzoj 3072 掷骰子 (概率dp)

Description

太郎和一只免子正在玩一个掷骰子游戏。有一个有N个格子的长条棋盘,太郎和兔子轮流掷一个有M面的骰子,骰子M面分别是1到M的数字.且掷到任意一面的概率是相同的.掷到几.就往前走几步.当谁走到第N格时,谁就获胜了。游戏中还有一个规则“反弹”.就是当一位选手要走到第N格外时.他就会后退(就像飞行棋进营一样)。

假设现在一位追手在A格.当他掷出B时:

1.A+B

100%的数据.10≤n≤ 2000,1≤m,x,y≤n-1



题解:概率dp

f[i][j] 表示太郎到达i,兔子到达j,太郎为先手,胜利的概率。

我们不妨从后往前dp

显然f[n][j]=1,f[i][n]=0;

那么f[n][n]呢,因为太郎是先手所以此时该太郎走,那么上一步就是兔子走的,所以上上步太郎到达的n,所以太郎必胜,f[n][n]=1;

对于剩下的情况,我们考虑分类讨论:

1。 i+m<=n,j+m<=n


对于这种情况我可以各自跳跃一步,走到后面已经推过的格子中直接累加后面所有胜利的概率,除以总的方案数即可。之所以可以这么推是因为这一步不会产生新的胜利状态。

2。i>n-m,j>n-m


进入到[n-m+1,n]这一段,就意味着进入了一种循环状态,我们跳过了又会跳回来,有可能无限的循环下去。

观察上面式子中的每一项,发现是一个公比为(1-1/m)^2 的等比数列,那么我们套用等比数列的求和公式

s+∞=a1/(1-p) p为公比,a1为序列的第一项。

3. i>n-m,j<=n-m


i可能有1/m的概率直接到达终点,同时如果在兔子没走这一步之前太郎就胜利了,那么推到当前步也一定是可以胜利的,是所以是(m-1)是因为新的胜利的状态我们已经单独考虑了。那么如果兔子也可以在当前步到达终点,是否需要考虑呢?不需要因为太郎是先手,我们只要在当前步到达终点,就胜利了。

4. i<=n-m,j>n-m

jzoj 3072 掷骰子 (概率dp)_第1张图片

只有在i=n-m是太郎才能一步到达终点,考虑f[i+(1..m)][j]这是太郎为先手的胜利状态,所以在到达当前步之前我们要保证兔子走的那一步不能到达终点,所以是(m-1)

暴力dp是O(N^4),我们可以利用后缀矩阵优化将复杂度降为O(N^2)






  

#include
#include
#include
#include
#include
#define N 2003
using namespace std;
double m,f[N][N];
int n,x,y;
double sum(int x,int y,int x1,int y1)
{
	double t=f[x][y]-f[x1][y]-f[x][y1]+f[x1][y1];
	//cout<=1;i--)
    for (int j=n;j>=1;j--)
	{
		f[i][j]=f[i+1][j]+f[i][j+1]-f[i+1][j+1];
		if (i==n)
		{
			f[i][j]++;
			continue;
		}
	    if (j==n) continue;
	    if (i+m>n&&j+m>n)
	     f[i][j]+=1.0*m/(2.0*m-1.0);
	    if (i+m<=n&&j+m<=n)
	     f[i][j]+=(1.0/(m*m))*sum(i+1,j+1,i+m+1,j+m+1);
	    if (i>n-m&&j<=n-m)
	     f[i][j]+=((m-1)/(m*m))*sum(i,j+1,i+1,j+m+1)+1.0/m;
	    if (i<=n-m&&j>n-m)
	     f[i][j]+=((m-1)/(m*m))*sum(i+1,j,i+1+m,j+1)+(i==n-m)/(m*m);
	}
   /*for (int i=1;i<=n;i++)
   {
   	 for (int j=1;j<=n;j++)
   	  cout<



你可能感兴趣的:(动态规划)