zoj 3329(经典概率dp)


不写了,转别人的题解,但是还没有想明白这样做的道理。

题意:
有三个骰子,分别有k1,k2,k3个面。
每次掷骰子,如果三个面分别为a,b,c则分数置0,否则加上三个骰子的分数之和。
当分数大于n时结束。求游戏的期望步数。初始分数为0
 
分析:
假设dp[i]表示拥有分数i到游戏结束的期望步数
则  
(1):dp[i]=SUM(p[k]*dp[i+k])+p[0]*dp[0]+1;//p[k]表示增加分数为k的概率,p[0]表示分数变为0的概率
假定
(2):dp[i]=A[i]*dp[0]+B[i];

(3):dp[i+k]=A[i+k]*dp[0]+B[i+k];
将(3)代入(1)得:
(4):dp[i]=(SUM(p[k]*A[i+k])+p[0])*dp[0]+SUM(p[k]*B[i+k])+1;
将4与2做比较得:
A[i]=(SUM(p[k]*A[i+k])+p[0]);
B[i]=SUM(p[k]*B[i+k])+1;
当i+k>n时A[i+k]=B[i+k]=0可知
所以dp[0]=B[0]/(1-A[0])可求出


//#pragma comment(linker, "/STACK:1024000000,1024000000")
#include <iostream>
#include <cstdio>
#include <cstring>
#include <algorithm>
#include <vector>
#include <set>
#include <map>
#include <string>
#include <list>
#include <cstdlib>
#include <queue>
#include <stack>
#define ALL(a) a.begin(), a.end()
#define clr(a, x) memset(a, x, sizeof a)
#define fst first
#define snd second
#define pb push_back
#define lowbit(x) (x&(-x))
#define lson l,m,rt<<1
#define rson m+1,r,rt<<1|1
#define rep1(i,x,y) for(int i=x;i<=y;i++)
using namespace std;
typedef long long LL;
typedef pair<int, int> pii;
const int inf =0x3f3f3f3f;

const int N = 600;
int n,k1,k2,k3,aa,bb,c;
double p[N],a[N],b[N];
void dp(int i){
   if(i > n){ a[i]=b[i]=0; return ;}
   if(a[i] > 0) return ;
   a[i] =p[0]; b[i] = 1;
   for(int k=3;k<=k1+k2+k3;k++){
        dp(i+k);
        a[i]+=p[k]*a[i+k];
        b[i]+=p[k]*b[i+k];
   }
   return ;
}
int main()
{
   int T;
   scanf("%d",&T);
   while(T--){
      scanf("%d %d %d %d %d %d %d",&n,&k1,&k2,&k3,&aa,&bb,&c);
      clr(p,0); p[0]=1.0/(k1*k2*k3);
      rep1(i,1,k1) rep1(j,1,k2) rep1(k,1,k3) if(i!=aa || j!=bb || k!= c)
         p[i+j+k]+=1.0/(k1*k2*k3);

      clr(a,-1); clr(b,-1);
      dp(0);
      printf("%.10lf\n",b[0]/(1-a[0]));
   }
   return 0;
}


你可能感兴趣的:(zoj 3329(经典概率dp))