zoj 3329 概率dp

题意:有三个骰子,分别有k1,k2,k3个面。每个面值为1--kn
每次掷骰子,如果三个面分别为a,b,c则分数置0,否则加上三个骰子的分数之和。
当分数大于n时结束。求游戏的期望步数。初始分数为0

链接:点我
设dp[i]表示达到i分时到达目标状态的期望,pk为投掷k分的概率,p0为回到0的概率
则dp[i]=∑(pk*dp[i+k])+dp[0]*p0+1;
都和dp[0]有关系,而且dp[0]就是我们所求,为常数
设dp[i]=A[i]*dp[0]+B[i];
代入上述方程右边得到:
dp[i]=∑(pk*A[i+k]*dp[0]+pk*B[i+k])+dp[0]*p0+1
       =(∑(pk*A[i+k])+p0)dp[0]+∑(pk*B[i+k])+1;
明显A[i]=(∑(pk*A[i+k])+p0)
B[i]=∑(pk*B[i+k])+1
先递推求得A[0]和B[0].
那么  dp[0]=B[0]/(1-A[0]);

 1 #include<cstdio>

 2 #include<iostream>

 3 #include<algorithm>

 4 #include<cstring>

 5 #include<cmath>

 6 #include<queue>

 7 #include<map>

 8 using namespace std;

 9 #define MOD 1000000007

10 const int INF=0x3f3f3f3f;

11 const double eps=1e-5;

12 typedef long long ll;

13 #define cl(a) memset(a,0,sizeof(a))

14 #define ts printf("*****\n");

15 const int MAXN=1005;

16 int n,m,tt;

17 double p[MAXN],A[MAXN],B[MAXN];

18 int main()

19 {

20     int i,j,k;

21     int k1,k2,k3,a,b,c;

22     #ifndef ONLINE_JUDGE

23     freopen("1.in","r",stdin);

24     #endif

25     scanf("%d",&tt);

26     while(tt--)

27     {

28         scanf("%d%d%d%d%d%d%d",&n,&k1,&k2,&k3,&a,&b,&c);

29         double p0=1.0/k1/k2/k3;

30         cl(p),cl(A),cl(B);

31         for(i=1;i<=k1;i++)

32             for(j=1;j<=k2;j++)

33                 for(k=1;k<=k3;k++)

34                 {

35                     if(i==a&&j==b&&k==c)    continue;

36                     p[i+j+k]+=p0;

37                 }

38         for(i=n;i>=0;i--)

39         {

40             A[i]=p0,B[i]=1;

41             for(j=1;j<=k1+k2+k3;j++)

42             {

43                 A[i]+=p[j]*A[i+j];

44                 B[i]+=p[j]*B[i+j];

45             }

46         }

47         printf("%.16lf\n",B[0]/(1-A[0]));

48     }

49 }

 

你可能感兴趣的:(ZOJ)