gdfzoj #470 Red is good(数学期望)

引言

第一次写博客。。。
原题链接:http://www.gdfzoj.com/oj/problem/470
标签:dp,数学期望

题意描述

Problem 470: [HbFS-]Red is good
Time Limit: 1000 ms
Memory Limit: 524288 KB

Problem Description
桌面上有R张红牌和B张黑牌,随机打乱顺序后放在桌面上,开始一张一张地翻牌,翻到红牌得到1美元,黑牌则付出1美元。可以随时停止翻牌,在最优策略下平均能得到多少钱。 输出答案时,小数点后第六位后的全部去掉,不要四舍五入.

Input
一行输入两个数R,B,其值在0到5000之间

Output
在最优策略下平均能得到多少钱。

Sample Input
5 1

Sample Output
4.166666

分析

从题意直接看似乎没有什么思路,但是如果能够想到适当的策略,解法就比较明显了。
先从解法策略考虑,我们可以用“见好就收”的策略,就是
取下一张牌当且仅当剩下的红牌的数量大于等于剩下的黑牌的数量
搬运数学期望公式:

E(x)=i=1nXiPi

有了这个公式,我们可以设E(x,y)来表示当取剩下x张红牌,y张黑牌是的期望值
那么,递推公式就是
E(x,y)=xx+y(E(x1,y)+1)+yx+y(E(x,y1)1)

其中,前面表示取到红牌的情况,后面表示取到黑牌的情况。
然后进行特判,如果E(x,y)小于0,则表示剩下的红牌的数量小于剩下的黑牌的数量,那么就停止翻盘。
最后输出E(R,B)即为答案。

代码

#include
#define max 5500
using namespace std;
int i,j,r,b;
double e[max][max],ll,rr;
int main()
{
    scanf("%d%d",&r,&b); 
    //for (i=0;i<=r;i++) e[i][0]=i;
    for (i=0;i<=r;i++)
        for (j=0;j<=b;j++)
        {
            ll=(double)i/(double)(i+j); rr=(double)j/(double)(i+j);
            if (i) e[i][j]+=(e[i-1][j]+1)*ll;
            if (j) e[i][j]+=(e[i][j-1]-1)*rr;
            if (e[i][j]<0) e[i][j]=0;
        }
    printf("%.6f",e[r][b]-0.0000005);
    return 0;    
}

你可能感兴趣的:(dp,数学)