poj 2096 概率dp

/**
    转自某大牛的博客!!
    dp求期望的题。
    题意:一个软件有s个子系统,会产生n种bug。
    某人一天发现一个bug,这个bug属于某种bug,发生在某个子系统中。
    求找到所有的n种bug,且每个子系统都找到bug,这样所要的天数的期望。
    需要注意的是:bug的数量是无穷大的,所以发现一个bug,出现在某个子系统的概率是1/s,
    属于某种类型的概率是1/n。
    解法:
    dp[i][j]表示已经找到i种bug,并存在于j个子系统中,要达到目标状态的天数的期望。
    显然,dp[n][s]=0,因为已经达到目标了。而dp[0][0]就是我们要求的答案。
    dp[i][j]状态可以转化成以下四种:
        dp[i][j]    发现一个bug属于已经找到的i种bug和j个子系统中
        dp[i+1][j]  发现一个bug属于新的一种bug,但属于已经找到的j种子系统
        dp[i][j+1]  发现一个bug属于已经找到的i种bug,但属于新的子系统
        dp[i+1][j+1]发现一个bug属于新的一种bug和新的一个子系统
    以上四种的概率分别为:
    p1 =     i*j / (n*s)
    p2 = (n-i)*j / (n*s)
    p3 = i*(s-j) / (n*s)
    p4 = (n-i)*(s-j) / (n*s)
    又有:期望可以分解成多个子期望的加权和,权为子期望发生的概率,即 E(aA+bB+...) = aE(A) + bE(B) +...
    所以:
    dp[i,j] = p1*dp[i,j] + p2*dp[i+1,j] + p3*dp[i,j+1] + p4*dp[i+1,j+1] + 1;
    由状态dp[i,j]又发现一个新bug时,才可能转化到后面的四种状态,一天才能发现一个bug,所以后面那个加1就是加1一天的意思
    整理得:
    dp[i,j] = ( 1 + p2*dp[i+1,j] + p3*dp[i,j+1] + p4*dp[i+1,j+1] )/( 1-p1 )
            = ( n*s + (n-i)*j*dp[i+1,j] + i*(s-j)*dp[i,j+1] + (n-i)*(s-j)*dp[i+1,j+1] )/( n*s - i*j )
**/
#include<iostream>
#include<algorithm>
#include<cstdio>
#include<cstring>
using namespace std;
const int maxn=1005;
int n,s;
double dp[maxn][maxn];
int main()
{
    scanf("%d%d",&n,&s);
    dp[n][s]=0;
    int i,j,sum=n*s;
    for(i=n;i>=0;i--)
    {
        for(j=s;j>=0;j--)
        {
            if(i==n&&j==s) continue;
            dp[i][j]=(sum+dp[i+1][j]*(n-i)*j+dp[i][j+1]*(s-j)*i+dp[i+1][j+1]*(n-i)*(s-j))/(sum-i*j);
        }
    }
    printf("%.4lf\n",dp[0][0]);
    return 0;
}

你可能感兴趣的:(poj 2096 概率dp)