uva10529 概率dp+区间dp

这道题有点绕,至少思考过程还是比较复杂的。

1.题意是要求寻找一个最优的期望,一想到最优,就会联想到枚举,但怎么枚举?

由题意可以发现可以枚举最后放的那个牌,为什么?因为这样对两边影响最小,只有当你两边都完成后才可以去计算中间那个值,这一步是区间dp的核心思想,将所有情况都归类到枚举的牌位置左右都有区间的情况去计算。

2.如何计算?

这个也是比较麻烦的。首先这个不像一般的概率dp直接用dp[i]表示放完i个牌后的期望,而是要将这个dp[i]分开计算。

具体的公式什么的见点击打开链接




#include <cstdio>
#include <cstring>
#include <cmath>
#include <algorithm>

using namespace std;
const int maxn = 1005;
const double INF = 0x3f3f3f3f3f3f3f;

int N;
double pl, pr, dp[maxn];

double solve () {
    double ac = 1 - pl - pr;

    for (int i = 1; i <= N; i++) {
        dp[i] = INF;
        for (int j = 0; j < i; j++) {
            double tmp = dp[i-j-1] * pl + dp[j] * pr;
            tmp = dp[j] + dp[i-j-1] + (tmp + 1) / ac;
            if (tmp < dp[i])
                dp[i] = tmp;
        }
    }
    return dp[N];
}

int main () {
    while (scanf("%d", &N) == 1 && N) {
        scanf("%lf%lf", &pl, &pr);
        printf("%.2lf\n", solve());
    }
    return 0;
}


你可能感兴趣的:(uva10529 概率dp+区间dp)