bzoj 1076(状压dp)(期望dp)

传送门
题解:dp[i][j]表示第i轮状态为j(状态中为1的位表示当前物品还没被取走)的最大期望得分。为了防止从无效状态转移至有效状态,采用倒推法,从已知的有效状态往回推,具体注释在代码中。
P.S.不写memset可以快接近一倍,但是为了思维严密性,还是写一个,反正都能过(´∇`)
注意:由于吃过的宝物可以再吃(只有前提集合满足),所以if语句不能再加如下条件:(j&(1<<(k-1)))==0

#include
using namespace std;
const int MAXN=17;
int K,n,temp;
int val[MAXN],st[MAXN];
double dp[102][1<<17];
int main() {
//  freopen("bzoj 1076.in","r",stdin);
    scanf("%d%d",&K,&n);
    for (int i=1;i<=n;++i) {
        scanf("%d%d",&val[i],&temp);
        while (temp) st[i]+=(1<<(temp-1)),scanf("%d",&temp);
    }
    memset(dp,0,sizeof(dp));
    for (int i=K;i;--i)
        for (int j=0;j<=(1<1;++j) {
            for (int k=1;k<=n;++k)
                if ((st[k]&j)==st[k])//st[k]为j的子集,为有效状态
                    dp[i][j]+=max(dp[i+1][j],dp[i+1][j|(1<<(k-1))]+val[k]);
                else dp[i][j]+=dp[i+1][j];
            dp[i][j]/=n;//概率为1/n
        }
    printf("%.6lf\n",dp[1][0]);
    return 0;
}

你可能感兴趣的:(dp)