codeforces 183d(期望概率dp)

我还是在noip模拟看到这题,看起来就是dp,然而考试时并想不到正解,打暴力居然MLE。dp又不会做……
然后我用了一个上午才YY了出来。

题面

题目描述
你要给N个人准备礼物——T-shirt!但是你不知道他们的尺码……总共有M种尺码,编号从1到M。虽然你不记得每个人准确的尺码,但是你记得对于每一个人i,每一个尺码j,i的尺码正好是j的概率Pij.
现在你要买正好N件T-shirt,求能收到合适尺码礼物的人数的最大期望值。
你送礼物的方式是:从第1个人到第N个人依次询问,如果还有他们的尺码的T-shirt,就送出,否则就不送。

输入格式
第一行有两个整数N,M
接下来有N行,每行有M个整数,第i行的第j个整数表示Pij,用0到1000的整数表示,真实的概率用给出的数字除以1000得到。
保证每一行的整数和是1000。

输出格式
一个实数,即最大期望保留8位小数。

数据范围
50%的数据:1<=n<=500,1<=m<=100
100%的数据:1<=n<=3000,1<=m<=300

缘于我对期望的直觉,我觉得不同T-shirt之间是相互独立的,即对于每件T-shirt,你买多少件,就会产生固定的期望。不同T-shirt产生的期望是可以相加的。
看出了这一点,就可以想暴力了。
由于买多少件,就会产生固定的期望、一共买n件,所以核心算法应该是个分组背包。
所以我们就要求出每件物品,买1~n件分别的期望。
根据期望=概率*件数,对于第k件T-shirt,故我们设f[i][j]表示,假设你买了无限件,在前i个人,能送出j件的概率。
根据字面意思转移,有

f[i][j]=f[i1][j1]a[i][k]+f[i1][j](1a[i][k])

设g[i]表示买i件送出件数的期望值,有

g[i]=j=0ijf[n][j]+ij=i+1nf[n][j]

可以前缀和优化成O(n)

然后就是一个分组背包了。
这样复杂度是O(n^2*m),MLE的问题可以用滚动数组解决。

我们观察g数组,直觉告诉我们它是个上凸函数,在送礼物给小姐姐时,你送多少和她的美滋滋程度显然不是正比的,证明的话,通过一轮画柿子,就有

g[k+1]g[k]=1i=0kf[n][i]

这个显然是单调的,所以就是上凸的了。
所以若g[i]不选,就不会选g[i+1],所以选一个算一个就可以了。
复杂度O(n^2+nm)。

#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 

using namespace std;
#define mmst(a, b) memset(a, b, sizeof(a))
#define mmcp(a, b) memcpy(a, b, sizeof(b))

typedef long long LL;

const int N=3030;

int n,m;
int a[N][N];
int num[330];
double f[330][N],g[330],h[N],sum[330],gl[N],last[330],ans;

void work(int x)
{
    num[x]++;
    if(num[x]>n)
    {
        g[x]=0;
        return;
    }
    for(int i=0;i<=n;i++)
    h[i]=f[x][i];

    f[x][0]=0.0;

    for(int i=1;i<=n;i++)
    f[x][i]=f[x][i-1]*(1000.0-1.0*a[i][x])/1000.0+h[i-1]*1.0*a[i][x]/1000.0;

    gl[x]+=f[x][n];

    sum[x]+=f[x][n]*num[x];
    double now=sum[x]+(num[x]+1)*(1.0-gl[x]);
    g[x]=now-last[x];
    last[x]=now;
}

int main()
{
    cin>>n>>m;
    for(int i=1;i<=n;i++)
    for(int j=1;j<=m;j++)
    scanf("%d",&a[i][j]);

    for(int ii=1;ii<=m;ii++)
    {
        f[ii][0]=1.0;
        for(int i=1;i<=n;i++)
        f[ii][i]=f[ii][i-1]*(1000.0-1.0*a[i][ii])/1000.0;

        gl[ii]=f[ii][n];
        last[ii]=g[ii]=1.0-f[ii][n];
    }

    for(int i=1;i<=n;i++)
    {
        double mx=0.0,tu;
        for(int ii=1;ii<=m;ii++)
        if(g[ii]>mx)
        {
            mx=g[ii];
            tu=ii;
        }
        ans+=mx;
        work(tu);
    }

    printf("%.8lf",ans);

    return 0;
}

即使我们手中空无一物,却能因此紧紧相牵。

你可能感兴趣的:(概率期望,dp)