#数学期望题目#

BZOJ4318

4318: OSU!

Time Limit: 2 Sec   Memory Limit: 128 MB

Description

osu 是一款群众喜闻乐见的休闲软件。 
我们可以把osu的规则简化与改编成以下的样子: 
一共有n次操作,每次操作只有成功与失败之分,成功对应1,失败对应0,n次操作对应为1个长度为n的01串。在这个串中连续的 X个1可以贡献X^3 的分数,这x个1不能被其他连续的1所包含(也就是极长的一串1,具体见样例解释) 
现在给出n,以及每个操作的成功率,请你输出期望分数,输出四舍五入后保留1位小数。 

Input

第一行有一个正整数n,表示操作个数。接下去n行每行有一个[0,1]之间的实数,表示每个操作的成功率。 

Output

只有一个实数,表示答案。答案四舍五入后保留1位小数。 

Sample Input

3
0.5
0.5
0.5

Sample Output

6.0

HINT

【样例说明】 

000分数为0,001分数为1,010分数为1,100分数为1,101分数为2,110分数为8,011分数为8,111分数为27,总和为48,期望为48/8=6.0 

N<=100000

定义Dp[i]表示当前到第i个位置,得分的期望。

定义随机变量x表示前i-1个位置(到第i-1处)的连续的1的长度(此处x理解为很多个按一定频率分布的确定值->一个长度)

定义l[i]表示到第i个位置,【连续1长度】的期望

那么有l[i] = pi * (x + 1) 这里的x是很多个值,所以它们按频率计算后的值就是l[i-1]

我们注意(a的期望 )*(b的期望) 不一定等于(a*b的期望)

所以平方关系需要另外处理。

定义l2[i]表示到第i个位置,【连续1长度平方】的期望

那么l2[i] = pi * (x + 1)^2 这里的x仍然是很多个值(很多个长度)

=> l2[i] = pi * (x^2 + 2*x + 1)  x^2中,x是很多个值,x^2表示的是位置i-1的连续1长度平方,根据频率计算后就应该是l2[i-1]

所以l2[i] = pi * (l2[i-1]+2*l[i-1]+1)

定义l3[i]表示到第i个位置,【连续1长度立方】的期望

那么l3[i] = pi * (x + 1)^3 这里x含义同上

=> l3[i] = pi * (x^3 + 3 * x^2 + 3 * x + 1) => pi * (l3[i-1]+3*l2[i-1]+3*l[i-1]+1)

对于当前位置i,Dp[i] = Dp[i-1] + (1- pi)*l3[i-1] 表示当前位置i,前面i-1位置处的连续1串有(1-pi)的可能会断掉(i处为0)。

最后全部完成后一定会断掉,所以Dp[N] += l3[N]

Code:

#include
#include
#include
#include
#include
using namespace std;

const int Max = 100000;

int N;
double l[Max + 5], l2[Max + 5], l3[Max + 5];

int main(){
    scanf("%d", & N);
    double rt=0, p;
    for(int i = 1; i <= N; ++ i){
        scanf("%lf", &p);
        l[i] = l[i-1] * p + p;
        l2[i] = (l2[i-1] + 2*l[i-1] + 1)*p;
        l3[i] = (l3[i-1] + 3 * l2[i-1] + 3 * l[i-1] + 1)*p;
        rt += (1-p)*l3[i-1];
    }
    rt += l3[N];
    printf("%.1lf\n", rt);
    return 0;
}

BZOJ1462

1426: 收集邮票

Time Limit: 1 Sec   Memory Limit: 162 MB

Description

有n种不同的邮票,皮皮想收集所有种类的邮票。唯一的收集方法是到同学凡凡那里购买,每次只能买一张,并且买到的邮票究竟是n种邮票中的哪一种是等概率的,概率均为1/n。但是由于凡凡也很喜欢邮票,所以皮皮购买第k张邮票需要支付k元钱。 现在皮皮手中没有邮票,皮皮想知道自己得到所有种类的邮票需要花费的钱数目的期望。

Input

一行,一个数字N N<=10000

Output

要付出多少钱. 保留二位小数

Sample Input

3

Sample Output

21.25

定义f[i]表示手上已经有i种不同的邮票,还需要买f[i]张才可能得到N种不同的邮票

考虑已经有i种邮票,现在要买到一种与前i种邮票不相同邮票需要买多少张

买一次就买到:(n-i)/n*1

买两次:i/n*(n-i)/n*2

买3次:(i/n)^2*(n-i)/n*3

......

(n-i)/n * (1 + i/n*2 + (i/n)^2*3 + ...... )

趋近于无穷,求和后为(n-i)/n*(n/(n-i))^2=n/(n-i)

所以f[i] = f[i+1]+n/(n-i)

定义g[i]表示手上已经买到i种不同的邮票,还需要花g[i]元才可能买到N种不同邮票

有两种可能,第一是i/n的概率买到重复的,计算时帮后面的f[i]次都垫付1元:i/n*(g[i]+f[i]+1)

第二是(n-i)/n的概率买到新的,计算时仍然垫付:(n-i)/n*(g[i+1]+f[i+1]+1)

g[i] = i/n*(g[i]+f[i]+1)+(n-i)/n*(g[i+1]+f[i+1]+1)


Code:

#include
#include
#include
#include
#include
using namespace std;

const int Max = 100000;

int N;
double f[Max + 5], g[Max + 5];

int main(){
    scanf("%d", & N);
    f[N] = 0;
    for(int i = N - 1; i; -- i)
        f[i] = f[i + 1] + 1.0*N / (N - i);
    g[N] = 0;
    for(int i = N - 1; i >= 0; -- i)
        g[i] = f[i]*i/(N-i)+1.0*i/(N-i)+g[i+1]+f[i+1]+1;
    printf("%.2lf\n", g[0]);
    return 0;
}

1419: Red is good

Time Limit: 10 Sec   Memory Limit: 64 MB

Description

桌面上有R张红牌和B张黑牌,随机打乱顺序后放在桌面上,开始一张一张地翻牌,翻到红牌得到1美元,黑牌则付出1美元。可以随时停止翻牌,在最优策略下平均能得到多少钱。

Input

一行输入两个数R,B,其值在0到5000之间

Output

在最优策略下平均能得到多少钱。

Sample Input

5 1

Sample Output

4.166666

注意定义期望dp时定义应该是一个未知的值,是一个期望的值,而不是确定的值,所以本题不能定义为f[i][j]手上拿到i张红,j张黑得到的钱数,

而应该是f[i][j]手上拿到i张红j张黑,到拿到所有的牌,还期望得到多少钱

所以f[i][j] = (R-i)/(R+B-i-j)*(f[i+1][j]+1)+(B-j)/(R+B-i-j)*(f[i][j+1]-1)


Code:

#include
#include
#include
#include
#include
using namespace std;

int R, B;
double f[2][5005];

int main(){
    scanf("%d%d", &R, &B);
    int N = R + B, tg = 1;
    for(int i = R; i >= 0; tg^=1, -- i)
        for(int j = B; j >= 0; -- j)    if(i != R || j != B ){
            f[tg][j] = max(0.0, 1.0*(R-i)/(N-i-j)*(f[tg^1][j]+1)+1.0*(B-j)/(N-i-j)*(f[tg][j+1]-1));
        }
    printf("%.6f\n",(int)(f[tg^1][0]*1000000)/1000000.0);
    return 0;
}
/*
5 1
4.166666
*/










你可能感兴趣的:(bzoj,math)