【概率】BZOJ4008 [HNOI2015]亚瑟王

【题目】
BZOJ
n n n张牌,每张牌有发动概率 p i p_i pi和伤害值 d i d_i di。进行 r r r轮游戏,每轮游戏按编号顺序考虑每一张未发动过的牌以 p i p_i pi概率发动,若发动成功或当前为最后一张牌则进入下一轮,求总伤害的期望。 T T T组数据。 T ≤ 444 , n ≤ 220 , r ≤ 132 , d i ≤ 1000 T\leq 444,n\leq 220,r\leq 132,d_i\leq 1000 T444,n220,r132,di1000

【解题思路】
不妨采用期望的定义来计算答案。

如果一轮一轮算显然不太好算。观察到一张牌是否有贡献仅和它以及它前面的牌有关,不妨考虑这样一个状态 f i , j f_{i,j} fi,j表示到第 i i i张牌,一共使用过 j j j张牌的概率。

考虑转移,则第 i i i张牌有发动与不发动两种情况。

  • 发动,则前 i − 1 i-1 i1张牌有 j − 1 j-1 j1张牌发动,对于第 i i i张牌,在 r r r轮中有 j − 1 j-1 j1轮一定不会再发动,因此 f i , j + = ( 1 − ( 1 − p i ) r − j + 1 ) f i − 1 , j − 1 f_{i,j}+=(1-(1-p_i)^{r-j+1})f_{i-1,j-1} fi,j+=(1(1pi)rj+1)fi1,j1
  • 不发动,则前 i − 1 i-1 i1张牌有 j j j张牌发动,对于第 i i i张牌,再 r r r轮中有 j j j轮一定不会再发动,因此 f i , j + = ( 1 − p i ) r − j f i − 1 , j f_{i,j}+=(1-p_i)^{r-j}f_{i-1,j} fi,j+=(1pi)rjfi1,j

上面这个发动的柿子好像有点奇怪,实际上是因为这张牌可以在前 j j j轮的任意一轮发动,就是 ( p i + p i ( 1 − p i ) + p i ( 1 − p i ) 2 + ⋯ + p i ( 1 − p i ) j ) f i − 1 , j − 1 (p_i+p_i(1-p_i)+p_i(1-p_i)^2+\cdots +p_i(1-p_i)^j)f_{i-1,j-1} (pi+pi(1pi)+pi(1pi)2++pi(1pi)j)fi1,j1,然后用个等比数列就和就行了。
好像还是很奇怪?感觉这个概率有点问题?

感性理解一下应该是:如果我用了很多次,只有我第一次用的算数,后面拿的不算。这样当我转移的时候,就只算了最开始用了一个,后面用的和不用的概率之和等于 1 1 1,在我考虑转移到达的下一个时就可以绑在一起考虑,比拟成第 i i i张牌已经被移除了。

那么一张牌发动的概率就是 g i = ∑ j = 0 min ⁡ ( i − 1 , r ) ( 1 − ( 1 − p i ) r − j ) f i − 1 , j g_i=\sum_{j=0}^{\min (i-1,r) }(1-(1-p_i)^{r-j})f_{i-1,j} gi=j=0min(i1,r)(1(1pi)rj)fi1,j
复杂度 O ( T n r log ⁡ n ) O(Tnr\log n) O(Tnrlogn) log ⁡ n \log n logn来自懒人的快速幂。

【参考代码】

#include
using namespace std;

typedef double db;
const int N=222;
int n,r,T;
db ans,p[N],d[N],f[N][N];

db qpow(db x,int y)
{
	db res=1.0;
	for(;y;y>>=1,x=x*x)if(y&1)res=res*x;
	return res;
}

int main()
{
#ifndef ONLINE_JUDGE
	freopen("BZOJ4008.in","r",stdin);
	freopen("BZOJ4008.out","w",stdout);
#endif
	scanf("%d",&T);
	while(T--)
	{
		scanf("%d%d",&n,&r);
		for(int i=1;i<=n;++i) scanf("%lf%lf",&p[i],&d[i]);
		for(int i=0;i<=n;++i) for(int j=0;j<=r;++j) f[i][j]=0;

		f[1][0]=qpow(1-p[1],r);f[1][1]=1-f[1][0];
		for(int i=2;i<=n;++i) for(int j=0;j<=min(i,r);++j)
		{
			if(j) f[i][j]+=f[i-1][j-1]*(1-qpow(1-p[i],r-j+1));
			if(i^j) f[i][j]+=f[i-1][j]*qpow(1-p[i],r-j);
		}
		ans=f[1][1]*d[1];
		for(int i=2;i<=n;++i)
		{
			db t=0;
			for(int j=0;j<=min(i-1,r);++j) t+=f[i-1][j]*(1-qpow(1-p[i],r-j));
			ans+=t*d[i];
		}
		printf("%.10lf\n",ans);
	}
	return 0;
}

你可能感兴趣的:(DP-概率与期望)