Codeforces Round 767 (Div. 1) D2. Game on Sum (Hard Version)(博弈 期望 dp 贡献)

题目

t(t<=1e5)组样例,每次给定n,m,k(m<=n<=1e6,0<=k<1e9+7)

有一个游戏,持续n轮,每轮Alice先选一个[0,k]的实数,

Bob决定从总分里加上这个值还是减去这个值

特别地,n轮里,Bob选择加上的次数不得少于m次

每次都是Alice先选值,选完之后Bob决策,

Alice下一轮选值的时候,是知道上一轮Bob决策结果的

Alice想让这个总分最大,Bob想让这个总分最小,

求二人都最优策略时总分的期望,答案对1e9+7取模

思路来源

官方题解

题解

先把k提出来,转化成[0,1]的实数,最后乘上k

dp[i][j]表示还剩i局bob必须加j局时alice的最大分数期望

根据转移式,alice先选择一个k,

然后bob会选择更小的那个转移,

有dp[i][j]=min(dp[i-1][j]-k,dp[i-1][j-1]+k)

所以alice会这样选择k,使得两部分相等,有dp[i-1][j]-k=dp[i-1][j-1]+k,

有dp[i][j]=(dp[i-1][j]-k+dp[i-1][j-1]+k)/2=(dp[i-1][j]+dp[i-1][j-1])/2

终态dp[i][i]=i,即必须加i轮时,每轮都加1即可

图形是一个杨辉三角图形,考虑每个(i,i)的贡献,即(i,i)到(n,m)的路径条数

第一步(i,i)只能向下,因为(i,i)和(i-1,i-1)之间不再满足dp关系式,是O(1)求的dp[i][i]=i

①(n,m)是一个对角线点,即(n,m)=(i,i),ans=i

②(n,m)不是对角线点,枚举i

即(i+1,i)到(n,m)的路径,每一步要么令x加1,要么令x和y都加1,

即n-1-i步中选m-i步令y加1,每一次x加1都乘了1/2的系数,

所以,dp[i][i]的贡献是C_{n-1-i}^{m-i}*(\frac{1}{2})^{n-i}

代码1(easy)

// Problem: D2. Game on Sum (Hard Version)
// Contest: Codeforces - Codeforces Round 767 (Div. 1)
// URL: https://codeforces.com/contest/1628/problem/D2
// Memory Limit: 256 MB
// Time Limit: 3000 ms
// 
// Powered by CP Editor (https://cpeditor.org)

#include
using namespace std;
#define rep(i,a,b) for(int i=(a);i<=(b);++i)
#define per(i,a,b) for(int i=(a);i>=(b);--i)
typedef long long ll;
typedef double db;
typedef pair P;
#define fi first
#define se second
#define pb push_back
#define dbg(x) cerr<<(#x)<<":"<>=1)
	if(n&1)res=1ll*res*x%mod;
	return res;
}
void init(int n){ //n=1;--i)Finv[i]=1ll*Finv[i+1]*(i+1)%mod;
}
int C(int n,int m){
	if(m<0||m>n)return 0;
	return 1ll*fac[n]*Finv[n-m]%mod*Finv[m]%mod;
}
void sol(){
	sci(n),sci(m),sci(k);
	rep(i,1,n){
		dp[i][i]=i;
		rep(j,1,i-1){
			dp[i][j]=1ll*(dp[i-1][j]+dp[i-1][j-1])*inv2[1]%mod;
		}
	}
	printf("%d\n",1ll*dp[n][m]*k%mod);
}
int main(){
	init(N-1);
	sci(t); // t=1
	while(t--){
		sol();
	}
	return 0;
}

代码2(hard)

// Problem: D2. Game on Sum (Hard Version)
// Contest: Codeforces - Codeforces Round 767 (Div. 1)
// URL: https://codeforces.com/contest/1628/problem/D2
// Memory Limit: 256 MB
// Time Limit: 3000 ms
// 
// Powered by CP Editor (https://cpeditor.org)

#include
using namespace std;
#define rep(i,a,b) for(int i=(a);i<=(b);++i)
#define per(i,a,b) for(int i=(a);i>=(b);--i)
typedef long long ll;
typedef double db;
typedef pair P;
#define fi first
#define se second
#define pb push_back
#define dbg(x) cerr<<(#x)<<":"<>=1)
	if(n&1)res=1ll*res*x%mod;
	return res;
}
void init(int n){ //n=1;--i)Finv[i]=1ll*Finv[i+1]*(i+1)%mod;
}
int C(int n,int m){
	if(m<0||m>n)return 0;
	return 1ll*fac[n]*Finv[n-m]%mod*Finv[m]%mod;
}
void sol(){
	sci(n),sci(m),sci(k);
	int ans=0;//dp[i][j]表示还剩i局还能加j次的最大期望
	if(n==m){
		ans=n;
	}
	else{
		rep(i,0,n-1){//枚举(i,i)到(n,m)的路径 dp[i][i]=i*k
			ans=(ans+1ll*C(n-i-1,m-i)*i%mod*inv2[n-i])%mod;
		}
	}
	ans=1ll*ans*k%mod;
	printf("%d\n",ans);
}
int main(){
	init(N-1);
	sci(t); // t=1
	while(t--){
		sol();
	}
	return 0;
}

你可能感兴趣的:(#,概率dp/期望/概率,博弈,博弈,期望,dp)