CF148D Bag of mice


题目传送门


思路

状态设计

d p i , j dp_{i, j} dpi,j 表示袋中有 i i i 个白鼠和 j j j 个黑鼠时, A A A 能赢的概率。

状态转移

现在考虑抓鼠情况:

  1. A A A 抓到白鼠:直接判 A A A 赢,概率是 i i + j \frac{i}{i + j} i+ji
  2. A , B A,B A,B 都抓到一只黑鼠,并且跑出来一只黑鼠:概率为 j i + j × j − 1 i + j − 1 × j − 2 i + j − 2 \frac{j}{i + j} \times \frac{j - 1}{i + j - 1} \times \frac{j - 2}{i + j - 2} i+jj×i+j1j1×i+j2j2,然后转移到 d p i , j − 3 dp_{i, j - 3} dpi,j3,故此情况下 A A A 获胜的概率为 j i + j × j − 1 i + j − 1 × j − 2 i + j − 2 × d p i , j − 3 \frac{j}{i + j} \times \frac{j - 1}{i + j - 1} \times \frac{j - 2}{i + j - 2} \times dp_{i, j - 3} i+jj×i+j1j1×i+j2j2×dpi,j3
  3. A , B A,B A,B 都抓到一只黑鼠,并且跑出来一只白鼠:概率为 j i + j × j − 1 i + j − 1 × i i + j − 2 \frac{j}{i + j} \times \frac{j - 1}{i + j - 1} \times \frac{i}{i + j - 2} i+jj×i+j1j1×i+j2i,然后转移到 d p i − 1 , j − 2 dp_{i - 1, j - 2} dpi1,j2,故此情况下 A A A 获胜的概率为 j i + j × j − 1 i + j − 1 × i i + j − 2 × d p i − 1 , j − 2 \frac{j}{i + j} \times \frac{j - 1}{i + j - 1} \times \frac{i}{i + j - 2} \times dp_{i - 1, j - 2} i+jj×i+j1j1×i+j2i×dpi1,j2
  4. B B B 抓到白鼠:此情况 A A A 失败,故不考虑。

所以总得转移方程就是:
d p i , j = i i + j + j i + j × j − 1 i + j − 1 × j − 2 i + j − 2 × d p i , j − 3 + j i + j × j − 1 i + j − 1 × i i + j − 2 × d p i − 1 , j − 2 dp_{i, j} = \frac{i}{i + j} + \frac{j}{i + j} \times \frac{j - 1}{i + j - 1} \times \frac{j - 2}{i + j - 2} \times dp_{i, j - 3} + \frac{j}{i + j} \times \frac{j - 1}{i + j - 1} \times \frac{i}{i + j - 2} \times dp_{i - 1, j - 2} dpi,j=i+ji+i+jj×i+j1j1×i+j2j2×dpi,j3+i+jj×i+j1j1×i+j2i×dpi1,j2
当然转移的时候得分别判断【 j j j 是否大于等于 3 3 3】和【 i i i 是否大于等于 1 1 1 j j j 是否大于等于 2 2 2】。

边界条件

  1. 在没有老鼠或全是黑鼠的情况下, A A A 一定输,即: ∀ i ∈ [ 0 , m ] ,   d p 0 , i = 0 \forall i \in [0, m], \ dp_{0, i} = 0 i[0,m], dp0,i=0
  2. 在只有白鼠的情况下, A A A 一定赢,即: ∀ i ∈ [ 1 , n ] ,   d p i , 0 = 1 \forall i \in [1, n], \ dp_{i, 0} = 1 i[1,n], dpi,0=1

复杂度

  • 时间复杂度: O ( n × m ) O(n \times m) O(n×m)
  • 空间复杂度: O ( n × m ) O(n \times m) O(n×m)

代码

#include 

using namespace std;

typedef long long ll;

const int maxn = 1e3 + 7;

int n, m;
double dp[maxn][maxn];
int main() {
	scanf("%d%d", &n, &m);
	for (int i = 0; i <= m; ++i) dp[0][i] = 0;  // 没有老鼠或只有黑鼠, B 赢 
	for (int i = 1; i <= n; ++i) dp[i][0] = 1;  // 只有白鼠, A 赢
	
	for (int i = 1; i <= n; ++i) {
		for (int j = 1; j <= m; ++j) {
			dp[i][j] += 1.0 * i / (i + j);
			if (j >= 3) {
				dp[i][j] += 1.0 * j / (i + j) * 1.0 * (j - 1) / (i + j - 1) *
						    1.0 * (j - 2) / (i + j - 2) * dp[i][j - 3];
			}
			if (i >= 1 && j >= 2) {
				dp[i][j] += 1.0 * j / (i + j) * 1.0 * (j - 1) / (i + j - 1) * 
							1.0 * i / (i + j - 2) * dp[i - 1][j - 2];
			}
		}
	}
	printf("%.9lf\n", dp[n][m]);
	return 0;
} 

你可能感兴趣的:(动态规划,概率与期望,题解,动态规划,概率与期望)