说是概率DP,其实主要是求概率和期望的问题
说到DP总要有状态,每种状态可能有多种子状态
一般的DP是这样:在DP过程中,当前状态必然是由多个子状态中的最优的转移而来
所以一般的DP求的是最优的结果
而概率不需要最优,而是实际概率
所以概率DP最大的区别在于:在DP过程中,当前状态是由所有子状态的概率共同转移而来
所以概率DP只是利用了DP的动态而没有规划 (只有状态转移,而不需要进行决策)
至于状态转移方程怎么列,最科学的自然是根据数学知识列,
不过实际做题中会发现找规律也是一种不错的方法,
而事实证明,如果可以状态转移,找规律的方法往往是可行的
不过数学扎实的话用数学知识绝对要比找规律快且准
POJ 3744 (矩阵优化)
题意:一条路上有n个地雷,你站在起点1的位置,每次有p的概率走1步,有1-p的概率走2步,
给出n,p,和n个雷的坐标xi,问不踩到地雷的概率
数据范围 : 1 <= n <= 10 ,0.25 <= p <= 0.75 ,1 <= xi <= 10^8
分析:
显然有雷的点比没有雷的点多得多,所以计算踩到雷的概率要比计算不踩到雷的概率简单
将路分为n段,(1~x1,x1~x2,x2~x3,...,xn-1~xn)单独计算每段踩到雷的概率,
利用乘法原理求出踩到雷的总概率,不踩到雷的概率 = 1 - 踩到雷的概率
dp[i]表示到达i点的概率
dp[i] = p*dp[i-1]+(1-p)*dp[i-2]
坐标数据太大,直接乘肯定不行,这个时候就需要用到矩阵快速幂
上面dp的状态转移方程其实和斐波那契数列的表达式很像不是吗^_^
用一样的原理构造矩阵就好了
#include
#include
#include
#include
using namespace std;
typedef long long ll;
struct Matrix
{
double mat[2][2];
};
Matrix operator * (Matrix a,Matrix b)
{
Matrix c;
for (int i = 0;i < 2;++i)
{
for (int j = 0;j < 2;++j)
{
c.mat[i][j] = 0;
for (int k = 0;k < 2;++k)
{
c.mat[i][j] += a.mat[i][k]*b.mat[k][j];
}
}
}
return c;
}
Matrix operator ^ (Matrix a,ll k)//矩阵幂
{
Matrix c;
memset(c.mat,0,sizeof(c.mat));
for(int i=0;i<2;i++)c.mat[i][i]=1;//初始化为单位矩阵
//据说任何矩阵乘以单位矩阵其值不会变
for (;k;k>>=1)
{
if (k&1) c = c*a;
a = a*a;
}
return c;
}
int x[111];
int main()
{
int n;double p;
while (cin>>n>>p)
{
for (int i = 0;i < n;++i) scanf("%d",x+i);
sort(x,x+n);
double ans = 1.0;
Matrix c;
c.mat[0][0] = p,c.mat[0][1] = 1.0-p;
c.mat[1][0] = 1.0,c.mat[1][1] = 0.0;
Matrix a = c^(x[0]-1);
ans *= (1-a.mat[0][0]);
for (int i = 1;i < n;++i)
{
if (x[i] == x[i-1]) continue;
a = c^(x[i]-x[i-1]-1);
ans *= (1.0-a.mat[0][0]);
}
printf("%.7f\n",ans);
}
return 0;
}
全概率问题:
当前场次要与j比赛的队伍x是哪个?而x能与j比必然是胜过了对手
dp[i][j]表示第i次比赛j赢的概率
dp[i][j] += dp[i-1][j]*dp[i-1][t]*p[j][t]
其中t是第i次比赛可能与j相邻的队伍
第奇数个赢家和前一个赢家比赛
第偶数个赢家和后一个赢家比赛
#define mem(a,x) memset(a,x,sizeof(a))
#include
#include
#include
#include
#include
#include
#include
#include
#include
Pear和Fish玩游戏游戏:
一个袋子里一开始装着w个白球和b个黑球。
从Pear开始,每次轮流随机抽出一个球。如果抽出的球是白色的,则抽出这个球的人立即获胜。
每当一个球被取出后(然后结算获胜情况后),会有另一个球自动滚出来(不算任何人抽的)。
每个人抽球、和自动滚出来的球都是等概率的。那么Pear获胜率是多少呢?
(以上为原题意抽象成的简单摸球概率问题)
dp[i][j]表示Peal摸球时剩余i个白球和j个黑球的胜率
#define mem(a,x) memset(a,x,sizeof(a))
#define EX2(x) ((x)*(x))
#define EX3(x) ((x)*(x)*(x))
#pragma comment(linker, "/STACK:1024000000,1024000000")
#include
#include
#include
#include
#include
#include
#include
#include
#include