菜鸟学算法之POJ 1644 To Bet Or Not To Bet

    这是一道典型的概率DP题目,做的人不多,而且目前的通过率大约是1/3,因此非常有研究的价值.

 题目大意:Alexander 遇到了一个非常有趣的赌博游戏,在一条纸带上面,有若干小方格,第一个是Start方格,最后一个是End方格,除去这两个方格,还有m个方格.游戏开始的时候,赌注放在Start小方格中,以后每一轮中,先掷硬币,若是正面朝上,赌注向右移动1格,若是反面朝上,赌注向右移动2格,但是还没完,每一个小方格中还有一条指令,+n:向右移动n格,-n:向左移动n格,0:无动作,L:直接跳过一轮,掷硬币之后,需要执行赌注所在的方格的指令,才算结束这一轮.问:在给定的T轮之内,有多大概率获胜.

 首先,我们看到,第i轮与第i+1轮之间存在着很强的联系,因此采用动态规划是没错的.接下来,设计DP状态,设计状态转移方程,最终求解.需要注意的是,如果遇到指令为L的方格,则下一轮直接被跳过.这是这一题唯一需要注意的地方.

  

/*
* 通过分析,这道题可以采用概率DP来做.
* s[i]表示第 i 个小方格中的instruction,即 +n , -n , 0 , L
* 第一步,设计状态:dp[i][j]: 经过 i 轮 , 最后恰好落在第 j 个小方格中(注意,是最后,即掷硬币之后,根据instruction移动之后的的最终位置)的概率
* 第二步,设计状态转移方程: if( s[j+1] == "L" ) 
                            dp[i+2][j+1] += dp[i][j]*0.5
                         else
                            dp[i+1][j+1+s[j+1] ] += dp[i][j] * 0.5
*                        if( s[j+2] == "L" )    
                            dp[i+2][j+2] += dp[i][j]*0.5
*                        else     
                            dp[i+1][j+2+s[j+2] ] += dp[i][j] * 0.5
* AC : 212K 0ms
*/
#include <iostream>
#include<stdio.h>
#include<string.h>
using namespace std;
// data structure
const int MAXLEN = 53;
const int INF = 100000;
double dp[MAXLEN][MAXLEN];
int m , T ;     // 如题
int a[MAXLEN];  // 存储每个小方格中的数字,如果是L,则为INF

int main()
{
    int NumCase ;
    int i,j,k;
    char tmp[10] = {'\0'};

    scanf("%d",&NumCase);
    while( NumCase -- )
    {
        // 初始化
        memset( dp , 0 , sizeof(dp) );
        memset( a , 0 , sizeof(a) );
        // 输入
        scanf("%d%d",&m , &T );
        getchar();
        for(i=1;i<=m;i++)
        {
            scanf("%s",tmp);
            if( strcmp( tmp , "L") == 0 )     // 如果输入的是"L"
                a[i] = INF;
            else
                sscanf( tmp , "%d" , &a[i] );
        }
        // 处理
        dp[0][0] = 1.0;          // 初始的时候,dp[0][0]就是1
        for(i=0;i<=T-1;i++)     // 轮数,题目中指定为 <= T
            for(j=0;j<=m;j++)   // 小方格的位置,从0到 m+1 , m+2
            {
                if( a[j+1] == INF )
                    //dp[i+1][j+1] += dp[i][j]*0.5 ; 这道题的关键之处, 因为是直接跳过下一轮,所以dp[i+1][j+1]并不受影响!!!
                    dp[i+2][j+1] += dp[i][j]*0.5 ;
                else
                    dp[i+1][j+1+ a[j+1] ] += dp[i][j] * 0.5 ;

                if( a[j+2] == INF )
                    //dp[i+1][j+2] += dp[i][j]*0.5 ; 这道题的关键之处, 因为是直接跳过下一轮,所以dp[i+1][j+2]并不受影响!!!
                    dp[i+2][j+2] += dp[i][j]*0.5 ;
                else
                    dp[i+1][j+2+ a[j+2] ] += dp[i][j] * 0.5 ;
            }
        // 计算最终结果
        double ans = 0;
        for(i=1;i<=T;i++)
             ans += ( dp[i][m+1] + dp[i][m+2] );
        // 输出
        if( ans == 0.5 )
            printf("Push. 0.5000\n");
        else if( ans > 0.5 )
            printf("Bet for. %.4f\n",ans);
        else
            printf("Bet against. %.4f\n",ans);
    }
    return 0;
}

你可能感兴趣的:(算法,poj,1644)