HDU 4778 Gems Fight!(13年杭州区域赛-I题-博弈DP)

题目链接:Click here~~

题意:

有 G 种颜色的宝石,放在 B 个袋子里(每种颜色可以放多个)。

两人轮流选袋子(每个袋子只能被选 1 次),每次将选出来的袋子中的宝石放到 cooker 中,cooker 可能会起反应。

反应条件是 cooker 中出现 S 个一样颜色的宝石,而且一旦起反应,每 S 个一样颜色的宝石就会获得 1 个魔法石(同时反应)。

作为奖励,每次反应结束后当前玩家可以再选一个袋子继续游戏。

游戏目标是自己获得的魔法石尽量多,双方都采取最优策略的情况下,问最终两个玩家的魔法石之差。

解题思路:

由于每个袋子只能选一次,那么游戏的状态就只和我已经选取了哪些袋子有关,于是可以想到 [1 << B] 的状态。

可是怎样写才能使转移满足 “双方都采取最优策略” 呢?

这样的题目有一个特点,对于某个状态来说,双方的得分之和是一定的,同样只和我选取了哪些袋子有关,并且可以将其预处理出来。

用式子表示即, dp[old_state] = sum[old_state] - dp[new_state]。如此,就可以转移进行 dp 了。

 
#include <stdio.h>
#include <string.h>
#include <algorithm>

using namespace std;

const int N = 1 << 21;

bool vis[N];

int n,g,s,dp[N],score[N],a[22][9];

void get_score()
{
    int sum[9];
    for(int mask=0;mask<(1<<n);mask++)
    {
        memset(sum,0,sizeof(sum));
        for(int i=0;i<n;i++)
            if(mask >> i & 1 ^ 1)
                for(int j=1;j<=g;j++)
                    sum[j] += a[i][j];
        int ans = 0;
        for(int j=1;j<=g;j++)
            ans += sum[j] / s;
        score[mask] = ans;
    }
}

int dfs(int mask)
{
    if(vis[mask])
        return dp[mask];
    vis[mask] = true;
    int ret = 0;
    for(int i=0;i<n;i++)
        if(mask >> i & 1)
        {
            int __mask = mask ^ (1 << i);
            int _delta = score[__mask] - score[mask];
            if(_delta > 0)
                ret = max(ret,_delta + dfs(__mask));
            else
                ret = max(ret,score[0] - score[mask] - dfs(__mask));
        }
    return dp[mask] = ret;
}

int main()
{
    while(~scanf("%d%d%d",&g,&n,&s),g||n||s)
    {
        memset(vis,false,sizeof(vis));
        memset(a,0,sizeof(a));
        for(int i=0;i<n;i++)
        {
            int num,color;
            scanf("%d",&num);
            while(num--)
            {
                scanf("%d",&color);
                a[i][color]++;
            }
        }
        get_score();
        printf("%d\n",2*dfs((1<<n)-1)-score[0]);
    }
    return 0;
}
        


你可能感兴趣的:(HDU 4778 Gems Fight!(13年杭州区域赛-I题-博弈DP))