HDU 4597 Play Game (博弈 + 区间dp)

题意:

Alice和Bob玩一个游戏,有两个长度为N的正整数数字序列,每次他们两个
只能从其中一个序列,选择两端中的一个拿走。他们都希望可以拿到尽量大
的数字之和,并且他们都足够聪明,每次都选择最优策略。Alice先选择,问
最终Alice拿到的数字总和是多少?

思路:

经典区间dp的变形,可以参考这道题:uva-10891
http://blog.csdn.net/wing_wuchen/article/details/52318477
无非是变成了取两个数列,规则上稍作变化。
所以增加两个维度来进行dp。
dp(i,j,k,l)表示第一个数列从i到j,第二个数列从k到l,此时能取到的最大值。
对于dp(i,j,k,l),可以由以下状态转移得到。
sum(i,j,k,l)- min(dp(i+1,j,k,l),dp(i,j-1,k,l),dp(i,j,k+1,l),dp(i,j,k,l-1))
但是注意,这是两个数列里都还能取得情况,当某个数列先取完之后,只能取另一个数列的这种情况,我们需要改变一些地方。
以下是我一开始没考虑这种情况的错误代码。

一开始的不对的代码:

#include 
#include 
#include 

using namespace std;

int a[30],b[30];
int suma[30],sumb[30];
int me[22][22][22][22];
int vis[22][22][22][22];

int dp(int i,int j,int k,int l){// 没错,就是这个dp错了
    if(vis[i][j][k][l]) return me[i][j][k][l];
    vis[i][j][k][l] = true;
    int sum = suma[j] - suma[i-1] + sumb[l] - sumb[k-1];
    int temp,temp2;
    if(i < j)
        temp = min(dp(i+1,j,k,l),dp(i,j-1,k,l));
    else
        temp = a[i];
    if(k < l)
        temp2 = min(dp(i,j,k+1,l),dp(i,j,k,l-1));
    else
        temp2 = b[k];
    return me[i][j][k][l] = sum - min(temp,temp2);
}

int main()
{
    int t;
    cin>>t;
    int n;
    while(t--){
        scanf("%d",&n);
        memset(me,-0x3f3f3f3f,sizeof(me));
        memset(vis,false,sizeof(vis));
        suma[0] = 0;
        sumb[0] = 0;
        for(int i = 1;i <= n;i++){
            scanf("%d",a+i);
            suma[i] = suma[i-1] + a[i];
        }
        for(int i = 1;i <= n;i++){
            scanf("%d",b+i);
            sumb[i] = sumb[i-1] + b[i];
        }
        printf("%d\n",dp(1,n,1,n));
    }
    return 0;
}

小总结:

第一份是错误的代码,因为边界条件没有控制好。
当i>j时,显然由suma得到的值是错误的。
当k>l时,同理。
但是还是不对,仔细查找后发现当i>j(或k>l)时我的临时变量temp的初值就很尴尬了。
所以干脆分成两个序列考虑,代码如下:

AC代码:

#include 
#include 
#include 

using namespace std;

int a[30],b[30];
int suma[30],sumb[30];
int me[22][22][22][22];
int vis[22][22][22][22];

int dp(int i,int j,int k,int l){
    int &ans = me[i][j][k][l];

    if(vis[i][j][k][l]) return ans;
    vis[i][j][k][l] = true;

    int sum;
    if(i > j){
        if(k == l) return ans = b[k];
        sum = sumb[l] - sumb[k-1];
    }
    else if(k > l){
        if(i == j) return ans = a[i];
        sum = suma[j] - suma[i-1];
    }
    else{
        sum = suma[j] - suma[i-1] + sumb[l] - sumb[k-1];
    }

    if(i <= j)
        ans = max(ans,sum-min(dp(i+1,j,k,l),dp(i,j-1,k,l)));
    if(k <= l)
        ans = max(ans,sum-min(dp(i,j,k+1,l),dp(i,j,k,l-1)));
    return ans;
}

int main()
{
    int t;
    cin>>t;
    int n;
    while(t--){
        scanf("%d",&n);
        memset(me,-0x3f3f3f3f,sizeof(me));
        memset(vis,false,sizeof(vis));
        suma[0] = 0;
        sumb[0] = 0;
        for(int i = 1;i <= n;i++){
            scanf("%d",a+i);
            suma[i] = suma[i-1] + a[i];
        }
        for(int i = 1;i <= n;i++){
            scanf("%d",b+i);
            sumb[i] = sumb[i-1] + b[i];
        }
        printf("%d\n",dp(1,n,1,n));
    }
    return 0;
}

你可能感兴趣的:(====dp====,区间dp,====博弈论====)