dp专辑 R - Trade [ 单调队列]

纠结~~~抓狂


题意:

lxhgww进行股票投资,他能预计未来T天内股票的变动,在第i天,他可以以价格为 APi买一支股票(最多ASi支),或者以价格BPi卖一支股票(最多BSi支),两次操作需要相差W天,同时他最多只能拥有MaxP支股票,求他T天收的最大收益。(起初他有无限的钱,没有任何股票


描述的不好,附上大牛大牛们翻译的:

Description

最近lxhgww又迷上了投资股票,通过一段时间的观察和学习,他总结出了股票行情的一些规律。 
通过一段时间的观察,lxhgww预测到了未来T天内某只股票的走势,第i天的股票买入价为每股APi,第i天的股票卖出价为每股BPi(数据保 证对于每个i,都有APi>=BPi),但是每天不能无限制地交易,于是股票交易所规定第i天的一次买入至多只能购买ASi股,一次卖出至多只能卖 出BSi股。 
另外,股票交易所还制定了两个规定。为了避免大家疯狂交易,股票交易所规定在两次交易(某一天的买入或者卖出均算是一次交易)之间,至少要间隔W 天,也就是说如果在第i天发生了交易,那么从第i+1天到第i+W天,均不能发生交易。同时,为了避免垄断,股票交易所还规定在任何时间,一个人的手里的 股票数不能超过MaxP。 
在第1天之前,lxhgww手里有一大笔钱(可以认为钱的数目无限),但是没有任何股票,当然,T天以后,lxhgww想要赚到最多的钱,聪明的 程序员们,你们能帮助他吗? 

Input

输入数据第一行包括3个整数,分别是T,MaxP,W。 
接下来T行,第i行代表第i-1天的股票走势,每行4个整数,分别表示APi,BPi,ASi,BSi。 

Output

输出数据为一行,包括1个数字,表示lxhgww能赚到的最多的钱数。


分析:

1、设f[i][j]表示前i天,手持j股时,最多能赚的钱

2、状态转移方程,从决策的角度来考虑。

决策1:不动---->f[i-1][j]

决策2:买---->f[r][k]-ap[i]*(j-k),意义为在第r天手持k之后,在第i天买(j-k)股(r<=i-w-1,k<j)

决策3:卖---->f[r][k]+bp[i]*(k-j),意义为在第r天手持k之后,在第i天卖(k-j)股(k>j)

∴ f[i][j]=max(决策1,决策2,决策3)  时间复杂度为O(T*T*maxp*maxp) 


优化:

1、决策2和3中需要枚举r,没有必要,r可以确定为i-w-1

2、对于决策2,我们先对状态转移方程进行一下变形:


f[i-w-1][k]-ap[i]*(j-k)=f[i-w-1][k]+ap[i]*k-ap[i]*j


对于一个确定的j,我们可以先求出max(f[i-w-1][k]+ap[i]*k)(k<=j),再用这个max值减去只与i和j有关的ap[i]*j,就能得到(买股票直到有j股)这一策略的最大收益。

看到max(f[i-w-1][k]+ap[i]*k)(k<=j)这样的式子,可以想到用单调队列优化(股票的支数为队列长度),可以将这一决策的时间复杂度优化到O(maxp)。

同样的道理,决策3也是可以优化到O(maxp)的。

最后,时间复杂度变成O(T*maxp)


//AC CODE::


#include<stdio.h>
#include<string.h>

#define maxn 2010
#define inf 10000000
#define Max(a,b) a>b?a:b

int f[maxn][maxn],ap[maxn],bp[maxn],as[maxn],bs[maxn],n,maxp,w;

struct node//用于单调队列
{
    int x,pos;//值、位置
} q[maxn];

int main()
{
    int test;
    scanf("%d",&test);
    while (test--)
    {
        //init
        scanf("%d %d %d",&n,&maxp,&w);
        for (int i=1; i<=n; i++)
            scanf("%d %d %d %d",&ap[i],&bp[i],&as[i],&bs[i]);
        for (int i=1; i<=n; i++)
            for (int j=0; j<=maxp; j++)
                f[i][j]=-inf;
        for (int i=1; i<=w+1; i++)
            for (int j=0; j<=as[i]; j++)
                f[i][j]=-ap[i]*j;
        //dp
        for (int i=2; i<=n; i++)
        {
            //last day
            for (int j=0; j<=maxp; j++)
                f[i][j]=Max(f[i-1][j],f[i][j]);
            if (i<=w+1)
                continue;
            //buy
            int head=0,tail=-1;
            for (int j=0; j<=maxp; j++)
            {
                //insert
                node tmp;
                tmp.x=f[i-w-1][j]+j*ap[i];
                tmp.pos=j;
                while (head<=tail&&q[tail].x<tmp.x)
                    tail--;
                q[++tail]=tmp;
                //delete
                while (head<=tail&&q[head].pos+as[i]<j)//
                    head++;
                f[i][j]=Max(f[i][j],q[head].x-j*ap[i]);
            }
            //sell
            head=0,tail=-1;
            for (int j=maxp; j>=0; j--)
            {
                //insert
                node tmp;
                tmp.x=f[i-w-1][j]+j*bp[i];
                tmp.pos=j;
                while (head<=tail&&q[tail].x<tmp.x)
                    tail--;
                q[++tail]=tmp;
                //delete
                while (head<=tail&&q[head].pos-bs[i]>j)//
                    head++;
                f[i][j]=Max(f[i][j],q[head].x-j*bp[i]);
            }
        }
        int ans=0;
        for (int i=0; i<=maxp; i++)
            if(ans<f[n][i])
                ans=f[n][i];
        printf("%d\n",ans);
    }
    return 0;
}




你可能感兴趣的:(优化,api,input,output,2010)