【算法学习】DP table 之买卖股票的最佳时机

本文参考自:leetcode-cn题解、英文版。
建议直接看 LeetCode 题解,更加详细易懂,本文只是一个学习笔记。


LeetCode 上有一个系列的题目叫“买卖股票的最佳时机”,大致模板为:

给定一个数组,它的第 个元素是一支给定股票第 i 天的价格。如果你最多只允许完成 笔交易(即买入和卖出一支股票),设计一个算法来计算你所能获取的最大利润。

具体的题目有:
121. 买卖股票的最佳时机()
122. 买卖股票的最佳时机 II()
123. 买卖股票的最佳时机 III()
188. 买卖股票的最佳时机 IV(任意 )
309. 最佳买卖股票时机含冷冻期( with cooldown)
714. 买卖股票的最佳时机含手续费( with fee)

解决这个系列题目的统一套路就是 DP table(状态表动态规划?),解题思路如下。


穷举框架

即穷举所有状态,具体到每一天,看看总共有多少种可能的状态,再找出每种状态对应的选择。我们要穷举所有的状态,穷举的目的是根据对应的选择更新状态。

for 状态1 in 状态1的所有取值:
    for 状态2 in 状态2的所有取值:
        for ...
            dp[状态1][状态2][...] = 择优(选择1,选择2...)

这个问题的状态有三个:天数、允许交易的最大次数、是否持有
选择则有三种:买入、卖出、无操作,但买入只能在卖出之后,卖出也只能在买入之后。

用一个三维数组表示全部的状态组合:

dp[i][k][s]
0 <= i <= n-1, 1 <= k <= K, s = 0 or 1
n 为天数,K 为最多交易数,s取值1/0表示是否持有
此问题共 n × K × 2 种状态,全部穷举就能搞定。

for 0 <= i < n:
    for 1 <= k <= K:
        for s in {0, 1}:
            dp[i][k][s] = max(buy, sell, rest)

这个三维数组中的每个元素都可以用自然语言来描述,比如 dp[3][2][1] 的含义是:今天是第三天,现在手上持有着股票,至今最多进行 2 次交易。

状态转移框架

考虑每种状态下有哪些选择,以及每种选择该如何更新状态。只看持有状态,可以画个状态转移图:

持有状态转移图

根据状态转移图,写出状态转移方程:

dp[i][k][0] = max(dp[i-1][k][0], dp[i-1][k][1] + prices[i])
              max(   选择 rest  ,           选择 sell      )

解释:今天我没有持有股票,有两种可能:
要么是我昨天就没有持有,然后今天选择 rest,所以我今天还是没有持有;
要么是我昨天持有股票,但是今天我 sell 了,所以我今天没有持有股票了。

dp[i][k][1] = max(dp[i-1][k][1], dp[i-1][k-1][0] - prices[i])
              max(   选择 rest  ,           选择 buy         )

解释:今天我持有着股票,有两种可能:
要么我昨天就持有着股票,然后今天选择 rest,所以我今天还持有着股票;
要么我昨天本没有持有,但今天我选择 buy,所以今天我就持有股票了。

定义 Base Case

即最简单的情况:

dp[-1][k][0] = 0
解释:因为 i 是从 0 开始的,所以 i = -1 意味着还没有开始,这时候的利润当然是 0 。
dp[-1][k][1] = -infinity
解释:还没开始的时候,是不可能持有股票的,用负无穷表示这种不可能。
dp[i][0][0] = 0
解释:因为 k 是从 1 开始的,所以 k = 0 意味着根本不允许交易,这时候利润当然是 0 。
dp[i][0][1] = -infinity
解释:不允许交易的情况下,是不可能持有股票的,用负无穷表示这种不可能。

DP table 关键点总结

base case:
dp[-1][k][0] = dp[i][0][0] = 0
dp[-1][k][1] = dp[i][0][1] = -infinity

状态转移方程:
dp[i][k][0] = max(dp[i-1][k][0], dp[i-1][k][1] + prices[i])
dp[i][k][1] = max(dp[i-1][k][1], dp[i-1][k-1][0] - prices[i])

具体问题处理:

第一题,

int maxProfit_k_1(vector& prices) {
    int dp[2] = {0, -INT_MAX};
    for(int i=0; i

第二题,

int maxProfit_k_inf(vector& prices) {
    int dp[2]={0, -INT_MAX}, temp;
    for(int i=0; i

第三题,

int maxProfit_k_2(vector& prices) {
    int dp[2][2]={0, -INT_MAX, 0, -INT_MAX};
    for(int i=0; i

第四题,任意

int maxProfit_k_any(int k, vector& prices) {
    if(k<1) return 0;
    if(k>prices.size()/2) return maxProfit_k_inf(prices);
    vector dp0, dp1;
    dp0.resize(k, 0);
    dp1.resize(k, -INT_MAX);
    int temp;
    for(int i=0; i0? dp0[j-1]:0;
            dp0[j] = max(dp0[j], dp1[j]+prices[i]);
            dp1[j] = max(dp1[j], temp-prices[i]);
        }
    }
    return dp0[k-1];
}

第五题, with cooldown

int maxProfit_cool(vector& prices) {
    int dp[2]={0, -INT_MAX}, pre=0, temp;
    for(int i=0; i

第六题, with fee

int maxProfit_fee(vector& prices, int fee) {
    int dp[2]={0, -INT_MAX}, temp;
    for(int i=0; i

你可能感兴趣的:(【算法学习】DP table 之买卖股票的最佳时机)