力扣题目链接
给定一个数组,它的第 i
个元素是一支给定的股票在第 i
天的价格。
设计一个算法来计算你所能获取的最大利润。你最多可以完成 两笔 交易。
**注意:**你不能同时参与多笔交易(你必须在再次购买前出售掉之前的股票)。
示例 1:
输入:prices = [3,3,5,0,0,3,1,4]
输出:6
解释:在第 4 天(股票价格 = 0)的时候买入,在第 6 天(股票价格 = 3)的时候卖出,这笔交易所能获得利润 = 3-0 = 3 。
随后,在第 7 天(股票价格 = 1)的时候买入,在第 8 天 (股票价格 = 4)的时候卖出,这笔交易所能获得利润 = 4-1 = 3 。
示例 2:
输入:prices = [1,2,3,4,5]
输出:4
解释:在第 1 天(股票价格 = 1)的时候买入,在第 5 天 (股票价格 = 5)的时候卖出, 这笔交易所能获得利润 = 5-1 = 4 。
注意你不能在第 1 天和第 2 天接连购买股票,之后再将它们卖出。
因为这样属于同时参与了多笔交易,你必须在再次购买前出售掉之前的股票。
示例 3:
输入:prices = [7,6,4,3,1]
输出:0
解释:在这个情况下, 没有交易完成, 所以最大利润为 0。
示例 4:
输入:prices = [1]
输出:0
题目中提到你最多可以完成 两笔 交易,这说明可以不买卖,或可以买卖一次,可以买卖两次。因此用动态规划找到每个状态在这三种情况下中的最大值
dp[i][j]
中i
表示第i
天,j
为 [0 - 4]
五个状态,dp[i][j]
表示第i
天状态j
所获得的最大现金。
这五个状态分别为:
没有操作
第一次买入
第一次卖出
第二次买入
第二次卖出
确定递推公式
需要注意:dp[i][1]
,表示的是第i天,对股票的操作状态,并不是说一定要第i天买入股票
如果第i
天处于没有操作的状态,即dp[i][0]
, 那么只能由一个状态推出来:
i
天没有操作,前一天也是一定没有操作的,不然一定是处于dp[i][1 - 4]
之间的任意一个状态,那么dp[i][0] = dp[i - 1][0]
如果第i
天处于第一次买入股票的状态,即dp[i][1]
, 那么可以由两个状态推出来
i
天第一次买入股票了,前一天是肯定没有操作的,那么dp[i][1] = dp[i-1][0] - prices[i]
i
天没有操作,而是沿用前一天的第一次买入的状态,即:dp[i][1] = dp[i - 1][1]
dp[i][1]
应该选所得现金最大的,所以dp[i][1] = max(dp[i-1][0] - prices[i], dp[i - 1][1])
如果第i
天处于第一次卖出股票的状态,即dp[i][2]
, 那么可以由两个状态推出来
i
天第一次卖出股票了,说明前一天都是处于的第一次买入的状态,那么dp[i][2] = dp[i - 1][1] + prices[i]
i
天没有操作,沿用前一天第一次卖出股票的状态,即:dp[i][2] = dp[i - 1][2]
dp[i][1]
应该选所得现金最大的,所以dp[i][1] = max(dp[i-1][0] - prices[i], dp[i - 1][1])
第3、4的状态推理和1、2的相同,读者可以自己用相同的方式得到:
dp[i][3] = max(dp[i - 1][3], dp[i - 1][2] - prices[i])
dp[i][4] = max(dp[i - 1][4], dp[i - 1][3] + prices[i])
对于没有操作的状态,第0天肯定也是没有操作的:dp[0][0] = 0
对于第一次买入的状态,第0天肯定要进行买入:dp[0][1] = -prices[0]
对于第一次卖出的状态,第0天肯定卖出不了,因为还没买过:dp[0][2] = 0
,并且从递推公式中可以看出每次是取最大值,那么既然是收获利润如果比0还小了就没有必要收获这个利润了
现在考虑第二次买入的状态,第一次还没买入呢,怎么初始化第二次买入呢?
第二次买入依赖于第一次卖出的状态,其实相当于第0天第一次买入了,第一次卖出了,然后在买入一次(第二次买入),那么现在手头上没有现金,只要买入,现金就做相应的减少:dp[0][3] = -prices[0]
同理对于第二次卖出的状态:dp[0][4] = 0
从递归公式其实已经可以看出,一定是从前向后遍历,因为dp[i]
,依靠dp[i - 1]
的数值。
以输入[1,2,3,4,5]为例
最终最大利润是dp[4][4]
注:现在最大的时候一定是卖出的状态,而两次卖出的状态现金最大一定是最后一次卖出。
这是为什么不用比较第一次卖出的的收益和第二次卖出的收益,哪个更高就选哪个,而是直接选择第二次的return?
因为对于每一天来说,在第二次买入的时候(即状态3)判断了(前一天第二次买入的状态
,前一天第一次卖出状态的收益-今天第二次卖出的现金
)哪个亏的少(哪个赚的多);以及第二次卖出时哪个亏的少(哪个赚的多)
这个是如何实现的呢?
dp[3] = -prices[0];
从上面的代码第0天的初始化实现的,这里初始化了第二次就是同时考虑了第一次(买进卖出收益为0)的情况
总结起来就算说:第二次一定是大于等于第一次的
完整代码
public int maxProfit(int[] prices) {
if (prices.length == 0) return 0;
// 定义 5 种状态:
// 0: 没有操作, 1: 第一次买入, 2: 第一次卖出, 3: 第二次买入, 4: 第二次卖出
int[][] dp = new int[prices.length][5];
dp[0][1] = -prices[0];
dp[0][3] = -prices[0];
for (int i = 1; i < prices.length; i++) {
dp[i][0] = dp[i - 1][0];
dp[i][1] = Math.max(dp[i - 1][1], dp[i - 1][0] - prices[i]);
dp[i][2] = Math.max(dp[i - 1][2], dp[i - 1][1] + prices[i]);
dp[i][3] = Math.max(dp[i - 1][3], dp[i - 1][2] - prices[i]);
dp[i][4] = Math.max(dp[i - 1][4], dp[i - 1][3] + prices[i]);
}
return dp[prices.length - 1][4];
}
一种优化空间写法:
public int maxProfit1(int[] prices) {
if (prices.length == 0) return 0;
// 定义 5 种状态:
// 0: 没有操作, 1: 第一次买入, 2: 第一次卖出, 3: 第二次买入, 4: 第二次卖出
int[] dp = new int[5];
dp[1] = -prices[0];
dp[3] = -prices[0];
for (int i = 1; i < prices.length; i++) {
// 保持前面的买入状态或者现在买入
dp[1] = Math.max(dp[1], dp[0] - prices[i]);
// 保持前面的卖出状态或者现在卖出
dp[2] = Math.max(dp[2], dp[1] + prices[i]);
dp[3] = Math.max(dp[3], dp[2] - prices[i]);
dp[4] = Math.max(dp[4], dp[3] + prices[i]);
}
return dp[4];
}
大家会发现**dp[2]
利用的是当天的dp[1]
**。 但结果也是对的。
对于dp[1] = max(dp[1], dp[0] - prices[i])
:
如果dp[1]
取dp[1]
,即保持买入股票的状态,那么 dp[2] = max(dp[2], dp[1] + prices[i])
中dp[1] + prices[i]
就是今天卖出。
如果dp[1]
取dp[0] - prices[i]
,即今天买入股票,那么dp[2] = max(dp[2], dp[1] + prices[i])
中的dp[1] + prices[i]
相当于是今天再卖出股票,一买一卖收益为0,对所得现金没有影响。相当于今天买入股票又卖出股票,等于没有操作,保持昨天卖出股票的状态了。
力扣题目链接
给定一个整数数组 prices
,它的第 i
个元素 prices[i]
是一支给定的股票在第 i
天的价格。
设计一个算法来计算你所能获取的最大利润。你最多可以完成 k 笔交易。
**注意:**你不能同时参与多笔交易(你必须在再次购买前出售掉之前的股票)。
示例 1:
输入:k = 2, prices = [2,4,1]
输出:2
解释:在第 1 天 (股票价格 = 2) 的时候买入,在第 2 天 (股票价格 = 4) 的时候卖出,这笔交易所能获得利润 = 4-2 = 2
示例 2:
输入:k = 2, prices = [3,2,6,5,0,3]
输出:7
解释:在第 2 天 (股票价格 = 2) 的时候买入,在第 3 天 (股票价格 = 6) 的时候卖出, 这笔交易所能获得利润 = 6-2 = 4 。
随后,在第 5 天 (股票价格 = 0) 的时候买入,在第 6 天 (股票价格 = 3) 的时候卖出, 这笔交易所能获得利润 = 3-0 = 3 。
这道题目可以说是动态规划:123.买卖股票的最佳时机III的进阶版,这里要求至多有k次交易。那么就有2k+1种状态。
二维数组 dp[i][j]
:第i
天的状态为j
,所剩下的最大现金是dp[i][j]
j
的状态有2k + 1个:
0表示没有操作
2k+1表示第2k+1卖出
2k表示第2k次卖出
所以二维dp数组的定义为:
int[][] dp = new int[prices.length][2 * k + 1];
需要注意:dp[i][1]
,表示的是第i天,对股票的操作状态,并不是说一定要第i天买入股票
如果第i
天处于没有操作的状态,即dp[i][0]
, 那么只能由一个状态推出来:
i
天没有操作,前一天也是一定没有操作的,不然一定是处于dp[i][1 - 4]
之间的任意一个状态,那么dp[i][0] = dp[i - 1][0]
如果第i
天处于第一次买入股票的状态,即dp[i][1]
, 那么可以由两个状态推出来
i
天第一次买入股票了,前一天是肯定没有操作的,那么dp[i][1] = dp[i-1][0] - prices[i]
i
天没有操作,而是沿用前一天的第一次买入的状态,即:dp[i][1] = dp[i - 1][1]
dp[i][1]
应该选所得现金最大的,所以dp[i][1] = max(dp[i-1][0] - prices[i], dp[i - 1][1])
如果第i
天处于第一次卖出股票的状态,即dp[i][2]
, 那么可以由两个状态推出来
i
天卖出股票了,说明前一天都是处于的第一次买入的状态,那么dp[i][2] = dp[i - 1][1] + prices[i]
i
天没有操作,沿用前一天第一次卖出股票的状态,即:dp[i][2] = dp[i - 1][2]
dp[i][1]
应该选所得现金最大的,所以dp[i][1] = max(dp[i-1][0] - prices[i], dp[i - 1][1])
以此推理到2k和2k + 1的情况
// 递推公式
for (int i = 1; i < prices.length; i++) {
for (int j = 0; j < 2 * k - 1; j += 2) {
dp[i][j + 1] = Math.max(dp[i - 1][j + 1], dp[i - 1][j] - prices[i]);
dp[i][j + 2] = Math.max(dp[i - 1][j + 2], dp[i - 1][j + 1] + prices[i]);
}
}
对于没有操作的状态,第0天肯定也是没有操作的:dp[0][0] = 0
第0天做第一次买入的操作,dp[0][1] = -prices[0]
第0天做第一次卖出的操作,这个初始值应该是多少呢?
首先卖出的操作一定是收获利润,就是要大于等于0的现金才会进行这个操作,整个股票买卖最差情况也就是没有盈利即全程无操作现金为0
从递推公式中可以看出每次是取最大值,那么既然是收获利润如果比0还小了就没有必要收获这个利润了,所以dp[0][2] = 0
第0天后面的每次的买入操作,不用管第几次,现在手头上没有现金,只要买入,现金就做相应的减少,即初始化为:dp[0][3] = -prices[0]
所以同理可以推出dp[0][j]
当j为奇数的时候都初始化为 -prices[0]
// 初始化
int[][] dp = new int[prices.length][2 * k + 1];
for (int j = 1; j < 2 * k; j += 2) {
dp[0][j] = -prices[0];
}
从递归公式其实已经可以看出,一定是从前向后遍历,因为dp[i]
,依靠dp[i - 1]
的数值。
参考123题,以输入[1,2,3,4,5],k=2的例子。
完整代码:
public int maxProfit(int k, int[] prices) {
if (prices.length == 0) return 0;
// 定义 2k+1 种状态
// 初始化
int[][] dp = new int[prices.length][2 * k + 1];
for (int j = 1; j < 2 * k; j += 2) {
dp[0][j] = -prices[0];
}
// 递推公式
for (int i = 1; i < prices.length; i++) {
for (int j = 0; j < 2 * k - 1; j += 2) {
dp[i][j + 1] = Math.max(dp[i - 1][j + 1], dp[i - 1][j] - prices[i]);
dp[i][j + 2] = Math.max(dp[i - 1][j + 2], dp[i - 1][j + 1] + prices[i]);
}
}
return dp[prices.length - 1][2 * k];
}