【LeetCode】123. Best Time to Buy and Sell Stock III 解题报告(Python)

给定一个数组,它的第 i 个元素是一支给定的股票在第 i 天的价格。

设计一个算法来计算你所能获取的最大利润。你最多可以完成 两笔 交易。

注意: 你不能同时参与多笔交易(你必须在再次购买前出售掉之前的股票)。

示例 1:

输入: [3,3,5,0,0,3,1,4]
输出: 6
解释: 在第 4 天(股票价格 = 0)的时候买入,在第 6 天(股票价格 = 3)的时候卖出,这笔交易所能获得利润 = 3-0 = 3 。
随后,在第 7 天(股票价格 = 1)的时候买入,在第 8 天 (股票价格 = 4)的时候卖出,这笔交易所能获得利润 = 4-1 = 3 。
示例 2:

输入: [1,2,3,4,5]
输出: 4
解释: 在第 1 天(股票价格 = 1)的时候买入,在第 5 天 (股票价格 = 5)的时候卖出, 这笔交易所能获得利润 = 5-1 = 4 。
注意你不能在第 1 天和第 2 天接连购买股票,之后再将它们卖出。
因为这样属于同时参与了多笔交易,你必须在再次购买前出售掉之前的股票。
示例 3:

输入: [7,6,4,3,1]
输出: 0
解释: 在这个情况下, 没有交易完成, 所以最大利润为 0。

解题思路:

动态规划

  1. 这个题目限制只能交易两次,那么也就是说每天会有持有或不持有状态,以及交易或不交易状态,所以我们可以设置dp数组为
    i天,持有,交易次数
    dp = [[[0, 0, 0] for __ in range(2)] for _ in range(len(prices))]
  2. dp数组初始化,对于第一天有
    不持有,不交易,收益0
    dp[0][0][0] = 0
    不持有,交易一次,不存在
    dp[0][0][1] = float(’-inf’)
    不持有,交易两次,不存在
    dp[0][0][2] = float(’-inf’)
    持有,交易零次,即今天购买,收益为-prices[0]
    dp[0][1][0] = -prices[0]
    持有,交易一次,不存在(第一天不可能交易)
    dp[0][1][1] = float(’-inf’)
    持有,交易两次,不存在(第一天不可能交易)
    dp[0][1][2] = float(’-inf’)
  3. 对于第i天每种情况写状态转移公式
    不持有,不交易,收益与前一天相同
    dp[i][0][0] = dp[i-1][0][0]
    不持有,交易一次,可能是今天卖出或者昨天卖出,取最大值
    dp[i][0][1] = max(dp[i-1][1][0] + prices[i], dp[i-1][0][1])
    不持有,交易两次,可能是今天卖出或者昨天卖出,取最大值
    dp[i][0][2] = max(dp[i-1][1][1] + prices[i], dp[i-1][0][2])
    持有,交易零次,可能是今天购买或者昨天购买,取最大值
    dp[i][1][0] = max(dp[i-1][0][0] - prices[i], dp[i-1][1][0])
    持有,交易一次,可能是今天购买或者昨天购买,取最大值
    dp[i][1][1] = max(dp[i-1][0][1] - prices[i], dp[i-1][1][1])
    持有,交易两次,不存在(只能购买两次,不可能交易两次还持有)
    dp[i][1][2] = float(’-inf’)
  4. 返回什么,因为最大收益一定在最后一天,且都卖出,即不持有,但有时候只需要一次购买就能取得最大收益,比如[1,2,3,4,5],所以最大收益在max(dp[len(prices)-1][0])

提交代码:(动态规划,Runtime: 128 ms, faster than 19.45 %,代码可以优化,为了更易理解我未做优化 )

class Solution:
    def maxProfit(self, prices: 'List[int]') -> int:
        if prices == []:
            return 0
        # i天,持有,交易次数
        dp = [[[0, 0, 0] for __ in range(2)] for _ in range(len(prices))]
        dp[0][0][0] = 0
        dp[0][0][1] = float('-inf')
        dp[0][0][2] = float('-inf')
        dp[0][1][0] = -prices[0]
        dp[0][1][1] = float('-inf')
        dp[0][1][2] = float('-inf')
        for i in range(1, len(dp)):
            dp[i][0][0] = dp[i-1][0][0]
            dp[i][0][1] = max(dp[i-1][1][0] + prices[i], dp[i-1][0][1])
            dp[i][0][2] = max(dp[i-1][1][1] + prices[i], dp[i-1][0][2])
            dp[i][1][0] = max(dp[i-1][0][0] - prices[i], dp[i-1][1][0])
            dp[i][1][1] = max(dp[i-1][0][1] - prices[i], dp[i-1][1][1])
            dp[i][1][2] = float('-inf')
        return max(dp[len(prices)-1][0])

你可能感兴趣的:(LeetCode,动态规划,python)