闲人编程

动态规划与贝尔曼方程 —— 理论、案例与交互式 GUI 实现

动态规划与贝尔曼方程 —— 理论、案例与交互式 GUI 实现
- 一、引言
- 二、动态规划基本原理
- - 2.1 动态规划的思想
  - 2.2 贝尔曼方程
  - 2.3 值迭代与策略迭代
- 三、贝尔曼方程的数学推导
- - 3.1 最优性原理
  - 3.2 离散时间问题中的贝尔曼方程
  - 3.3 无穷时域折扣动态规划
- 四、动态规划在控制与决策中的应用
- - 4.1 最优控制问题
  - 4.2 强化学习与最优策略求解
  - 4.3 资源分配与调度问题
- 五、数值求解与算法实现
- - 5.1 值迭代算法
  - 5.2 策略迭代算法
  - 5.3 算法实现中的注意事项
- 六、典型案例分析
- - 6.1 案例一：最短路径问题
  - - 6.1.1 案例描述
    - 6.1.2 分析结论
  - 6.2 案例二：库存控制问题
  - - 6.2.1 案例描述
    - 6.2.2 分析结论
  - 6.3 案例三：机器人路径规划
  - - 6.3.1 案例描述
    - 6.3.2 分析结论
- 七、基于 PyQt6 的交互式 GUI 演示
- - 7.1 系统架构说明
  - 7.2 Python 代码实现
- 八、结语

动态规划与贝尔曼方程 —— 理论、案例与交互式 GUI 实现

一、引言

在现代控制理论、运筹学以及人工智能领域，动态规划（Dynamic Programming, DP） 是一种求解多阶段决策问题的重要方法。由理查德·贝尔曼在20世纪50年代提出的动态规划思想，不仅为最优控制、强化学习等领域奠定了理论基础，而且在经济学、工程学等众多领域都有着广泛的应用。动态规划的核心思想在于将一个复杂的决策问题分解为一系列子问题，并利用递归思想来求解每个子问题，其基本数学工具便是贝尔曼方程。

贝尔曼方程描述了在最优策略下，每个状态的最优值与其后继状态之间的递归关系，为求解最优控制问题和强化学习中的值函数提供了有效的途径。本文将从动态规划和贝尔曼方程的基本原理出发，系统介绍其数学推导、数值求解方法以及在控制系统和决策问题中的应用。为了使理论内容更加直观，我们还设计了一套基于 Python 与 PyQt6 的交互式 GUI 演示系统，用户可通过界面实时调整参数、观察最优值函数和策略的变化，从而加深对动态规划及贝尔曼方程的理解。

二、动态规划基本原理

2.1 动态规划的思想

动态规划的基本思想是将一个复杂的决策问题分解为若干个阶段，每个阶段都对应一个状态，且每个阶段的最优解可以通过后续阶段的最优解递归得到。设状态空间为 $\mathcal{X}$ ，控制空间为 $\mathcal{U}$ ，目标在于求解如下最优化问题：
$\min_{u(0), u(1), \dots, u(N-1)} \; J = \sum_{k=0}^{N-1} g(x(k), u(k)) + h(x(N)),$
其中 $x (0)$ 为已知初始状态，状态转移满足
$\quad k=0,1,\dots, N-1.$
动态规划方法将问题分解为多个子问题，通过递归求解的方式，从末端向前得到整个问题的最优解。这一过程的核心在于 贝尔曼最优性原理，即每个子问题的最优策略都应当包含后续子问题的最优策略。

2.2 贝尔曼方程

贝尔曼方程是动态规划的数学表达式，其一般形式为：
$\min_{u \in \mathcal{U}} \left\{ g(x, u) + V\big(f(x, u)\big) \right\},$
其中 $V (x)$ 表示在状态 $x$ 下的最优代价函数（或值函数）。在有限时域问题中，终端值函数通常为 $V_N(x) = h(x)$ ，而对于无限时域问题，则可引入折扣因子 $\gamma \in (0,1)$ 得到：
$\min_{u \in \mathcal{U}} \left\{ g(x, u) + \gamma V\big(f(x, u)\big) \right\}.$

贝尔曼方程的关键在于递归关系：一个状态的最优值取决于在该状态下做出的最优决策及后续状态的最优值。利用这一方程，可以通过迭代方法（如值迭代、策略迭代）求解最优值函数和最优策略。

2.3 值迭代与策略迭代

值迭代：通过不断更新值函数 $V (x)$ 的估计值，直到收敛为止。更新公式为：
$V_{k+1}(x) = \min_{u \in \mathcal{U}} \left\{ g(x, u) + \gamma V_k\big(f(x, u)\big) \right\}.$
策略迭代：先固定策略求解值函数，再根据值函数改进策略，交替迭代直到最优策略收敛。其过程可分为策略评估和策略改进两个步骤。

三、贝尔曼方程的数学推导

3.1 最优性原理

贝尔曼最优性原理指出，对于任意最优策略 $\pi^*$ 和任意状态 $x$ ，总有：
$V^*(x) = \min_{u \in \mathcal{U}} \left\{ g(x, u) + V^*\big(f(x, u)\big) \right\}.$
直观地说，最优策略在任一状态下做出的决策都必须保证从当前状态到终端状态的总成本最小。

3.2 离散时间问题中的贝尔曼方程

对于离散时间动态规划问题，设 $N$ 为决策阶段数，终端代价函数为 $h (x)$ 。贝尔曼方程可写为：

终端条件： $V_N(x) = h(x)$ ；
递归关系：
$V_k(x) = \min_{u \in \mathcal{U}} \left\{ g(x, u) + V_{k+1}\big(f(x, u)\big) \right\}, \quad k=0,1,\dots,N-1.$

通过从终端向前递归求解 $V_k(x)$ ，最终可得初始状态下的最优代价 $V_0(x(0))$ 以及对应的最优策略。

3.3 无穷时域折扣动态规划

在无穷时域问题中，为了保证值函数有限，引入折扣因子 $\gamma \in (0,1)$ ，贝尔曼方程写为：
$\min_{u \in \mathcal{U}} \left\{ g(x, u) + \gamma V\big(f(x, u)\big) \right\}.$
这种形式广泛应用于强化学习（如 Q-learning）和最优控制问题中。

四、动态规划在控制与决策中的应用

4.1 最优控制问题

动态规划是求解最优控制问题的理论基石。在连续时间最优控制问题中，贝尔曼方程演化为哈密尔顿-雅可比-贝尔曼（Hamilton–Jacobi–Bellman, HJB）方程，而在离散时间中则采用上述离散贝尔曼方程。利用动态规划方法，可以针对线性和非线性系统设计最优控制律。

4.2 强化学习与最优策略求解

在强化学习中，智能体通过与环境的交互，利用贝尔曼方程更新状态值函数或动作值函数，从而获得最优策略。Q-learning、SARSA 等算法均基于贝尔曼方程的思想，实现对最优策略的在线学习。

4.3 资源分配与调度问题

动态规划方法在资源分配、生产调度、路径规划等决策问题中同样发挥着重要作用。通过将复杂问题分解为一系列子问题，动态规划能够求解全局最优解，为实际工程中的调度问题提供有效方案。

五、数值求解与算法实现

5.1 值迭代算法

值迭代是求解贝尔曼方程最直观的方法，其基本步骤如下：

初始化值函数 $V_0(x)$ （通常取为零或任意初始值）。
对每个状态 $x$ ，更新：
$V_{k+1}(x) = \min_{u \in \mathcal{U}} \left\{ g(x, u) + \gamma V_k\big(f(x, u)\big) \right\}.$
重复迭代直到 $V_k$ 收敛至某一容差范围内。

5.2 策略迭代算法

策略迭代包括策略评估和策略改进两个步骤：

策略评估：固定策略 $\pi$ ，求解值函数 $V^\pi(x)$ 使得
$V^\pi(x) = g(x, \pi(x)) + \gamma V^\pi\big(f(x, \pi(x))\big).$
策略改进：更新策略为
$\pi_{\text{new}}(x) = \arg\min_{u \in \mathcal{U}} \left\{ g(x, u) + \gamma V^\pi\big(f(x, u)\big) \right\}.$
重复上述过程直到策略收敛。

5.3 算法实现中的注意事项

状态空间离散化：在实际数值求解中，连续状态空间常需要离散化，从而构造状态网格。
计算复杂度：动态规划可能面临“维数灾难”，高维问题计算量呈指数级增长。
折扣因子选择：折扣因子 $\gamma$ 的选择直接影响值函数的收敛性和策略的质量。

六、典型案例分析

为了更直观地说明动态规划与贝尔曼方程的应用，下面介绍三个典型案例。

6.1 案例一：最短路径问题

6.1.1 案例描述

最短路径问题是动态规划最经典的应用之一。在一个图中，节点代表状态，边的权重代表转移代价，目标是从起始节点找到一条到达目标节点的最短路径。贝尔曼方程在此问题中的表达为：
$\min_{j \in \text{neighbors}(i)} \{ c(i,j) + V(j) \},$
其中 $c (i, j)$ 为从节点 $i$ 到节点 $j$ 的代价。

6.1.2 分析结论

利用动态规划求解最短路径问题可以确保全局最优性，且算法复杂度较低（如 Dijkstra 算法便是其中一种高效实现）。

6.2 案例二：库存控制问题

6.2.1 案例描述

在库存管理中，需要在满足需求的前提下，最小化库存持有和缺货成本。设库存状态为 $x$ ，订购量为 $u$ ，库存转移方程为
$x (k + 1) = x (k) + u (k) - d (k),$
其中 $d (k)$ 为需求量。目标是通过动态规划确定最优订购策略，使得总成本最小。

6.2.2 分析结论

通过构造贝尔曼方程，可以求得不同库存状态下的最优订购量，从而有效降低库存成本并提高服务水平。

6.3 案例三：机器人路径规划

6.3.1 案例描述

在机器人路径规划中，动态规划被用于求解机器人从起点到终点的最优路径问题。状态为机器人的位置，转移代价可由路径长度或能耗决定。贝尔曼方程为：
$\min_{u \in \mathcal{U}(x)} \{ c(x,u) + V\big(f(x,u)\big) \}.$

6.3.2 分析结论

利用动态规划方法，机器人可实现全局最优路径规划，并在面对障碍和复杂环境时具有较好的鲁棒性。

七、基于 PyQt6 的交互式 GUI 演示

为了帮助工程师和研究者更直观地理解动态规划与贝尔曼方程的数值求解过程，我们设计了一套基于 Python 与 PyQt6 的交互式 GUI 系统。该系统主要功能包括：

参数输入：用户可以通过文本框输入状态空间的离散化参数、奖励函数以及折扣因子等。
算法选择：支持值迭代和策略迭代两种求解方法。
实时仿真：动态绘制值函数随迭代次数的变化曲线和最优策略图示。
交互控制：提供开始、暂停、重置等按钮，用户可以在线调整参数并观察算法收敛过程。
帮助说明：内置帮助按钮，详细解释动态规划与贝尔曼方程的原理、公式推导及算法实现。

7.1 系统架构说明

系统主要分为以下几个模块：

参数输入模块：负责获取初始状态、奖励函数、折扣因子等基本参数。
动态规划模块：基于值迭代或策略迭代算法求解贝尔曼方程，并实时更新值函数。
绘图模块：利用 Matplotlib 动态绘制值函数收敛过程和最优策略示意图。
控制模块：实现开始、暂停、重置等操作，便于用户控制仿真进程。

7.2 Python 代码实现

以下给出基于 PyQt6 的交互式 GUI 系统代码示例，代码中附有详细注释，确保逻辑清晰且易于理解。

"""
动态规划与贝尔曼方程交互式演示系统
本程序基于 PyQt6 实现了一个交互式动态规划系统，
用户可输入状态离散化参数、奖励函数、折扣因子等，
并选择值迭代算法求解贝尔曼方程，实时观察值函数的收敛过程。
作者：控制与优化算法100讲
日期：2025-04-02
"""

import sys
import numpy as np
import matplotlib.pyplot as plt
from matplotlib.backends.backend_qt5agg import FigureCanvasQTAgg as FigureCanvas
from PyQt5.QtWidgets import (
    QApplication, QMainWindow, QWidget, QVBoxLayout, QHBoxLayout,
    QLabel, QPushButton, QLineEdit, QMessageBox, QFormLayout, QTabWidget
)
from PyQt5.QtCore import QTimer

# ------------------------- 动态规划求解（值迭代）函数 -------------------------

def value_iteration(states, actions, transition_prob, reward, gamma, theta=1e-6):
    """
    使用值迭代算法求解贝尔曼方程
    参数：
        states: 状态列表
        actions: 动作列表
        transition_prob: 转移概率字典，格式 {(s, a, s'): probability}
        reward: 奖励函数字典，格式 {(s, a, s'): reward}
        gamma: 折扣因子
        theta: 收敛阈值
    返回：
        V: 值函数字典，格式 {s: value}
        policy: 最优策略字典，格式 {s: optimal_action}
    """
    V = {s: 0 for s in states}
    policy = {s: actions[0] for s in states}

    while True:
        delta = 0
        for s in states:
            v = V[s]
            action_values = {}
            for a in actions:
                action_value = 0
                for s_prime in states:
                    prob = transition_prob.get((s, a, s_prime), 0)
                    r = reward.get((s, a, s_prime), 0)
                    action_value += prob * (r + gamma * V[s_prime])
                action_values[a] = action_value
            V[s] = min(action_values.values())  # 求最小化代价
            delta = max(delta, abs(v - V[s]))
        if delta < theta:
            break

    # 根据最终值函数求最优策略
    for s in states:
        action_values = {}
        for a in actions:
            action_value = 0
            for s_prime in states:
                prob = transition_prob.get((s, a, s_prime), 0)
                r = reward.get((s, a, s_prime), 0)
                action_value += prob * (r + gamma * V[s_prime])
            action_values[a] = action_value
        policy[s] = min(action_values, key=action_values.get)
    return V, policy

# ------------------------- GUI 交互界面实现 -------------------------

class DPWidget(QWidget):
    """
    动态规划与贝尔曼方程交互式界面
    用户可输入状态、动作、转移概率、奖励、折扣因子等参数，
    并采用值迭代求解贝尔曼方程，实时显示值函数收敛曲线
    """
    def __init__(self):
        super().__init__()
        self.initUI()
        self.timer = QTimer(self)
        self.timer.timeout.connect(self.iterate_dp)
        self.simulation_running = False
        self.iteration = 0

    def initUI(self):
        layout = QVBoxLayout()
        title = QLabel("动态规划与贝尔曼方程演示系统
")
        layout.addWidget(title)
        
        # 参数输入区域（此处简化为离散状态和动作）
        form_layout = QFormLayout()
        self.states_edit = QLineEdit("0,1,2,3,4")
        self.actions_edit = QLineEdit("left,right")
        self.gamma_edit = QLineEdit("0.9")
        form_layout.addRow("状态（逗号分隔）:", self.states_edit)
        form_layout.addRow("动作（逗号分隔）:", self.actions_edit)
        form_layout.addRow("折扣因子 gamma:", self.gamma_edit)
        layout.addLayout(form_layout)
        
        # 按钮区域
        btn_layout = QHBoxLayout()
        self.start_btn = QPushButton("开始值迭代")
        self.start_btn.clicked.connect(self.start_dp)
        self.pause_btn = QPushButton("暂停")
        self.pause_btn.clicked.connect(self.pause_dp)
        self.reset_btn = QPushButton("重置")
        self.reset_btn.clicked.connect(self.reset_dp)
        self.help_btn = QPushButton("帮助")
        self.help_btn.clicked.connect(self.show_help)
        btn_layout.addWidget(self.start_btn)
        btn_layout.addWidget(self.pause_btn)
        btn_layout.addWidget(self.reset_btn)
        btn_layout.addWidget(self.help_btn)
        layout.addLayout(btn_layout)
        
        # Matplotlib 绘图区域
        self.figure, self.ax = plt.subplots(figsize=(8, 4))
        self.canvas = FigureCanvas(self.figure)
        layout.addWidget(self.canvas)
        
        self.setLayout(layout)
        self.setStyleSheet("""
            QLabel { font-size: 14px; }
            QLineEdit { padding: 4px; border: 1px solid #ccc; }
            QPushButton { background-color: #007acc; color: white; padding: 5px 10px; border-radius: 4px; }
            QPushButton:hover { background-color: #3399ff; }
        """)
    
    def show_help(self):
        help_text = (
            "【帮助说明】\n\n"
            "1. 在“状态”文本框中输入所有状态，用逗号分隔，例如：0,1,2,3,4\n"
            "2. 在“动作”文本框中输入所有可选动作，用逗号分隔，例如：left,right\n"
            "3. 在“折扣因子 gamma”中输入一个折扣因子（0到1之间），例如：0.9\n"
            "4. 本示例中，转移概率和奖励采用预设值（示例中简单定义），\n"
            "   值迭代算法将计算各状态下的最优值函数，并动态绘制收敛曲线。"
        )
        QMessageBox.information(self, "帮助", help_text)
    
    def start_dp(self):
        try:
            self.states = [int(s.strip()) for s in self.states_edit.text().split(",")]
            self.actions = [a.strip() for a in self.actions_edit.text().split(",")]
            self.gamma = float(self.gamma_edit.text())
        except Exception as e:
            QMessageBox.warning(self, "输入错误", f"参数输入错误：{e}")
            return
        # 构造简单的转移概率与奖励（此处为示例）
        # 假设状态转移为：执行“right”时状态+1，执行“left”时状态-1，边界处不变
        self.transition_prob = {}
        self.reward = {}
        for s in self.states:
            for a in self.actions:
                for s_next in self.states:
                    if a == "right":
                        if s < max(self.states) and s_next == s+1:
                            self.transition_prob[(s, a, s_next)] = 1.0
                            self.reward[(s, a, s_next)] = 1  # 奖励为1
                        elif s == max(self.states) and s_next == s:
                            self.transition_prob[(s, a, s_next)] = 1.0
                            self.reward[(s, a, s_next)] = 0
                    elif a == "left":
                        if s > min(self.states) and s_next == s-1:
                            self.transition_prob[(s, a, s_next)] = 1.0
                            self.reward[(s, a, s_next)] = 1
                        elif s == min(self.states) and s_next == s:
                            self.transition_prob[(s, a, s_next)] = 1.0
                            self.reward[(s, a, s_next)] = 0
        self.V, self.policy = value_iteration(self.states, self.actions, self.transition_prob, self.reward, self.gamma)
        self.iteration = 0
        self.plot_values()
        if not self.simulation_running:
            self.simulation_running = True
            self.timer.start(1000)
    
    def iterate_dp(self):
        # 这里简单模拟多次迭代后值函数变化（实际值迭代已在 start_dp 中收敛）
        self.iteration += 1
        self.V, self.policy = value_iteration(self.states, self.actions, self.transition_prob, self.reward, self.gamma)
        self.plot_values()
        if self.iteration > 10:
            self.pause_dp()
    
    def plot_values(self):
        self.ax.clear()
        states = self.states
        values = [self.V[s] for s in states]
        self.ax.plot(states, values, marker='o')
        self.ax.set_xlabel("状态")
        self.ax.set_ylabel("值函数 V(s)")
        self.ax.set_title(f"值函数收敛（迭代次数: {self.iteration}）")
        self.ax.grid(True)
        self.canvas.draw()
    
    def pause_dp(self):
        self.simulation_running = False
        self.timer.stop()
    
    def reset_dp(self):
        self.pause_dp()
        self.states_edit.setText("")
        self.actions_edit.setText("")
        self.gamma_edit.setText("")
        self.ax.clear()
        self.canvas.draw()

# ------------------------- 主窗口 -------------------------

class DPMainWindow(QMainWindow):
    def __init__(self):
        super().__init__()
        self.setWindowTitle("动态规划与贝尔曼方程交互系统")
        self.setGeometry(100, 100, 900, 600)
        self.initUI()
    
    def initUI(self):
        self.dp_widget = DPWidget()
        self.setCentralWidget(self.dp_widget)

# ------------------------- 主函数 -------------------------

def main():
    app = QApplication(sys.argv)
    window = DPMainWindow()
    window.show()
    sys.exit(app.exec())

if __name__ == "__main__":
    main()

八、结语

本文系统地介绍了动态规划与贝尔曼方程的基本原理和应用。从理论角度，我们阐述了如何利用贝尔曼最优性原理将复杂的多阶段决策问题分解为子问题，并通过值迭代和策略迭代算法求解最优值函数；从应用角度，通过最短路径、库存控制和机器人路径规划等案例，展示了动态规划在实际工程和决策问题中的广泛应用。此外，为了帮助工程师和研究者直观理解这一方法，本文还提供了一套基于 Python 与 PyQt6 的交互式 GUI 演示系统代码示例，用户可在线调节参数，观察值函数的收敛过程和最优策略的变化，从而加深对动态规划及贝尔曼方程的理解。

随着最优控制、强化学习和运筹学的发展，动态规划与贝尔曼方程在现代决策和控制中的作用将越来越重要。希望本文能为广大控制工程师、自动化专家及科研工作者提供有价值的理论指导和实践参考，激发更多对动态规划算法在复杂系统中应用的深入探索与创新。

温馨提示：

本文中所用的模型和示例均为简化版本，实际问题可能需要更精细的状态空间离散化和复杂的奖励设计。

提供的 GUI 演示代码经过初步自查，如在运行过程中遇到问题，请检查 Python 环境和 PyQt6 版本。

欢迎广大读者结合实际工程需求对本文内容进行扩展和优化，共同推动动态规划及贝尔曼方程在各领域中的深入应用。

以上即为本篇关于 动态规划与贝尔曼方程 的完整博客文章。希望本文能帮助您深入理解动态规划的核心原理及贝尔曼方程的数学基础，并在实际工程和决策问题中获得有益启示。

CVPR2024 分割Segmentation相关论文37篇速览木木阳 CVPR2024 Segmentation 分割论文
Paper1MFP:MakingFullUseofProbabilityMapsforInteractiveImageSegmentation摘要小结:最近的交互式分割算法中，将先前的概率图作为网络输入，以帮助当前分割轮次的预测。然而，尽管使用了先前的掩膜，概率图中包含的有用信息并没有很好地传播到当前预测中。在本文中，为了克服这一局限性，我们提出了一种新颖有效的基于点击的交互式图像分割算法MFP，
python内置函数——enumerate() Believer_abby python内置函数 python
说明：emumerate()函数用于将一个可遍历的序列（如列表，元组或字符串）组合为一个索引序列，同时列出数据和数据下标，一般用在for循环中。语法：enumerate(sequence,[start=0])参数：sequence：表示一个序列、迭代器或其他支持迭代的对象；start：下标起始位置，默认为0。使用：seasons=['spring','summer','fall','winter'
【SpringBoot初级篇】JdbcTemplate常用方法李少谦 spring boot 数据库 sql
【SpringBoot初级篇】JdbcTemplate常用方法JdbcTemplate查询JdbcTemplate插入、更新、删除插入单条数据批量插入更新单条数据批量更新删除单条数据批量操作execute执行任意的SQLNamedParameterJdbcTemplate函数场景说明update(Stringsql,@NullableObject…args)增，删，改queryForObject(
【Maven】Maven核心机制的万字深度解析夜雨hiyeyu.com maven java spring spring boot mvc 系统架构后端
Maven核心机制的万字深度解析一、依赖管理机制全解（工业级依赖治理方案）1.坐标体系的本质与设计哲学2.依赖传递与仲裁算法的工程实现**冲突仲裁核心算法**企业级仲裁策略3.Scope作用域的类加载隔离原理4.多级仓库体系架构设计二、构建生命周期底层原理（工业级流水线解析）1.生命周期模型架构2.Default生命周期核心阶段详解3.插件执行机制内核剖析三、企业级工程化实践（千亿级项目的解决方案
【Python基础】07 实战：批量视频压缩的实现智算菩萨 python 服务器开发语言
前言在数字化时代，视频内容已成为信息传播的主要载体。无论是个人用户还是企业，都面临着大量视频文件存储和传输的挑战。视频文件通常体积庞大，占用大量存储空间，同时在网络传输时也会消耗大量带宽。因此，一个高效、易用的视频压缩工具变得尤为重要。本文将详细介绍一个基于Python开发的批量视频压缩工具，该工具结合了现代图形界面设计和强大的FFmpeg视频处理能力，为用户提供了一站式的视频压缩解决方案。通过本
前端领域：jQuery UI组件的使用指南_副本大厂前端小白菜前端开发实战前端 jquery ui ai
前端领域：jQueryUI组件的使用指南关键词：jQueryUI、前端组件、交互效果、用户界面、使用指南摘要：本文旨在为前端开发者提供一份全面的jQueryUI组件使用指南。首先介绍了jQueryUI的背景，包括其目的、适用读者、文档结构和相关术语。接着详细阐述了jQueryUI的核心概念与联系，通过文本示意图和Mermaid流程图展示其架构。然后深入讲解了核心算法原理，并给出具体操作步骤和Pyt
【LeetCode 热题 100】53. 最大子数组和——（解法二）动态规划 xumistore LeetCode leetcode 动态规划算法 java
Problem:53.最大子数组和题目：给你一个整数数组nums，请你找出一个具有最大和的连续子数组（子数组最少包含一个元素），返回其最大和。子数组是数组中的一个连续部分。LeetCode热题100】53.最大子数组和——（解法一）前缀和文章目录整体思路完整代码时空复杂度时间复杂度：O(N)空间复杂度：O(N)整体思路这段代码同样旨在解决“最大子数组和”问题。它采用的是一种非常经典且标准的动态规划
Laravel 阿里云 OSS 视频上传完整方案 phplavarel
一、环境准备1.1安装OSSSDKcomposerrequirealiyuncs/oss-sdk-php1.2环境配置在.env文件中添加：OSS_ACCESS_KEY_ID=你的AccessKeyIdOSS_ACCESS_KEY_SECRET=你的AccessKeySecretOSS_ENDPOINT=oss-cn-hangzhou.aliyuncs.comOSS_BUCKET=你的Bucket
男模Python 函数命名以及鸡兔同笼函数 pythonyuanke python 开发语言
那么问你一个问题，现在是不是所有的函数都是def开头的？如果def就是函数的名字，那么python怎么区分该调用哪一个函数？名字都一样啊那也就是def后面的是函数名字?def后面，括号前面参数列表，这里的参数指的是形式参数，就是括号里面的部分这里只有一个形式参数，所以没有逗号，如果有多个形式参数，那么用逗号分隔参考我们在world.py里面写的几个函数，比如defadd(a,b)你说一下它的名字和
Python 开发规范：pdb & cProfile：调试 & 性能分析写文章的大米 Python 核心技术 python
↑↑↑欢迎点赞、关注、收藏！！！，10年IT行业老鸟，持续分享更多IT干货文章目录pdb&cProfile：调试&性能分析核心内容1、调试和性能分析的必要性2、pdb调试工具3、cProfile性能分析工具pdb&cProfile：调试&性能分析核心内容1、调试和性能分析的必要性在实际生产环境中，代码调试（找问题根因、修复bug）和性能分析（优化效率、减少latency）是开发关键环节。尤其，面对
Prompt Engineering 指南教程班磊闯Andrea
PromptEngineering指南教程Prompt-Engineering-Guidedair-ai/Prompt-Engineering-Guide:是一个用于指导对话人工智能开发的文档。适合用于学习对话人工智能开发和自然语言处理。特点是提供了详细的指南和参考资料，涵盖了多种对话人工智能技术和算法，并且可以自定义学习路径和行为。项目地址:https://gitcode.com/gh_mirr
数据结构：递归：汉诺塔问题（Tower of Hanoi） 95号闪电麦坤数据结构数据结构
目录问题描述第一性原理分析代码实现第一步：明确函数要干什么第二步：写好递归的“结束条件”第三步：写递归步骤递归调用树问题描述有三个柱子（A,B,C），上面有n个大小不等的圆盘，最开始所有圆盘按从大到小顺序堆在柱子A上。目标：将所有圆盘移动到柱子C，移动时要满足：一次只能移动一个盘子；任何时刻小盘子不能压在大盘子上。❓核心问题：如何将n个盘子从A移动到C，同时只用B做辅助，且不违反约束？第一性原理分
数据结构与算法第一章绪论 noruta 408 #数据结构与算法数据结构
1.1.数据结构的基本概念数据：对计算机来说，能被计算机程序识别和处理的符号的集合。（比如二进制0和1）数据元素：数据的基本单位，通常作为一个整体进行考虑和处理。（比如一个学生的信息是一个数据元素）数据项：构成数据元素的最小单位。（学生的学号，姓名，班级构成一个学生信息）要根据实际的业务需求来确定什么是数据元素、什么是数据项。数据结构：相互之间存在一种或多种特定关系的数据元素的集合。比如汉字有左右
电子词典开源项目源代码完全解析
本文还有配套的精品资源，点击获取简介：电子词典作为数字化学习工具，已由传统硬件发展为可定制的开源软件应用。本源代码提供深入理解其工作机制的机会，包括用户界面设计、词典数据库、查询引擎、翻译算法等。源代码通常由主流编程语言编写，涉及到数据结构与算法、UI设计、数据库管理、自然语言处理、本地化与多语言支持、版本控制、软件工程、API接口以及开源社区的协作和交流。1.电子词典工作原理和定制功能电子词典工
Python私有属性：隐藏数据的秘密武器有奇妙能力吗知识分享 Python python 开发语言
Python私有属性详解：为什么我们需要“隐藏”对象的数据？一、引言在面向对象编程中，封装（Encapsulation）是三大基本特性之一（另外两个是继承和多态）。而“私有属性”就是实现封装的重要手段之一。在Python中虽然不像Java或C++那样严格区分访问权限，但依然提供了一种机制来限制对类内部属性的直接访问。本文将带你深入了解：什么是私有属性？如何定义私有属性？私有属性的原理与注意事项使用
Python中filter()函数详解有奇妙能力吗 Python 知识分享 python 开发语言
什么是filter()？filter()是Python内置的一个函数，它的作用是：从一个可迭代对象（如列表、元组等）中筛选出符合条件的元素，生成一个新的迭代器。你可以把它理解成一个“过滤器”：你给它一堆数据和一个筛选条件，它会帮你把符合这个条件的数据挑出来。基本语法filter(函数,可迭代对象)第一个参数是一个函数，它用来判断每个元素是否符合条件。第二个参数是一个可迭代对象，比如列表、元组、字符
Python命名空间：名字管理的秘密
什么是命名空间？你可以把命名空间想象成一个“名字的电话簿”：它记录了你程序中使用的各种名字（变量名、函数名、类名等）和它们对应的内容。比如你写了一个变量x=10，Python就会在某个命名空间里记下：“哦，用户用了x这个名字，它代表的是10。”命名空间的类型（就像不同的电话本）Python中有几种不同作用范围的命名空间，我们可以理解为是不同层级的“电话本”：1.内置命名空间（Built-inNam
大金DAIKIN空调核心技术解析：智能舒适与节能环保的完美融合 langzi78965321 人工智能大数据
引言：空调行业的科技创新引领者在当今空调行业，大金DAIKIN凭借其持续的技术创新和卓越的产品性能，已成为全球暖通空调领域的标杆品牌。本文将深入探讨大金空调的核心技术优势，解析其如何通过创新科技实现舒适性、节能性和智能化的完美平衡。一、VRV技术革命：重新定义中央空调大金VRV（可变制冷剂流量）系统代表了商用空调领域的最新技术高度：精准环境控制：采用先进的PID控制算法，实现±0.5℃的精确温控能
python中的运算符走过.. python 开发语言
目录文章目录前言一、算数运算符1.算数运算符包括+，-，*，/，**，//，%1.1、加减乘除（+，-，*，/）运算符的使用1.2、**是求次方m的n次方1.3、%是求余，m%2可以用来验证奇数偶数0为偶，1为奇数。m%n有n中情况，m%n==0证明m是n的倍数。二、赋值运算符1.赋值运算符有=,+=,-=,*=,/=,//=,**=,%=1.1赋予（=）1.2（+，-，*，/，**，//，%）=
论基于架构的软件设计方法（ABSD）及应用怎么可能-怎么可能架构
2025年3月22日作题目基于架构的软件设计（Architecture-BasedSoftwareDesign,ABSD）方法以构成软件架构的商业、质量和功能需求等要素来驱动整个软件开发过程。ABSD是一个自顶向下，递归细化的软件开发方法，它以软件系统功能的分解为基础，通过选择架构风格实现质量和商业需求，并强调在架构设计过程中使用软件架构模板。采用ABSD方法，设计活动可以从项目总体功能框架明确后
【Python 中的几类运算符】
文章目录文章目录一、算术运算符二、比较运算符三、赋值运算符四、逻辑运算符附加知识：五、其他运算符1.位运算符2.成员运算符3.身份运算符总结一、算术运算符加法（+）：用于两个数值相加。例如，a=5，b=3，a+b的结果为8。也可以用于字符串拼接，如"Hello,"+"World"的结果为"Hello,World"。示例：a=5b=3result=a+bprint("求和",result)a="He
Windows PowerShell中无法将"python"项识别为cmdlet、函数、脚本文件或可运行程序的名称 xqhrs232 ROS系统/Python
原文地址::https://blog.csdn.net/Blateyang/article/details/86421594相关文章1、如何在Powershell中运行python程序?----https://cloud.tencent.com/developer/ask/1426072、Windows下如何方便的运行py脚本----https://blog.csdn.net/Naisu_kun/
Vscode中Python无法将pip/pytest”项识别为 cmdlet、函数、脚本文件或可运行程序的名称
在Python需要pip下载插件时报错，是因为没有把Python安装路径下的Scripts添加到系统的path路径中。如果到了对应路径没发现pip文件，查看是否有pip相关文件，一般会存在pip3命令行使用pip3install后会进行提示更新，按照提示进行更新即可bug2：通过piplist发现其实已经安装pytest但使用pytest--version提示相同错误可通过pipuninstall
Linux软件包管理器命令 lianghu666 Linux命令 linux 服务器 ubuntu
以下是Ubuntu24.04（Debian系）和RedHatEnterpriseLinux9（RedHat系）的软件包管理器命令详解对比表，涵盖核心操作、依赖管理、仓库配置及高级功能：软件包管理器命令对比表（Ubuntu24.04vs.RHEL9）功能Ubuntu24.04(APT/dpkg)RHEL9(DNF/RPM)说明与注意事项核心操作更新软件源sudoaptupdatesudodnfmak
Python中if name == ‘main‘的妙用 el psy congroo Python python
参考：Python中的ifname==‘main’是干嘛的？先运行下面代码：print(__name__)if__name__=="__main__":print(__name__)print("helloworld")print(__name__)当py文件作为主程序直接运行时，__name__无论在哪都是__main__那if__name__=="__main__"有什么用呢?一个py文件也是
Python爬取与可视化-豆瓣电影数据木子空间Pro 项目集锦 #课程设计 python 信息可视化开发语言
引言在数据科学的学习过程中，数据获取与数据可视化是两项重要的技能。本文将展示如何通过Python爬取豆瓣电影Top250的电影数据，并将这些数据存储到数据库中，随后进行数据分析和可视化展示。这个项目涵盖了从数据抓取、存储到数据可视化的整个过程，帮助大家理解数据科学项目的全流程。环境配置与准备工作在开始之前，我们需要确保安装了一些必要的库：urllib：用于发送HTTP请求和获取网页数据Beauti
Java中ThreadPoolExecutor源码深度解析振华少爷 java 开发语言前端
Java中ThreadPoolExecutor源码深度解析目录引言ThreadPoolExecutor的数据结构核心方法分析构造方法execute方法shutdown方法shutdownNow方法性能分析使用注意事项总结引言ThreadPoolExecutor是Java并发包中的一个线程池实现类，它提供了灵活的线程池管理功能，可以根据需要创建、管理和销毁线程。ThreadPoolExecutor通
KANN 是一个独立的轻量级 C 语言库，用于构建和训练中小型人工神经网络，例如多层感知器、卷积神经网络和递归神经网络（包括 LSTM 和 GRU）。它实现了基于图的逆模自动微分，并允许构建具有递归等
一、软件介绍文末提供程序和源码下载KANN是一个独立的轻量级C语言库，用于构建和训练中小型人工神经网络，例如多层感知器、卷积神经网络和递归神经网络（包括LSTM和GRU）。它实现了基于图的逆模自动微分，并允许构建具有递归、共享权重和多个输入/输出/成本的拓扑复杂神经网络。与TensorFlow等主流深度学习框架相比，KANN的可扩展性较低，但它的灵活性接近，代码库要小得多，并且仅依赖于标准C库。与
突破反爬防线：Python3反爬虫原理与绕过策略深度解析程序员威哥爬虫网络 scrapy python 开发语言
在信息化时代，数据已成为互联网的重要资产。为了保护数据的安全和防止恶意抓取，越来越多的网站开始采用反爬虫技术。然而，随着反爬虫技术的不断演化，爬虫开发者面临的挑战也在日益增大。如何理解反爬虫原理并有效绕过这些防护措施，是每个爬虫开发者必须掌握的技能。本文将全面解析Python3在爬虫开发中的应用，深入探讨常见的反爬虫原理，并提供绕过反爬策略的实战经验。通过结合实际案例，帮助开发者掌握应对复杂反爬措
基于Python的携程景点评价爬虫与情感评分分析程序员威哥 python 爬虫开发语言
一、项目背景携程（Ctrip）是中国最流行的旅游预订平台之一，其景点用户评论包含了大量真实的游客反馈。通过分析评论的情感倾向，可以：为用户提供更可靠的景点推荐辅助景区运营方了解用户口碑构建情感评分系统，为评分失衡提供补充二、项目目标自动化抓取携程指定景点的用户评论清洗与分词评论文本对评论进行情感分析打分分析整体情绪趋势并可视化结果三、技术栈与工具模块工具/库数据爬取requests,re,json
Linux的Initrd机制被触发 linux
Linux 的 initrd 技术是一个非常普遍使用的机制，linux2.6 内核的 initrd 的文件格式由原来的文件系统镜像文件转变成了 cpio 格式，变化不仅反映在文件格式上， linux 内核对这两种格式的 initrd 的处理有着截然的不同。本文首先介绍了什么是 initrd 技术，然后分别介绍了 Linux2.4 内核和 2.6 内核的 initrd 的处理流程。最后通过对 Lin
maven本地仓库路径修改 bitcarter maven
默认maven本地仓库路径：C:\Users\Administrator\.m2 修改maven本地仓库路径方法： 1.打开E:\maven\apache-maven-2.2.1\conf\settings.xml 2.找到
XSD和XML中的命名空间 darrenzhu xml xsd schema namespace 命名空间
http://www.360doc.com/content/12/0418/10/9437165_204585479.shtml http://blog.csdn.net/wanghuan203/article/details/9203621 http://blog.csdn.net/wanghuan203/article/details/9204337 http://www.cn
Java 求素数运算周凡杨 java 算法素数
网络上对求素数之解数不胜数，我在此总结归纳一下，同时对一些编码，加以改进，效率有成倍热提高。第一种：原理: 6N(+-)1法任何一个自然数，总可以表示成为如下的形式之一： 6N，6N+1，6N+2，6N+3，6N+4，6N+5 (N=0，1，2，…)
java 单例模式 g21121 java
想必单例模式大家都不会陌生，有如下两种方式来实现单例模式： class Singleton { private static Singleton instance=new Singleton(); private Singleton(){} static Singleton getInstance() { return instance; }
Linux下Mysql源码安装 510888780 mysql
1.假设已经有mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz (1)创建mysql的安装目录及数据库存放目录解压缩下载的源码包，目录结构，特殊指定的目录除外：
32位和64位操作系统墙头上一根草 32位和64位操作系统
32位和64位操作系统是指：CPU一次处理数据的能力是32位还是64位。现在市场上的CPU一般都是64位的，但是这些CPU并不是真正意义上的64 位CPU，里面依然保留了大部分32位的技术，只是进行了部分64位的改进。32位和64位的区别还涉及了内存的寻址方面，32位系统的最大寻址空间是2 的32次方= 4294967296（bit）= 4（GB）左右，而64位系统的最大寻址空间的寻址空间则达到了
我的spring学习笔记10-轻量级_Spring框架 aijuans Spring 3
一、问题提问： → 请简单介绍一下什么是轻量级？轻量级（Leightweight）是相对于一些重量级的容器来说的，比如Spring的核心是一个轻量级的容器，Spring的核心包在文件容量上只有不到1M大小，使用Spring核心包所需要的资源也是很少的，您甚至可以在小型设备中使用Spring。
mongodb 环境搭建及简单CURD antlove Web Install curd NoSQL mongo
一搭建mongodb环境 1. 在mongo官网下载mongodb 2. 在本地创建目录 "D:\Program Files\mongodb-win32-i386-2.6.4\data\db" 3. 运行mongodb服务 [mongod.exe --dbpath "D:\Program Files\mongodb-win32-i386-2.6.4\data\
数据字典和动态视图百合不是茶 oracle 数据字典动态视图系统和对象权限
数据字典（data dictionary）是 Oracle 数据库的一个重要组成部分，这是一组用于记录数据库信息的只读（read-only）表。随着数据库的启动而启动,数据库关闭时数据字典也关闭数据字典中包含数据库中所有方案对象（schema object）的定义(包括表，视图，索引，簇，同义词，序列，过程，函数，包，触发器等等) 数据库为一
多线程编程一般规则 bijian1013 java thread 多线程 java多线程
如果两个工两个以上的线程都修改一个对象，那么把执行修改的方法定义为被同步的，如果对象更新影响到只读方法，那么只读方法也要定义成同步的。不要滥用同步。如果在一个对象内的不同的方法访问的不是同一个数据，就不要将方法设置为synchronized的。
将文件或目录拷贝到另一个Linux系统的命令scp bijian1013 linux unix scp
一.功能说明 scp就是security copy，用于将文件或者目录从一个Linux系统拷贝到另一个Linux系统下。scp传输数据用的是SSH协议，保证了数据传输的安全，其格式如下： scp 远程用户名@IP地址：文件的绝对路径
【持久化框架MyBatis3五】MyBatis3一对多关联查询 bit1129 Mybatis3
以教员和课程为例介绍一对多关联关系，在这里认为一个教员可以叫多门课程，而一门课程只有1个教员教，这种关系在实际中不太常见，通过教员和课程是多对多的关系。示例数据：地址表： CREATE TABLE ADDRESSES ( ADDR_ID INT(11) NOT NULL AUTO_INCREMENT, STREET VAR
cookie状态判断引发的查找问题 bitcarter form cgi
先说一下我们的业务背景： 1.前台将图片和文本通过form表单提交到后台，图片我们都做了base64的编码，并且前台图片进行了压缩 2.form中action是一个cgi服务 3.后台cgi服务同时供PC，H5，APP 4.后台cgi中调用公共的cookie状态判断方法（公共的，大家都用，几年了没有问题）问题：（折腾两天。。。。） 1.PC端cgi服务正常调用，cookie判断没
通过Nginx,Tomcat访问日志(access log)记录请求耗时 ronin47
一、Nginx通过$upstream_response_time $request_time统计请求和后台服务响应时间 nginx.conf使用配置方式： log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_r
java-67- n个骰子的点数。把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 bylijinnan java
public class ProbabilityOfDice { /** * Q67 n个骰子的点数 * 把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 * 在以下求解过程中，我们把骰子看作是有序的。 * 例如当n=2时，我们认为（1，2）和（2，1）是两种不同的情况 */ private stati
看别人的博客，觉得心情很好 Cb123456 博客心情
以为写博客，就是总结，就和日记一样吧，同时也在督促自己。今天看了好长时间博客: 职业规划: http://www.iteye.com/blogs/subjects/zhiyeguihua android学习: 1.http://byandby.i
[JWFD开源工作流]尝试用原生代码引擎实现循环反馈拓扑分析 comsci 工作流
我们已经不满足于仅仅跳跃一次，通过对引擎的升级，今天我测试了一下循环反馈模式，大概跑了200圈，引擎报一个溢出错误在一个流程图的结束节点中嵌入一段方程，每次引擎运行到这个节点的时候，通过实时编译器GM模块，计算这个方程，计算结果与预设值进行比较，符合条件则跳跃到开始节点，继续新一轮拓扑分析，直到遇到
JS常用的事件及方法 cwqcwqmax9 js
事件描述 onactivate 当对象设置为活动元素时触发。 onafterupdate 当成功更新数据源对象中的关联对象后在数据绑定对象上触发。 onbeforeactivate 对象要被设置为当前元素前立即触发。 onbeforecut 当选中区从文档中删除之前在源对象触发。 onbeforedeactivate 在 activeElement 从当前对象变为父文档其它对象之前立即
正则表达式验证日期格式 dashuaifu 正则表达式 IT其它 java其它
正则表达式验证日期格式 function isDate(d){ var v = d.match(/^(\d{4})-(\d{1,2})-(\d{1,2})$/i); if(!v) { this.focus(); return false; } } <input value="2000-8-8" onblu
Yii CModel.rules() 方法、validate预定义完整列表、以及说说验证 dcj3sjt126com yii
public array rules () {return} array 要调用 validate() 时应用的有效性规则。返回属性的有效性规则。声明验证规则，应重写此方法。每个规则是数组具有以下结构：array('attribute list', 'validator name', 'on'=>'scenario name', ...validation
UITextAttributeTextColor = deprecated in iOS 7.0 dcj3sjt126com ios
In this lesson we used the key "UITextAttributeTextColor" to change the color of the UINavigationBar appearance to white. This prompts a warning "first deprecated in iOS 7.0." Ins
判断一个数是质数的几种方法 EmmaZhao Math python
质数也叫素数，是只能被1和它本身整除的正整数，最小的质数是2，目前发现的最大的质数是p=2^57885161-1【注1】。判断一个数是质数的最简单的方法如下： def isPrime1(n): for i in range(2, n): if n % i == 0: return False return True 但是在上面的方法中有一些冗余的计算，所以
SpringSecurity工作原理小解读坏我一锅粥 SpringSecurity
SecurityContextPersistenceFilter ConcurrentSessionFilter WebAsyncManagerIntegrationFilter HeaderWriterFilter CsrfFilter LogoutFilter Use
JS实现自适应宽度的Tag切换 ini JavaScript html Web css html5
效果体验：http://hovertree.com/texiao/js/3.htm 该效果使用纯JavaScript代码，实现TAB页切换效果，TAB标签根据内容自适应宽度，点击TAB标签切换内容页。 HTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"
Hbase Rest API : 数据查询 kane_xie REST hbase
hbase（hadoop）是用java编写的，有些语言（例如python）能够对它提供良好的支持，但也有很多语言使用起来并不是那么方便，比如c#只能通过thrift访问。Rest就能很好的解决这个问题。Hbase的org.apache.hadoop.hbase.rest包提供了rest接口，它内嵌了jetty作为servlet容器。启动命令：./bin/hbase rest s
JQuery实现鼠标拖动元素移动位置（源码+注释）明子健 jquery js 源码拖动鼠标
欢迎讨论指正！ print.html代码： <!DOCTYPE html> <html> <head> <meta http-equiv=Content-Type content="text/html;charset=utf-8"> <title>发票打印</title> &l
Postgresql 连表更新字段语法 update qifeifei PostgreSQL
下面这段sql本来目的是想更新条件下的数据，可是这段sql却更新了整个表的数据。sql如下： UPDATE tops_visa.visa_order SET op_audit_abort_pass_date = now() FROM tops_visa.visa_order as t1 INNER JOIN tops_visa.visa_visitor as t2 ON t1.
将redis,memcache结合使用的方案? tcrct redis cache
公司架构上使用了阿里云的服务，由于阿里的kvstore收费相当高，打算自建，自建后就需要自己维护，所以就有了一个想法，针对kvstore(redis)及ocs(memcache)的特点，想自己开发一个cache层，将需要用到list，set，map等redis方法的继续使用redis来完成，将整条记录放在memcache下，即findbyid，save等时就memcache，其它就对应使用redi
开发中遇到的诡异的bug wudixiaotie bug
今天我们服务器组遇到个问题：我们的服务是从Kafka里面取出数据，然后把offset存储到ssdb中，每个topic和partition都对应ssdb中不同的key，服务启动之后，每次kafka数据更新我们这边收到消息，然后存储之后就发现ssdb的值偶尔是-2,这就奇怪了，最开始我们是在代码中打印存储的日志，发现没什么问题，后来去查看ssdb的日志，才发现里面每次set的时候都会对同一个key

动态规划与贝尔曼方程 —— 理论、案例与交互式 GUI 实现

目录

动态规划与贝尔曼方程 —— 理论、案例与交互式 GUI 实现

一、引言

二、动态规划基本原理

2.1 动态规划的思想

2.2 贝尔曼方程

2.3 值迭代与策略迭代

三、贝尔曼方程的数学推导

3.1 最优性原理

3.2 离散时间问题中的贝尔曼方程

3.3 无穷时域折扣动态规划

四、动态规划在控制与决策中的应用

4.1 最优控制问题

4.2 强化学习与最优策略求解

4.3 资源分配与调度问题

五、数值求解与算法实现

5.1 值迭代算法

5.2 策略迭代算法

5.3 算法实现中的注意事项

六、典型案例分析

6.1 案例一：最短路径问题

6.1.1 案例描述

6.1.2 分析结论

6.2 案例二：库存控制问题

6.2.1 案例描述

6.2.2 分析结论

6.3 案例三：机器人路径规划

6.3.1 案例描述

6.3.2 分析结论

七、基于 PyQt6 的交互式 GUI 演示

7.1 系统架构说明

7.2 Python 代码实现

动态规划与贝尔曼方程演示系统

八、结语

你可能感兴趣的:(python,动态规划,算法,PyQt6,递归,贝尔曼,运筹学,DP)