松间沙路hba

基于强化学习的制造调度智能优化决策

获取更多资讯，赶快关注上面的公众号吧！

文章目录

调度状态和动作设计
- 调度状态的设计
- 调度动作的设计
基于RL的调度算法
- 基于值函数的RL调度算法
- - SARSA
  - Q-learning
  - DQN
- 基于策略的RL调度算法
基于RL的调度应用
- 基于RL的单机调度
- 基于RL的并行机调度
- 基于RL的流水车间调度
- 基于RL的作业车间调度
- 基于RL的其他调度
RL与元启发式算法在调度中的集成应用
讨论
- 问题领域
- 算法领域
- 应用领域
参考文献

生产调度作为制造系统的关键组成部分，其目的是通过合理确定加工路径、机器分配、执行时间等主要因素，实现利润、效率、能耗等目标的优化。由于生产调度问题的大规模、强耦合约束以及特定场景下的实时求解要求，使得生产调度问题的求解面临着巨大的挑战。随着机器学习的发展，强化学习（RL）在各种决策问题上取得了突破性进展。针对制造调度问题，本文总结了状态和动作的设计，梳理了基于强化学习的调度算法，整理了强化学习在不同类型调度问题中的应用，并讨论了强化学习与元启发式算法的融合模式，旨在为强化学习研究者或生产调度实践者提供一些参考。

调度状态和动作设计

与监督学习不同，RL允许代理或智能体通过与环境的试错交互来学习最佳行为，而无需标签数据，以最大化奖励。图1说明了在RL的框架中代理和环境之间的交互。具体地说，在时间t，代理从环境感知状态信号 $s_t$ 并且在时间 $t$ 执行动作 $a_t$ ，从而获得奖励信号 $r_{t+1}$ ，此时环境转移至新的状态 $s_{t+1}$ 。然后，代理根据 $r_{t+1}$ 更新策略，并在状态 $s_{t+1}$ 下的动作 $a_{t+1}$ ，以获得奖励信号 $r_{t+2}$ 。通过与环境的交互，Agent在试错过程中学习决策策略。最后，智能体可以根据状态s下的策略选择适当的动作，以最大化累积奖励。

调度状态的设计

调度问题的状态设计一般可以分为3种：

（1）将生产信息或相关统计信息作为状态，包括加工信息、加工环境信息、订单信息等，该方法可以有效地减少信息的丢失。然而，生产信息通常是连续的数据，如工序的松弛率、机床的利用率等都是连续数值，问题规模的增加会带来维数灾难，因此通常使用神经网络来近似值函数和策略函数。

主要研究成果如下：

文献	场景	状态
Wang and Pan[1]	置换流水车间调度	工件在每台机器上的加工时间
Wang et al.[2]	动态作业车间调度	工序加工时间、工件加工状态、机器选择
Qu et al.[3]	流水车间调度	缓冲区大小、工站运行状况、员工状况
Luo et al.[4]	动态多目标柔性作业车间调度	机器数量、机器平均利用率、交货期松弛等

（2）根据生产信息之间的数量关系或生产信息的统计定义状态。这样可以避免问题规模增大带来的更大状态空间的挑战，但会导致问题信息的丢失。

主要研究成果如下：

文献	场景	状态
Wang and Usher[5]	动态单机调度	根据缓冲区中工件数量的情况和总延迟的估计来定义状态
Wang et al.[6]	考虑退化的单机调度	根据平均正常加工时间与剩余工件平均延迟估计之间的定量关系划分状态空间
Zhao et al.[7]	作业车间调度	通过比较估计的平均松弛时间和估计的平均剩余时间来定义六种状态

（3）将调度问题转化为图，根据图中节点和边的情况定义状态。该方法很好地考虑了问题的结构特征，高效地表示了生产环境。同时，通常采用图神经网络（GNN）、卷积神经网络（CNN）、图卷积网络（GCN）等网络来有效地提取问题特征。

主要研究成果如下：

文献	场景	状态
Zhang et al.[8]	作业车间调度	析取图模型
Han and Yang[9]	自适应作业车间调度	多通道图像
Hu et al.[10]	柔性制造系统动态调度	Petri网
Chen et al.[74]	作业车间调度	析取图嵌入
Song et al.[73]	柔性作业车间调度	析取图+图神经网络

总之，状态设计的方式有很多种。优秀的状态设计需要平衡信息损失和状态空间的大小。同时，还应考虑调度问题的特点和优化目标。

调度动作的设计

调度问题的动作设计也可以分为3类：

（1）选择启发式作为动作。通过这种方式，可以协同使用启发式，并且动作的数量是恒定的，与问题的大小无关。然而，该算法的性能取决于所选择的启发式的效率和质量。

主要研究成果如下：

文献	场景	动作
Lin et al.[11]	智能制造工厂	MOR、FIFO、LPT等
Yang et al.[12]	置换流水车间动态调度	SPTLPT等
Luo[13]	考虑工件插入的柔性作业车间动态调度	6种复合规则

（2）以作业顺序等调度解作为动作。该方法主要用于解决端到端的静态调度问题。通过这种方式，代理可以快速构建调度解。

主要研究成果如下：

文献	场景	动作
Wang and Pan[1]	置换流水车间调度	使用加工信息直接输出调度序列
Kintsakis et al.[14]	工作流管理系统	通过序列到序列直接生成调度解

（3）根据问题特征定义调度算子作为动作。代理学习选择合适的算子，例如决定机器分配、调整作业顺序等，以生成新的解。这种方法应该对问题有很好的理解，以避免产生不可行解。

文献	场景	动作
Li et al.[15]	单机在线调度	选择未加工的工件
Williem and Setiawan[16]	作业车间调度问题	重分派和任务移动
Arviv et al.[17]	考虑机器人搬运的流水车间调度	工件搬运
Park et al.[18]	半导体制造	选择未加工的工件

可见，动作设计的方法多种多样，一般需要考虑问题的属性，以生成合适的动作形式和数量。

基于RL的调度算法

根据环境模型的使用，RL可以分为两类，即无模型强化学习和基于模型的强化学习。基于模型的强化学习依赖于环境模型，其中包含状态转换和奖励预测。虽然基于模型的强化学习的代理可以直接获得新的状态和奖励，但很难获得生产调度问题的状态转移信息。与基于模型的强化学习不同，无模型强化学习依赖于代理与环境之间的实时交互，而不需要状态转换信息。现有的基于RL的生产调度优化算法大多是无模型RL算法，又可分为基于值函数的RL和基于策略的RL。

基于值函数的RL调度算法

基于值函数的强化学习通过选择具有最大状态-动作值的动作来构造最优策略。显然，价值函数的构造和计算是基于值函数的强化学习的核心。这种强化学习具有较高的样本利用率，但容易过拟合，泛化能力差。基于值函数的强化学习在生产调度优化中的代表性算法包括SARSA、Q学习和DQN。

SARSA

SARSA是一种在策略的时间差分（TD）算法。在迭代学习过程中，代理采用ε-贪婪方法在状态 $s_t$ 下选择 $a_t$ ，获得奖励 $r_{t+1}$ 。然后，环境转移至新状态 $s_{t+1}$ 。对于新状态，代理通过使用ε-贪婪方法继续选择 $a_{t+1}$ ，并根据下式更新值函数 $q(s_t,a_t)$ ：
$q\left(s_t, a_t\right)=q\left(s_t, a_t\right)+\alpha \times\left(r_{t+1}+\gamma \times q\left(s_{t+1}, a_{t+1}\right)-q\left(s_t, a_t\right)\right)\tag{1}$
其中 $\alpha$ 为学习率， $\gamma$ 为折扣因子。

使用该算法的主要成果如下：

文献	场景	算法
Palombarini et al.[19]	油漆制造厂	SARSA
Chen et al.[20]	柔性作业车间调度	GA+SARSA+Q-learning
Orhean et al.[21]	异构分布式系统	SARSA
Aissani et al.[22]	动态多产地调度问题	SARSA

Q-learning

与SARSA不同，Q学习是一种离策略的TD算法。其值函数q(s_t,a_t)更新如下：
$q\left(s_t, a_t\right)=q\left(s_t, a_t\right)+\alpha \times\left(r_{t+1}+\gamma \times \max _a q\left(s_{t+1}, a\right)-q\left(s_t, a_t\right)\right)\tag{2}$

使用该算法的主要成果如下：

文献	场景	算法
Bouazza et al.[23]	柔性作业车间调度	Q-learning
Wang[24]	动态作业车间调度	weighted Q-learning
Stricker et al.[25]	半导体制造	Q-learning
Wang and Yan[26]	知识化制造	Q-learning
Wang et al.[27]	航空发动机装配调度	double-layer Q-learning

DQN

SARSA和Q-learning都采用一个表来记录状态-动作值，但当状态空间或动作空间的规模过大时，该表不再适用。因此，通过集成Q-learning和深度神经网络来逼近值函数，提出了深度Q学习网络DQN。DQN采用经验重放和目标网络来克服算法的不稳定性。

使用该算法的主要成果如下：

文献	场景	算法
Waschneck et al.[28]	半导体制造	DQN
Hu et al.[29]	柔性作业车间	DQN
Palombarini and Martínez[30]	闭环重调度	DQN

在三种基于值的强化学习算法中，Q-learning算法具有贪婪性，容易陷入局部最优。SARSA算法相对保守，但ε-贪婪算法需要控制搜索速率以保证收敛性。DQN适合于求解大规模问题，但DQN的采样效率低，且对参数设置有很强的依赖性。

基于策略的RL调度算法

与基于值函数的强化学习不同，基于策略的强化学习不考虑值函数，而是直接搜索最佳策略。此外，基于策略的强化学习通常采用神经网络来拟合策略函数。这类算法都有自己的探索机制，但样本利用率低，容易产生方差较大的局部最优解。典型的算法包括REINFORCE、PPO、TRPO、Actor-Critic等。

基于策略RL的调度成果如下：

文献	场景	算法
Wang and Pan[1]	置换流水车间调度	pointer network+REINFORCE
Rummukainen and Nurminen[31]	随机经济批调度	PPO
Zhang et al.[8]	作业车间调度	GNN+PPO
Kuhnle et al.[32]	半导体制造	TRPO
Liu et al.[33]	作业车间调度	DDPG
Hubbs et al.[34]	化工生产调度	advantage actor-critic
Chen and Tian[35]	在线作业调度	actor-critic

基于RL的调度应用

关于强化学习在不同类型的调度问题中的应用，主要集中在车间作业、流水车间、并行机、单机调度问题。

基于RL的单机调度

单机调度的约束条件相对简单，只需要确定工件的加工顺序。目前，强化学习主要用于解决随机、动态或在线条件下的单机调度问题。主要成果如下：

文献	场景	算法
Wang et al.[36]	面向库存的单机生产系统	two RL-based methods
Xie et al.[37]	在线单机调度	Q-learning
Wang et al.[38]	动态单机调度	Q-learning
Yang et al.[39]	带退化过程的多状态单机生产调度	heuristic RL
Yang et al.[40]	多状态生产系统中的生产调度和预防性维护	model-free RL
Wang and Usher[41]	单机调度	Q-learning

基于RL的并行机调度

与单机调度相比，并行机调度需要考虑机器分配问题。代理的状态和动作的设计也更加复杂。基于RL的并行机调度优化算法主要是针对动态调度问题而设计的。主要成果如下：

文献	场景	算法
Zhang et al.[42]	考虑机器作业条件和顺序相关准备时间的动态并行机调度	Q-learning
Zhou et al.[43]	智慧制造动态调度	deep RL
Zhang et al.[44]	工件动态到达的并行机调度	R-learning
Zhang et al.[45]	非等效并行机调度	on-line R-learning with function approximation

基于RL的流水车间调度

流水车间调度需要考虑多个阶段的加工。为了实现柔性制造，在某些阶段存在多台并行机，即混合或柔性流水车间调度。显然，它比并行机调度要复杂得多。主要成果如下：

文献	场景	算法
Zhang and Ye[15]	置换流水车间调度	Q-learning
Xiao et al.[46]	非置换流水车间调度	deep temporal difference RL
Zhang et al.[47]	非置换流水车间调度	on-line TD (λ)
Han et al.[48]	混合流水车间调度	Q-learning
Fonseca-Reyna and Martínez-Jiménez[49]	具有顺序相关准备时间的流水作业调度	improved Q-learning
Zhao et al.[50]	分布式装配无空闲流水车间调度	a cooperative water wave algorithm with RL

基于RL的作业车间调度

与上述三种调度问题相比，作业车间调度需要考虑工件的不同机器加工路线。对于柔性作业车间调度，还应考虑机器分配。因此，调度算法的设计更为复杂。主要成果如下：

文献	场景	算法
Gabel and Riedmilier[51]	反应式作业车间调度	Q-learning
Martínez et al.[52]	柔性作业车间调度	Q-learning
Kardos et al.[53]	动态柔性作业车间调度	Q-learning
Luo et al.[54]	工件随机到达的作业车间调度	double loop deep Q-network
Zhao et al.[7]	作业车间调度	improved Q-learning
Luo[13]	带有新工件插入的柔性车间调度	deep Q-network
Shahrabi et al.[55]	工件随机到达和机器故障的动态车间调度	RL-based variable neighborhood search
Csáji et al.[56]	考虑机器故障、新机器到达、作业取消和新作业到达的分布式生产系统	triple-level learning mechanism
Wang et al.[57]	不确定装配作业车间调度	dual Q-learning

基于RL的其他调度

强化学习也被应用于一些其他类型的调度问题，如分布式调度，能源效率调度和多目标调度。此外，RL在几个真实的生产场景中取得了进展，例如边缘计算任务调度和农业灌溉调度。主要成果如下：

文献	场景	算法
Aissani et al.[22]	多产地调度	multi-agent method based on RL
Zhou et al.[58]	分布式系统	online RL
Wang et al.[59]	能量效率调度	deep RL
model
He et al.[60]	机械加工车间	improved Q-learning
Hong and Prabhu[61]	具有准时制约束的动态多目标作业车间调度	Q-learning
Kuhnle et al.[32]	多目标半导体调度	Q-learning
Zhou et al.[62]	不确定多目标调度	DQN
Yuan et al.[63]	异构云环境下的多目标调度	Q-learning
Zhan et al.[64]	车辆边缘计算中的卸载调度	PPO
Yang et al.[65]	灌溉调度	deep RL
Mortazavi et al.[66]	供应链订购管理系统	Q-learning

RL与元启发式算法在调度中的集成应用

强化学习在调度中的应用是非常有前途的，仍然需要讨论和研究。近几十年来，计算智能作为人工智能的一个重要分支，特别是元启发式算法，在生产调度方面取得了很大的进展。然而，单一搜索模式的元启发式算法难以有效和高效地处理复杂的调度问题，如分布式调度和绿色调度。有必要引入学习机制等多种机制来辅助元启发式算法提高搜索效率。因此，RL和元启发式的集成是一个很有前途的方式来提高算法的性能。RL和元启发式的集成模式主要有3种：

（1）RL和元启发式算法被视为两个阶段的算法。这是一个简单而容易的方法，联合RL和元启发式的优点，以提高解的质量。对于流水车间调度问题，Wang和Pan[1]提出了一种新的网络来建模问题，并通过RL进行训练。在网络输出解后，采用迭代贪婪算法对结果进行改进。
（2）RL用于指导元启发式算法的参数选择。通过与环境的交互，RL可以学习参数设置的知识。元启发式算法可以利用训练好的代理的引导实现自适应调整。

文献	场景	算法
Shahrabi et al.[55]	动态作业车间调度	Q-learning+VNS
Xing and Liu[67]	连续函数	Q-learning+PSO

（3）采用强化学习来指导元启发式算法的搜索。这样，RL和超启发式的优点，可以用来实现搜索策略的自适应选择和搜索方向的自适应调整。

文献	场景	算法
Wang and Wang[68]	分布式混合流水车间调度	memetic algorithm+RL
Li et al.[69]	任务调度	GA+Q-learning
Alicastro et al.[70]	增材制造调度	local search+RL
Zhao et al.[50]	流水车间调度	water wave algorithm+Q-learning
Gu et al.[71]	动态作业车间调度	salp swarm algorithm+DQN
Karimi-Mamaghan et al.[72]	置换流水车间调度	iterated greedy algorithm+Q-learning

综上所述，已有的研究表明，强化学习和元启发式的结合可以有效地提高算法的性能。

讨论

生产调度是制造系统的核心问题，鉴于大规模和实时性的要求，现有的调度算法面临着巨大的挑战。随着人工智能的发展，强化学习在许多组合优化问题上取得了突破性进展，为调度优化提供了新的途径。本文对强化学习在生产调度中的应用进行了综述，为强化学习智能优化生产调度提供了指导。从已有的基于RL的调度研究来看，RL算法在求解车间调度问题，特别是动态调度问题时具有方便、快速等独特的优势。然而，相关研究仍处于起步阶段，在问题、算法和应用领域仍有待进一步探索。

问题领域

现有的工作主要集中在RL来解决单目标调度问题。同时，关于多目标优化问题的研究很少，主要考虑经济性和时间性指标。

另外，目前关于强化学习在生产调度问题中的应用大多是简化的、传统的。同时，许多现实生活中的约束，如无空闲，无等待，顺序相关的准备时间，和机器退化的影响，都应考虑。研究RL算法在求解具有复杂工艺约束的生产调度问题中具有重要的实用价值。

算法领域

目前，已有的强化学习算法缺乏对调度问题的理论分析和支持。此外，缺乏系统的方法来指导状态和动作的设计，也不利于RL在解决生产调度问题中的推广和应用。

目前，基于策略的强化学习算法很少用于生产调度问题，它能够以端到端的方式搜索最优策略并生成调度，能够有效克服实时场景的挑战。因此，研究基于策略的强化学习算法，如PPO、TRPO等，以端到端的方式解决生产调度问题，实现调度规则的自适应生成具有重要意义。

考虑到与元启发式算法的协同性，对协作强化学习的研究相对较少。探索强化学习与元启发式算法的有效融合机制是一个很有前途的研究方向。通过充分发挥强化学习的优势，确定搜索方向和搜索步长，自适应地调整搜索操作和参数设置，以期发现关联知识，提高搜索效率。

应用领域

目前，强化学习在调度问题上的研究大多停留在学术层面。相关理论和方法只是通过仿真进行测试和分析，缺乏实际问题的应用。因此，有必要加强对实际问题的理解和提炼，强调问题建模、算法设计，推动RL算法在求解车间调度中的应用。

总之，基于强化学习的生产调度优化研究是一个很有前途的研究方向，但仍有许多地方需要改进和探索。随着强化学习技术的发展，其理论、方法和应用研究必将得到全面的发展和提高。

参考文献

[1] L. Wang and Z. X. Pan, Scheduling optimization for flowshop based on deep reinforcement learning and iterative greedy method, (in Chinese), Control and Decision, vol. 36, no. 11, pp. 2609–2617, 2021.

[2] L. B. Wang, X. Hu, Y. Wang, S. J. Xu, S. J. Ma, K. X. Yang, Z. J. Liu, and W. D. Wang, Dynamic job-shop scheduling in smart manufacturing using deep reinforcement learning, Comput. Netw., vol. 190, p. 107969, 2021.

[3] S. H. Qu, J. Wang, S. Govil, and J. O. Leckie, Optimized adaptive scheduling of a manufacturing process system with multi-skill workforce and multiple machine types: An ontology-based, multi-agent reinforcement learning approach, Procedia Cirp, vol. 57, pp. 55–60, 2016.

[4] S. Luo, L. X. Zhang, and Y. S. Fan, Dynamic multiobjective scheduling for flexible job shop by deep reinforcement learning, Comput. Ind. Eng., vol. 159, p. 107489, 2021.

[5] Y. C. Wang and J. M. Usher, Application of reinforcement learning for agent-based production scheduling, Eng. Appl. Artif. Intell., vol. 18, no. 1, pp. 73–82, 2005.

[6] H. F. Wang, Q. Yan, and S. Z. Zhang, Integrated scheduling and flexible maintenance in deteriorating multi-state single machine system using a reinforcement learning approach, Adv. Eng. Inform., vol. 49, p. 101339, 2021.

[7] Y. J. Zhao, Y. H. Wang, J. Zhang, and H. X. Yu, Application of improved Q learning algorithm in job shop scheduling problem, (in Chinese), Journal of System Simulation, https://kns.cnki.net/kcms/detail/11.3092.V. 20210423.1823.002.html, 2021.

[8] C. Zhang, W. Song, Z. G. Cao, J. Zhang, P. S. Tan, and C. Xu, Learning to dispatch for job shop scheduling via deep reinforcement learning, arXiv preprint arXiv: 2010.12367, 2020.

[9] B. A. Han and J. J. Yang, Research on adaptive job shop scheduling problems based on dueling double DQN, IEEE Access, vol. 8, pp. 186474–186495, 2020.

[10] L. Hu, Z. Y. Liu, W. F. Hu, Y. Y. Wang, J. R. Tan, and F. Wu, Petri-net-based dynamic scheduling of flexible manufacturing system via deep reinforcement learning with graph convolutional network, J. Manuf. Syst., vol. 55, pp. 1–14, 2020.

[11] C. C. Lin, D. J. Deng, Y. L. Chih, and H. T. Chiu, Smart manufacturing scheduling with edge computing using multiclass deep Q network, IEEE Trans. Ind. Inform., vol. 15, no. 7, pp. 4276–4284, 2019.

[12] S. L. Yang, Z. G. Xu, and J. Y. Wang, Intelligent decisionmaking of scheduling for dynamic permutation flowshop via deep reinforcement learning, Sensors, vol. 21, no. 3, p. 1019, 2021.

[13] S. Luo, Dynamic scheduling for flexible job shop with new job insertions by deep reinforcement learning, Appl.Soft Comput., vol. 91, p. 106208, 2020.

[14] A. M. Kintsakis, F. E. Psomopoulos, and P. A. Mitkas, Reinforcement learning based scheduling in a workflow management system, Eng. Appl. Artif. Intell., vol. 81,pp. 94–106, 2019.

[15] Y. Y. Li, E. Fadda, D. Manerba, R. Tadei, and O. Terzo, Reinforcement learning algorithms for online singlemachine scheduling, in Proc. 2020 Federated Conf. Computer Science and Information Systems, Sofia, Bulgaria, 2020, pp. 277–283.

[16] R. S. Williem and K. Setiawan, Reinforcement learning combined with radial basis function neural network to solve Job-Shop scheduling problem, in Proc. 2011 IEEE Int. Summer Conference of Asia Pacific Business Innovation and Technology Management, Dalian, China, 2011, pp. 29–32.

[17] K. Arviv, H. Stern, and Y. Edan, Collaborative reinforcement learning for a two-robot job transfer flowshop scheduling problem, Int. J. Prod. Res., vol. 54, no. 4, pp. 1196–1209, 2016.

[18] I. B. Park, J. Huh, J. Kim, and J. Park, A reinforcement learning approach to robust scheduling of semiconductor manufacturing facilities, IEEE Trans. Automat. Sci. Eng., vol. 17, no. 3, pp. 1420–1431, 2020.

[19] J. Palombarini, J. C. Barsce, and E. Martinez, Generating rescheduling knowledge using reinforcement learning in a cognitive architecture, arXiv preprint arXiv: 1805.04752,2018.

[20] R. H. Chen, B. Yang, S. Li, and S. L. Wang, A self learning genetic algorithm based on reinforcement learning for flexible job-shop scheduling problem, Comput. Ind. Eng., vol. 149, p. 106778, 2020.

[21] A. I. Orhean, F. Pop, and I. Raicu, New scheduling approach using reinforcement learning for heterogeneous distributed systems, J. Parallel Distrib. Comput., vol. 117, pp. 292–302, 2018.

[22] N. Aissani, A. Bekrar, D. Trentesaux, and B. Beldjilali, Dynamic scheduling for multi-site companies: A decisional approach based on reinforcement multi-agent learning, J. Intell. Manuf., vol. 23, no. 6, pp. 2513–2529, 2012.

[23] W. Bouazza, Y. Sallez, and B. Beldjilali, A distributed approach solving partially flexible job-shop scheduling problem with a Q-learning effect, IFAC-Papers OnLine, vol. 50, no. 1, pp. 15890–15895, 2017.

[24] Y. F. Wang, Adaptive job shop scheduling strategy based on weighted Q-learning algorithm, J. Intell. Manuf., vol. 31, no. 2, pp. 417–432, 2020.

[25] N. Stricker, A. Kuhnle, R. Sturm, and S. Friess, Reinforcement learning for adaptive order dispatching in the semiconductor industry, CIRP Annals, vol. 67, no. 1,pp. 511–514, 2018.

[26] H. X. Wang and H. S. Yan, An interoperable adaptive scheduling strategy for knowledgeable manufacturing based on SMGWQ-learning, J. Intell. Manuf., vol. 27, no. 5, pp. 1085–1095, 2016.

[27] H. X. Wang, H. S. Yan, and Z. Wang, Adaptive assembly scheduling of aero-engine based on double-layer Qlearning in knowledge manufacturing, (in Chinese), Computer Integrated Manufacturing Systems, vol. 20, no. 12, pp. 3000–3010, 2014.

[28] B. Waschneck, A. Reichstaller, L. Belzner, T. Altenmüller, T. Bauernhansl, A. Knapp, and A. Kyek, Optimization of global production scheduling with deep reinforcement learning, Procedia CIRP, vol. 72, pp. 1264–1269, 2018.

[29] H. Hu, X. L. Jia, Q. X. He, S. F. Fu, and K. Liu, Deep reinforcement learning based AGVs real-time scheduling with mixed rule for flexible shop floor in industry 4.0, Comput. Ind. Eng., vol. 149, p. 106749, 2020.

[30] J. A. Palombarini and E. C. Martínez, Closed-loop rescheduling using deep reinforcement learning, IFACPapersOnLine, vol. 52, no. 1, pp. 231–236, 2019.

[31] H. Rummukainen and J. K. Nurminen, Practical reinforcement learning-experiences in lot scheduling application, IFAC-PapersOnLine, vol. 52, no. 13, pp. 1415–1420, 2019.

[32] A. Kuhnle, N. Röhrig, and G. Lanza, Autonomous order dispatching in the semiconductor industry using reinforcement learning, Procedia CIRP, vol. 79, pp. 391–396, 2019.

[33] C. L. Liu, C. C. Chang, and C. J. Tseng, Actor-critic deep reinforcement learning for solving job shop scheduling problems, IEEE Access, vol. 8, pp. 71752–71762, 2020.

[34] C. D. Hubbs, C. Li, N. V. Sahinidis, I. E. Grossmann, and J. M. Wassick, A deep reinforcement learning approach for chemical production scheduling, Comput. Chem. Eng., vol. 141, p. 106982, 2020.

[35] X. Y. Chen and Y. D. Tian, Learning to perform local rewriting for combinatorial optimization, arXiv preprint arXiv: 1810.00337, 2019.

[36] J. Wang, X. P. Li, and X. Y. Zhu, Intelligent dynamic control of stochastic economic lot scheduling by agent-based reinforcement learning, Int. J. Prod. Res., vol. 50, no. 16, pp. 4381–4395, 2012.

[37] S. F. Xie, T. Zhang, and O. Rose, Online single machine scheduling based on simulation and reinforcement learning, in Proc. of the Simulation in Producktion and Logistik, Wissenschaftliche Scripten, Auerbach, Germany, 2019, pp. 59–68.

[38] S. J. Wang, S. Sun, B. H. Zhou, and L. F. Xi, Q-learning based dynamic single machine scheduling, (in Chinese), Journal of Shanghai Jiaotong University, vol. 41, no. 8, pp. 1227–1232 & 1243, 2007.

[39] H. B. Yang, W. C. Li, and B. Wang, Joint optimization of preventive maintenance and production scheduling for multi-state production systems based on reinforcement learning, Reliab. Eng. Syst. Saf., vol. 214, p. 107713, 2021.

[40] H. B. Yang, L. Shen, M. Cheng, and L. F. Tao, Integrated optimization of scheduling and maintenance in multi-state production systems with deterioration effects, (in Chinese), Computer Integrated Manufacturing Systems, vol. 24, no. 1, pp. 80–88, 2018.

[41] Y. C. Wang and J. M. Usher, Learning policies for single machine job dispatching, Robot. Comput. -Integr. Manuf., vol. 20, no. 6, pp. 553–562, 2004.

[42] Z. C. Zhang, L. Zheng, and M. X. Weng, Dynamic parallel machine scheduling with mean weighted tardiness objective by Q-Learning, Int. J. Adv. Manuf. Technol., vol. 34, no. 9, pp. 968–980, 2007.

[43] L. F. Zhou, L. Zhang, and B. K. P. Horn, Deep reinforcement learning-based dynamic scheduling in smart manufacturing, Procedia CIRP, vol. 93, pp. 383–388, 2020.

[44] Z. C. Zhang, L. Zheng, and X. H. Weng, Parallel machines scheduling with reinforcement learning, (in Chinese), Computer Integrated Manufacturing Systems, vol. 13, no. 1, pp. 110–116, 2007.

[45] Z. C. Zhang, L. Zheng, N. Li, W. P. Wang, S. Y. Zhong, and K. S. Hu, Minimizing mean weighted tardiness in unrelated parallel machine scheduling with reinforcement learning, Comput. Operat. Res., vol. 39, no. 7, pp. 1315–1324, 2012.

[46] P. F. Xiao, C. Y. Zhang, L. L. Meng, H. Hong, and W. Dai, Non-permutation flow shop scheduling problem based on deep reinforcement learning, (in Chinese), Computer Integrated Manufacturing Systems, vol. 27, no. 1, pp. 192–205, 2021.

[47] Z. C. Zhang, W. P. Wang, S. Y. Zhong, and K. S. Hu, Flow shop scheduling with reinforcement learning, AsiaPac. J. Operat. Res., vol. 30, no. 5, p. 1350014, 2013.

[48] W. Han, F. Guo, and X. C. Su, A reinforcement learning method for a hybrid flow-Shop scheduling problem, Algorithms, vol. 12, no. 11, p. 222, 2019.

[49] Y. C. Fonseca-Reyna and Y. Martínez-Jiménez, Adapting a reinforcement learning approach for the flow shop environment with sequence-dependent setup time, Revista Cubana de Ciencias Informáticas, vol. 11, no. 1, pp. 41–57, 2017.

[50] F. Q. Zhao, L. X. Zhang, J. Cao, and J. X. Tang, A cooperative water wave optimization algorithm with reinforcement learning for the distributed assembly no-idle flowshop scheduling problem, Comput. Ind. Eng., vol. 153, p. 107082, 2021.

[51] T. Gabel and M. Riedmiller, Scaling adaptive agent-based reactive job-shop scheduling to large-scale problems, in Proc. of 2007 IEEE Symp. Computational Intelligence in Scheduling, Honolulu, HI, USA, 2007, pp. 259–266.

[52] Y. Martínez, A. Nowé, J. Suárez, and R. Bello, A reinforcement learning approach for the flexible job shop scheduling problem, in Proc. of the 5th Int. Conf. Learning and Intelligent Optimization, Rome, Italy, 2011, pp. 253–262.

[53] C. Kardos, C. Laflamme, V. Gallina, and W. Sihn, Dynamic scheduling in a job-shop production system with reinforcement learning, Procedia CIRP, vol. 97, pp. 104–109, 2021.

[54] B. Luo, S. B. Wang, B. Yang, and L. L. Yi, An improved deep reinforcement learning approach for the dynamic job shop scheduling problem with random job arrivals, J. Phys.: Conf. Ser., vol. 1848, no. 1, p. 012029, 2021.

[55] J. Shahrabi, M. A. Adibi, and M Mahootchi, A reinforcement learning approach to parameter estimation in dynamic job shop scheduling, Comput. Ind. Eng., vol. 110, pp. 75–82, 2017.

[56] B. C. Csáji, L. Monostori, and B. Kádár, Reinforcement learning in a distributed market-based production control system, Adv. Eng. Inform., vol. 20, no. 3, pp. 279–288, 2006.

[57] H. X. Wang, B. R. Sarker, J. Li, and J. Li, Adaptive scheduling for assembly job shop with uncertain assembly times based on dual Q-learning, Int. J. Prod. Res., vol. 59, no. 19, pp. 5867–5883, 2021.

[58] T. Zhou, D. B. Tang, H. H. Zhu, and Z. Q. Zhang, Multiagent reinforcement learning for online scheduling in smart factories, Robot. Comput. -Integr. Manuf., vol. 72, p. 102202, 2021.

[59] B. Wang, F. G. Liu, and W. W. Lin, Energy-efficient VM scheduling based on deep reinforcement learning, Future Generation Computer Systems, vol. 125, pp. 616–628, 2021.

[60] Y. He, L. X. Wang, Y. F. Li, and Y. L. Wang, A scheduling method for reducing energy consumption of machining job shops considering the flexible process plan, (in Chinese), Journal of Mechanical Engineering, vol. 52, no. 19, pp. 168–179, 2016.

[61] J. Hong and V. V. Parbhu, Distributed reinforcement learning control for batch sequencing and sizing in Just-InTime manufacturing systems, Appl. Intell., vol. 20, no. 1, pp. 71–87, 2004.

[62] T. Zhou, D. B. Tang, H. H. Zhu, and L. P. Wang, Reinforcement learning with composite rewards for production scheduling in a smart factory, IEEE Access, vol. 9, pp. 752–766, 2020.

[63] J. L. Yuan, M. C. Chen, T. Jiang, and C. Li, Multiobjective reinforcement learning job scheduling method using AHP fixed weight in heterogeneous cloud environment, (in Chinese), Control and Decision, doi:10.13195/j.kzyjc.2020.0911.

[64] W. H. Zhan, C. B. Luo, J. Wang, C. Wang, G. Y. Min, H. C. Duan, and Q. X. Zhu, Deep reinforcement learning based offloading scheduling for vehicular edge computing, IEEE Internet Things J., vol. 7, no. 6, pp. 5449–5465, 2020.

[65] Y. X. Yang, J. Hu, D. Porter, T. Marek, K. Heflin, and H. X. Kong, Deep reinforcement learning-based irrigation scheduling, Trans. ASABE, vol. 63, no. 3, pp. 549–556, 2020.

[66] A. Mortazavi, A. A. Khamseh, and P. Azimi, Designing of an intelligent self-adaptive model for supply chain ordering management system, Eng. Appl. Artif. Intell., vol. 37, pp. 207–220, 2015.

[67] C. M. Xing and F. A. Liu, An adaptive particle swarm optimization based on reinforcement learning, (in Chinese), Control and Decision, vol. 26, no. 1, pp. 54–58, 2011.

[68] J. J. Wang and L. Wang, A cooperative memetic algorithm with learning-based agent for energy-aware distributed hybrid flow-Shop scheduling, IEEE Trans. Evol. Comput., doi: 10.1109/TEVC.2021.3106168.

[69] Z. P. Li, X. M. Wei, X. S. Jiang, and Y. W. Pang, A kind of reinforcement learning to improve genetic algorithm for multiagent task scheduling, Mathematical Problems in Engineering, vol. 2021, p. 1796296, 2021.

[70] M. Alicastro, D. Ferone, P. Festa, S. Fugaro, and T. Pastore, A reinforcement learning iterated local search for makespan minimization in additive manufacturing machine scheduling problems, Comput. Operat. Res., vol. 131, p. 105272, 2021.

[71] Gu Y M, Chen M, Wang L. A self-learning discrete salp swarm algorithm based on deep reinforcement learning for dynamic job shop scheduling problem[J]. Applied Intelligence, 2023.

[72] Karimi-Mamaghan M, Mohammadi M, Pasdeloup B, et al. Learning to select operators in meta-heuristics: An integration of Q-learning into the iterated greedy algorithm for the permutation flowshop scheduling problem[J]. European Journal of Operational Research, 2023, 304(3): 1296-1330.

[73] Song W, Chen X Y, Li Q Q, et al. Flexible Job-Shop Scheduling via Graph Neural Network and Deep Reinforcement Learning[J]. Ieee Transactions on Industrial Informatics, 2023, 19(2): 1600-1610.

[74] Chen R, Li W, Yang H. A Deep Reinforcement Learning Framework Based on an Attention Mechanism and Disjunctive Graph Embedding for the Job-Shop Scheduling Problem[J]. Ieee Transactions on Industrial Informatics, 2023, 19(2): 1322-1331.

你可能感兴趣的:(智能调度,强化学习,制造,智能排程,车间调度,APS,强化学习)

免费使用Adobe系列软件的Edu教育邮箱及冷门技巧分享明庭 adobe azure photoshop
在数字创意领域，Adobe系列软件因其强大的功能而备受推崇。持有Edu教育邮箱的用户可以免费获取这些软件，避免使用存在诸多问题的破解版，确保使用体验的稳定与安全。若您想了解如何申请Edu邮箱，建议查阅相关资料以获取详细信息。本文将分享五个冷门的Adobe系列软件小技巧，帮助您更高效地使用这些工具。1.Photoshop的智能对象在Photoshop中，将图层转换为智能对象，可以随时编辑其内容而不影
Agentic Workflow 设计模式的未来发展 AI天才研究院计算 AI大模型企业级应用开发实战大数据AI人工智能 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
引言随着信息技术的发展，企业对高效、灵活的自动化流程需求日益增加。AgenticWorkflow设计模式作为一种先进的流程管理理念，旨在通过赋予工作流程以自主性和智能化，实现工作的高效运行。本文将围绕AgenticWorkflow设计模式的核心概念、理论框架、设计模式及其未来发展趋势展开讨论。关键词AgenticWorkflow设计模式自主性合作性反馈循环迭代与增量开发敏捷方法论DevOps文化面
FactoryBean：Spring容器中的超级工厂，你了解多少？码农技术栈 spring cloud spring spring boot 微服务 java
想象你有一个特殊的“玩具定制工厂”（FactoryBean），这个工厂不仅仅按照固定的“生产指南”（接口）来制造玩具（Bean），它还能根据顾客的特殊需求来定制玩具。普通的“玩具生产指南”（BeanFactory）只能制造标准化的玩具，但“玩具定制工厂”（FactoryBean）却更加灵活。它能够理解复杂的制造指令，比如：“我要一个能根据输入参数变化而变化的玩具”，“我要一个延迟到顾客下单时才制造
AI 计算的未来：去中心化浪潮与全球竞争格局重塑智识微光Intelligence 人工智能机器学习大数据
引言人工智能（AI）正以前所未有的速度发展，尤其是大模型训练和推理效率的提升，使得AI计算成本迅速下降，呈现出向去中心化演进的趋势。最新的DeepSeekr1模型，以仅600万美元的训练成本，达到了OpenAIo1级别的性能，表明AI技术正迈向更具普惠性的阶段。这一趋势不仅对AI产业格局产生深远影响，还将改变计算基础设施、全球科技竞争力分布，甚至可能影响人工超级智能（ASI）的未来发展。因此，AI
三维激光扫描-用智能检测系统提升效率 CASAIM 计算机视觉人工智能
当下，企业对生产效率和质量控制的要求越来越高。传统的检测方法往往难以满足高精度、快速响应的需求。三维激光扫描技术结合智能检测系统，为工业检测带来了革命性的变革。传统检测方法的局限性传统检测方法主要依赖于人工测量和机械检测工具，如卡尺、千分尺和三坐标测量仪。这些方法虽然在一定程度上能够满足检测需求，但在面对复杂形状、大型工件或高精度要求时，往往存在效率低下、精度不足以及操作复杂等问题。此外，人工检测
AIGC时代的Vue或React前端开发 GISer_Jinger Javascript React Vue AIGC vue.js react.js
在AIGC（人工智能生成内容）时代，Vue开发正经历着深刻的变革。以下是对AIGC时代Vue开发的详细分析：一、AIGC技术对Vue开发的影响代码生成与自动化AIGC技术使得开发者能够借助智能工具快速生成和优化Vue代码。例如，通过自然语言处理模型（如ChatGPT），开发者可以描述组件的功能和样式需求，然后自动生成包含模板、脚本和样式的完整组件代码。这不仅大大提高了开发效率，还减少了人为错误的可
构建一个智能客服Agent：提升服务效率的实践人工智能机器学习
在上一篇文章中,我们讨论了如何构建一个代码助手Agent。今天,我想分享另一个实际项目:如何构建一个智能客服Agent。这个项目源于我们一个电商客户的真实需求-提升客服效率,降低人工成本。从客户需求说起记得第一次和客户沟通时的场景：客户：我们每天要处理上万条客服请求,人工成本太高了我：主要是哪些类型的请求？客户：订单查询、退换货、商品咨询这些,很多都是重复性的工作我：这些场景很适合用AIAgent
FreeRTOS深入教程（任务创建的深入和任务调度机制分析）花落已飘 FreeRTOS全系列教程嵌入式 FreeRTOS ARM 入门 STM32
文章目录前言一、深入理解任务的创建二、任务的调度机制1.FreeRTOS中任务调度的策略2.FreeRTOS任务调度策略实现的核心3.FreeRTOS内部链表源码解析4.如何通过就绪链表管理任务的执行顺序三、一个任务能够运行多久1.高优先级任务可抢占低优先级任务一直运行2.相同优先级的任务遵循时间片轮转四、FreeRTOS中任务如何释放CPU总结前言本篇文章将带大家深入学习任务的创建和分析任务调度
大模型蒸馏与大模型微调技术有啥差别? kcarly 大模型知识乱炖杂谈大模型蒸馏大模型微调大模型 AI
大模型蒸馏与大模型微调是当前人工智能领域中两种重要的技术手段，它们在模型优化、性能提升和资源利用方面各有特点。以下将从定义、技术原理、应用场景及优缺点等方面对这两种技术进行深入对比。一、定义与基本概念大模型蒸馏（KnowledgeDistillation）蒸馏是一种将大型复杂模型（教师模型）的知识迁移到小型模型（学生模型）的技术。通过训练学生模型模仿教师模型的行为，实现模型压缩和性能保留的目标。蒸
DeepSeek大模型技术深度解析：揭开Transformer架构的神秘面纱不一样的信息安全网络杂烩 AI DeepSeek
摘要DeepSeek大模型由北京深度求索人工智能基础技术研究有限公司开发，基于Transformer架构，具备卓越的自然语言理解和生成能力。该模型能够高效处理智能对话、文本生成和语义理解等复杂任务，标志着人工智能在自然语言处理领域的重大进展。关键词DeepSeek模型,Transformer架构,自然语言,智能对话,文本生成,语义理解一、DeepSeek大模型的架构解析1.1DeepSeek大模型
半导体制造工艺流程 Stestack 制造
半导体制造工艺过程非常多，据说有几百甚至几千个步骤。一个百亿投资的工厂做的可能也只是其中的一小部分工艺过程。对于这么复杂的工艺，可分为五个大类进行解说：晶圆制造、光刻蚀刻、离子注入、薄膜沉积、封装测试。另一种划分：每个半导体元件产品的制造都需要数百道工序。经过整理，整个制造过程分为八个步骤：晶圆加工、氧化、照相、蚀刻、薄膜沉积、互连、测试、封装一、半导体生产工艺（1）晶圆制造(WaferManuf
《DeepSeek-R1 问世，智能搜索领域迎来新变革》黑金IT 智能搜索
DeepSeek-R1是由DeepSeek公司开发的一款创新型人工智能模型，自2024年5月7日发布以来，迅速在AI领域引起广泛关注。该模型凭借其卓越的语言理解能力、高效的数据处理能力、自适应学习能力、高安全性与可靠性以及广泛的应用场景与拓展性，在众多人工智能模型中脱颖而出。DeepSeek-R1的核心特点强大的语言理解能力：DeepSeek-R1采用先进的深度学习算法，能够精准解析复杂的语义结构
智能小区物业管理系统推动数字化转型与提升用户居住体验快鲸数字街道系统其他
内容概要在当今快速发展的社会中，智能小区物业管理系统的出现正在改变传统的物业管理方式。这种系统不仅仅是一种工具，更是一种推动数字化转型的重要力量。它通过高效的技术手段，将物业管理与用户居住体验紧密结合，无疑为社区带来了诸多益处。采用智能小区物业管理系统，让我们一起迈入智能生活的新纪元！首先，智能小区物业管理系统通过可视化数据管理，使得所有物业运营信息一目了然。这不仅提高了决策的科学性，还提升了运营
「DeepSeek接班OpenAI」，最新开源的R1推理模型，让AI圈爆了人工智能学家人工智能
来源：前沿科技分享圈近日，AI领域迎来了一次重大突破，DeepSeek正式推出了其最新研发的开源推理模型——DeepSeek-R1。这一模型在数学、代码和自然语言推理等关键任务上的表现，已经能够与OpenAI的o1正式版相媲美，引发了AI研究者和从业者的广泛关注。多阶段训练：创新的模型架构DeepSeek-R1的训练方式采用了多阶段循环的策略，具体包括基础训练、强化学习（RL）、微调等多个阶段。这
DeepSeek R1：AI领域的新标杆 XianxinMao 人工智能
标题：DeepSeekR1：AI领域的新标杆文章信息摘要：DeepSeek的R1模型在性能上与OpenAI的o1模型相当，甚至在某些方面更具优势，尤其在成本控制上表现出色。R1模型通过开源策略展示了其在AI领域的开放态度，推动了技术的广泛发展。此外，R1-Zero模型通过强化学习和测试时计算实现了强大的推理能力，无需监督微调数据，标志着中国在AI领域的快速崛起，挑战美国的主导地位。AI模型在推理能
《Semantic communications - Principles and challenges》语义通信文献阅读与分析总结 snow每天都要好好学习深度学习深度学习
《语义通信：原理与挑战》文献详细总结1.语义通信的概念语义通信是一种超越传统香农通信范式的全新通信模式，它关注的是信息意义的传递，而不仅仅是数据本身的准确传输。传统通信强调比特级别的准确性，而语义通信更强调信息对接收方执行特定任务的有效性。这种模式被认为是第六代（6G）无线网络的核心技术之一，能够支持包括智能交通、智能监控、视频会议、增强现实（AR）和虚拟现实（VR）在内的多种智能应用。在语义通信
构建高效LLM应用开发架构的关键策略 AI天才研究院计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
文章标题：构建高效LLM应用开发架构的关键策略在当今快速发展的技术世界中，人工智能（AI）已经成为推动创新的核心动力。其中，大型语言模型（LLM）的应用开发尤为引人注目。LLM通过处理和理解自然语言，为各种场景提供了强大的智能解决方案，从智能客服到内容生成，再到教育应用，都有着广泛的应用前景。然而，高效地构建LLM应用开发架构面临着诸多挑战，包括性能、可扩展性和安全性等。本文将深入探讨构建高效LL
第03课：Anaconda 与 Jupyter Notebook 红色石头Will 深度学习 PyTorch 极简入门人工智能深度学习 PyTorch
本文将为大家介绍深度学习实战非常重要的两个工具：Anaconda和JupyterNotebook。Anaconda为什么选择Anaconda我们知道Python是人工智能的首选语言。为了更好、更方便地使用Python来编写深度学习相关程序，可以使用集成开发环境或集成管理系统，最流行的比如PyCharm和Anaconda。本文我推荐使用Anaconda。之所以选择Anaconda，是因为Anacon
AI大模型在智能客服系统中的应用季风泯灭的季节 AI大模型应用技术二人工智能
目录引言1.基于大模型的智能客服系统架构2.对话生成与上下文管理对话生成上下文管理3.提高客服系统响应精度的策略1.使用专门训练的数据集2.引入实体识别和意图分类3.反馈循环和持续优化4.AI大模型在企业中的优化与调优策略1.模型微调（Fine-tuning）2.模型蒸馏（ModelDistillation）3.响应延迟优化4.持续监控与反馈结论引言随着人工智能（AI）技术的不断发展，AI大模型在
Java小白必Java小白必看！56个项目让你秒变大神！ Python资料站学习 python 人工智能职场和发展
从简单的控制台应用到复杂的企业级项目，每个项目都有详细的说明和代码示例造福每一个走在Java路上的后端人，源码可以直接给1.网上订餐管理系统2.健康管理系统3.项目辅导视频4。医院在线挂号5.网上花店销售系统6.私人牙科诊所管理系统7.医院管理住院系统8.码头船只出行管理系统9.超市积分管理系统10.保险业务管理系统11.机场航班起降协调系统12.敬老院管理系统13.网上零食销售系统14.银行排导
深度学习（DL/ML）学习路径 jackl的科研日常深度学习学习人工智能
最近几年，尤其是自从2016年AlphaGo打败李世石事件后，人工智能技术受到了各行业极大关注。其中以机器学习技术中深度学习最受瞩目。主要原因是这些技术在科研领域和工业界的应用效果非常好，大幅提升了算法效率、降低了成本。因而市场对相关技术有了如此大的需求。我在思考传统行业与这些新兴技术结合并转型的过程中，亦系统的回顾了深度学习及其相关技术。本文正是我在学习过程中所作的总结。我将按照我所理解的学习路
基于深度学习的行人检测与识别系统：YOLOv5、YOLOv8、YOLOv10与UI界面的实现 2025年数学建模美赛深度学习 YOLO ui 人工智能分类
引言行人检测与识别技术作为计算机视觉领域的一个重要应用，广泛应用于智能监控、自动驾驶、公共安全等多个领域。行人检测系统的目标是通过图像或视频中的内容，自动识别并定位行人，这项任务在复杂环境中面临着不同的挑战，如多样的行人姿态、遮挡、光照变化等。近年来，深度学习的进步，尤其是目标检测领域的快速发展，为行人检测提供了强有力的支持。YOLO（YouOnlyLookOnce）系列模型，作为目前目标检测领域
基于深度学习的行人检测识别系统：YOLOv8 + UI界面 + 数据集完整实现 2025年数学建模美赛深度学习 YOLO ui 人工智能分类
1.引言行人检测与识别是计算机视觉中的一个重要领域，广泛应用于安防监控、智能交通、自动驾驶等多个领域。传统的行人检测方法面临着许多挑战，如低光照、复杂背景、遮挡等问题。随着深度学习技术的迅猛发展，基于卷积神经网络（CNN）的方法，尤其是YOLO（YouOnlyLookOnce）系列算法，在行人检测中取得了显著的效果。YOLOv8作为YOLO系列的最新版本，继承了YOLO一贯的高效性和准确性，在速度
【memgpt】letta 课程6：多agent编排等风来不如迎风去 AI入门与实战 multi-agent letta
Lab6:Multi-AgentOrchestration多代理协作letta是作为一个服务存在的，app通过restfulapi通信多智能体之间如何协调与沟通？相互发送消息共享内存块，让代理同步到不同的服务的内存块
呼叫中心部门如何激发员工的创新和潜能野蛮的大西瓜 FreeIPCC转载开源人工智能音频实时音视频视频编解码
呼叫中心部门如何激发员工的创新和潜能作者：基于Java、Python与FreeSWITCH的开源大模型智能呼叫中心系统FreeAICC，Github地址：https://github.com/FreeIPCC/FreeAICC激发员工的创新和潜能是提升组织竞争力、推动持续发展的关键。以下是一些有效的策略，旨在营造一个鼓励创新、促进个人成长的工作环境：一、建立创新文化倡导开放思维：鼓励员工提出新想法
《亿级流量下的架构实战：HTTP全链路解析与智能监控系统搭建》我的青春不太冷架构 http 网络协议科技经验分享学习网络
文章目录全链路解析：HTTP请求响应与数据可视化监控一、HTTP请求响应全流程解析1.全链路交互流程图2.关键技术实现2.1前端请求构造（ES6+语法示例）2.2服务端处理架构（Node.js/Express）二、数据可视化监控方案1.数据存储架构设计2.数据库操作层实现3.管理界面实现方案3.1可视化看板路由//routes/admin.js3.2数据可视化模板（EJS示例）4.最佳实践建议4.
粒子群算法原理的示例介绍 12abxd 算法模板算法粒子群算法数学建模 python
一：粒子群优化算法的介绍粒子群优化算法（PSO）是一种基于群体智能的优化算法，于1995年提出。它受到鸟群狩猎行为的启发，通过模拟鸟群或鱼群的社会行为来进行问题的求解。基本原理粒子群算法中，每个解决问题的潜在解被视为搜索空间中的一个“粒子”，每个粒子代表了问题的一个可能解。粒子在搜索空间中飞行，通过跟踪两个“极值”来更新自己的位置和速度：1.个体极值：粒子自身所经历的最优位置。2.全局极值：整个粒
AI Agent 指南：架构、构建与部署大模型之路 Agent 人工智能架构 agent LLM AI Agent
当下AIAgent正崭露头角，重塑着我们与技术交互的模式。它犹如一位智能助手，凭借独立推理、规划及自主行动能力，在无需用户持续干预的情况下，精准达成既定目标。从智能客服自动处理客户咨询，到智能投资顾问自主制定投资策略，AIAgent的应用场景不断拓展，深度融入生活与工作的诸多方面，成为推动智能化变革的关键力量。深入探究AIAgent的工作原理、设计准则、基础设施需求以及构建部署流程，对于解锁其潜能
Python从0到100（八十六）：神经网络-ShuffleNet通道混合轻量级网络的深入介绍是Dream呀 Python python 神经网络网络
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
侯捷 C++ 课程学习笔记：深入理解 C++ 核心技术与实战应用不能只会打代码其他 java jvm 开发语言侯捷 C++课程学习笔记
目录引言第一章：C++基础回顾1.1C++的历史与发展1.2C++的核心特性1.3C++的编译与执行第二章：面向对象编程2.1类与对象2.2构造函数与析构函数2.3继承与多态第三章：泛型编程与模板3.1函数模板3.2类模板3.3STL容器与算法第四章：高级特性4.1智能指针4.2移动语义与右值引用4.3Lambda表达式第五章：实战应用5.1项目结构设计5.2性能优化5.3调试与测试第六章：学习心
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod