基于深度强化学习的柔性作业车间动态调度(有代码)

代码
重大孙爱红的知乎账号
论文链接

文献来源:International Journal of Production Research(2022)南洋理工大学(IJPR/2022)Full article: Deep reinforcement learning for dynamic scheduling of a flexible job shop (tandfonline.com)

1 摘要
在追求敏捷和灵活的生产调度方面,处理不可预测的动态事件的能力变得越来越重要。与此同时,生产系统中的网络-物理融合产生了大量需要实时挖掘和分析的工业数据。为了便于这种实时控制,本研究提出了一种分层分布式的体系结构来解决动态柔性作业车间调度问题。采用双深度Q网络算法(DDQN)训练调度智能体,捕捉生产信息与调度目标之间的关系,为具有恒定任务到达的柔性作业车间实时做出调度决策。为了处理动态调度中问题的可变规格说明,提出了专门的状态和动作表示法。此外,还提出了一种代理奖励整形技术(surrogate reward-shaping technique),以提高学习效率和调度效果。通过仿真研究,验证了该方法在不同场景下的性能。数值结果表明,与现有的调度策略相比,该方法不仅具有更好的性能,而且在制造系统配置发生变化的情况下,其优势依然存在。

2 问题描述
柔性作业车间包含多个工作中心,每个工作中心可能包含多台机器

你可能感兴趣的:(强化学习,调度优化,资料,深度学习,人工智能,机器学习,经验分享,学习)