GNN+RL:Flexible Job-Shop Scheduling via Graph Neural Network and Deep Reinforcement Learning
读paper的目的:看懂GNN如何和RL结合的方法。本文的GNN是HGNN,RL用的PPO算法。主要是看懂GNN和RL如何连接起来以及如何训练的。启发:1.不同size的graph经过feature抽取之后可以经过pooling来统一维度,再送入RL学习。2.对于GNN可以根据节点的不同特性用不同的GAT进行feature的抽取。3.对于不同的step,action的维度和可选择的值都在变化,作者