组会汇报(本科)-在复杂楼层背景下,一种基于深度强化学习的目的楼层预约调度算法的多智能体电梯群控系统的研究
项目代码地址总体流程引入概念,说明问题,讲解论文,提出方案对综述的引用说明,在老师给的综述中,文献调研时间是2019,从技术的发展历程角度考虑,本文只作部分引用,更多地倚靠2020左右地文章,因为2020是深度强化学习的爆发点。概念引入神经网络马尔可夫算法动态规划强化学习模拟退火蒙特卡罗树搜索与神经网络深度强化学习(DQN)电梯调度本身要面临的环境本次环境的两个设计理念以下参数问题对应的解决方案我