**基于深度强化学习的全覆盖路径规划飞行器**

论文题目《UAV Coverage Path Planning under Varying Power Constraints using Deep Reinforcement Learning》
论文主要内容:1.利用DDQN做路径规划
2.利用卷积神经网络处理全局地图
3.考虑能量约束,任意位置起降
摄像头给出当前的覆盖率视图,GPS给出无人机的位置

**基于深度强化学习的全覆盖路径规划飞行器**_第1张图片

覆盖问题利用三通道的二维网格图分析,设置三个主要区域:起降区,禁飞区,目标区;一个网格区域可以同时被设置为这三个区域中的一个或者多个,但是不能同时事起降区和禁飞区。
飞行器位置使用独热码表示,它可以与三通道地图和覆盖网格以五通道输入网络的卷积层来编码。
实验
每次训练循环都有能量预算,每一个动作进行时,飞行器在当前位置无论是接受还是不接受都消耗一个单位的能量预算。
飞行器的初始位置由一个固定地图,零初始化的覆盖网格和位置组成
飞行器的摄像头可视范围设定为摄像头正下方3*3的网格区域,每一步动作后,地图都会标记覆盖网格中的可视范围
利用三个不同的地图进行训练,评估覆盖率和训练次数
**基于深度强化学习的全覆盖路径规划飞行器**_第2张图片

蓝色为起降区,黄色时初始位置,白色时终止位置,绿色时目标区,红色是禁飞区,黑色表示未覆盖
论文没有源码

你可能感兴趣的:(路径规划,深度学习,神经网络,卷积神经网络,自动驾驶)