基于近端策略优化的Proximal Policy Optimization(PPO)的无人机姿态控制系统的研究——简化版
基于近端策略优化的ProximalPolicyOptimization(PPO)的无人机姿态控制系统的研究详细版订阅本博https://blog.csdn.net/ccsss22/article/details/1154230841.问题描述:PPO算法是由OpenAI提出的,该算法是一种全新的策略梯度(PolicyGradient)算法,但是传统的策略梯度算法受到步长影响较大,而且很难选择出最优