用 GPU 并行环境 Isaac Gym + 强化学习库 ElegantRL:训练机器人Ant,3小时6000分,最高12000分
前排提醒,目前我们能“用ppo四分钟训练ant到6000分”,比本文的3小时快了很多很多,有空会更新代码https://blog.csdn.net/sinat_39620217/article/details/131724602介绍了IsaacGym库如何使用GPU做大规模并行仿真,对环境模块提速。这篇帖子,我们使用1张A100GPU在3个小时之内,把Ant机器人训练到6000分以上,并开源了代码