Practical Robot Learning from Demonstrations using Deep End-to-End Training

https://arxiv.org/pdf/1905.09025.pdf
工作来自于:

  1. ARC Centre for Excellence for Robot Vision

  2. Monash University, Australia

  3. University of Adelaide, Australia

此工作把"眼在手"的相机图像使用CNN端到端映射到UR机械臂末端的速度。在16分钟内,使用遥控器人工控制机械臂从不同的初始角度,是否能在1分钟内移动到水杯上方的目标位置。

输入图像 224*224 像素

使用ResNet,把全局平均池化和全连接层用1*1的卷积层替换了,for channel reduction。这里输出的表示分类概率,而是6个浮点数,表示的是执行器末端的twist。

image

总结:这个demonstration可以为data-inefficient 的RL方法提供给一个快速学习到的initial policy.

你可能感兴趣的:(Practical Robot Learning from Demonstrations using Deep End-to-End Training)