论文阅读笔记——Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware
ALOHA论文ALOHA解决了策略中的错误可能随时间累积,且人类演示可能是非平稳的,提出了ACT(ActionChunkingwithTransformers)方法。ActionChunking模仿学习中,compoundingerror是致使任务失败的主要原因。具体来说,当智能体(agent)在测试时遇到训练集中未见过的情况时,可能会产生预测误差。这些误差会逐步累积,导致智能体进入未知状态,最终