论文阅读DIFFUSION POLICIES AS AN EXPRESSIVE POLICY CLASS FOR OFFLINE REINFORCEMENT LEARNING
作者:ZhendongWang,JonathanJHunt,MingyuanZhou论文链接:https://www.aminer.cn/pub/62fa0d1490e50fcafd2462dd/AI综述(大模型驱动):offlinereinforcement学习(RL),旨在学习一个有效的政策,使用以前收集的静态数据集,是RL的一个重要范畴。标准的RL方法通常在这一任务中表现不佳,因为在外部收集