很认真的中了一篇AAMAS2019的文章:Modelling the Dynamic Joint Policy of Teammates with Attention Multi-agent DDPG

【有中相同会议的小伙伴记得联系我哦,可以一起商量着把会议相关的事情做好】

这篇文章是利用深度强化学习(Deep Reinforcement Learning)做多智能体合作(multi-agent cooperation)。

主要贡献点在于使用了一个attention机制 in a principled way,principle在,这个attention是基于agent modelling方法推导得出的,因此具有理论依据。

同时实验结果也很好。

具体内容参考:https://arxiv.org/abs/1811.07029

 

评委们的分数给的还算比价高:6/7/8。

The review process was extremely selective. Out of a total of 781 reviewed submissions, the program committee selected 189 full papers (8 pages plus references) for oral presentation and 218 extended abstracts (2 pages plus references) for poster presentation.

你可能感兴趣的:((深度)增强学习)