ICLR 2020共计198篇开源代码论文目录!

近日有网友总结了目前已经开源代码的文章,共计198篇,涵盖目标跟踪、语义分割、GAN、NAS、图神经、元学习、网络优化、强化学习等领域。我们将从中挑选三篇进行解读。完整列表可在“会议之眼”公众号后台回复“iclr2020code”直接领取。

The Logical Expressiveness of Graph Neural Networks

Pablo Barceló, Egor V. Kostylev, Mikael Monet, Jorge Pérez, Juan Reutter, Juan Pablo Silva

文章地址:

https://openreview.net/forum?id=r1lZ7AEKvB

代码地址:

https://anonymous.4open.science/r/787222e2-ad5e-4810-a788-e80f0fe7eff0/

有网友统计了2019 年各大顶会提交论文的关键词数据。图神经网络成了增长第一的香饽饽。这也是我们介绍本文的原因。

这是一篇满分的工作。是由常年战斗在图领域的大佬 Pablo Barceló 团队完成的。图神经网络(GNN)区分图节点的能力最近已经通过用于检查图同构性的Weisfeiler-Lehman(WL)测试进行了表征。但是,这种表征并不能解决哪些布尔节点分类器可以由 GNN 来表示 (即将图中的节点分类为真或假的函数)的问题。这篇文章专注于研究布尔分类器来解决上述问题。首先从研究流行的GNNs(文中称为 AC-GNNs)开始,在该类 GNN 中仅根据相邻特征,在连续的层中更新图中每个节点的特征。实验表明,这类 GNN 太弱而无法捕获所有FOC2(一种一阶逻辑研究) 分类器,并提供了 AC-GNNs ,它可以捕获FOC2 分类器最大子类的语法表征。然后,研究人员研究了需要在 AC-GNNs 中添加什么来捕获所有的 FOC2 分类器。实验表明,添加 readout 不仅可以更新相邻节点,还可以更新全局属性向量。文章称这类 GNNs 为 ACR-GNNs。

Simplified Action Decoder for Deep Multi-Agent Reinforcement Learning

Hengyuan Hu,Jakob N Foerster
文章地址:

https://openreview.net/forum?id=B1xm3RVtwB

代码地址:

https://bit.ly/2mBJLyk

近年来,我们在AI领域看到了许多基准问题的快速进展。现代方法在Go,Poker和Dota中达到了近乎或超乎人类的表现。所有这些挑战的一个共同点是它们在设计上是对抗性的,或者从技术上来说是零和性质。与这些设置相反,现实世界中的成功通常需要人类在至少部分合作的情景下进行协作,与他人交流。去年,纸牌游戏Hanabi被确立为AI的新基准环境以填补这一空白。Hanabi完全专注于心理理论,即在观察其他行为者时能够有效地推理其他行为者的意图,信念和观点。强化学习从根本上要求代理商进行探索,以便发现良好的策略,但是,如果仅仅做到这一点,这种随机性将使得在训练过程中,它们的行为产生较少的信息。我们提出了一种新的深层多智能体RL方法,即简化动作解码器(SAD),该方法通过集中训练阶段解决了这一矛盾。在训练过程中,SAD允许其他代理不仅观察所选择的(探索性)行为,而且代理还可以观察其队友的贪婪行为。通过将这种简单的直觉与用于状态预测的辅助任务以及用于多主体学习的最佳实践相结合,SAD在Hanabi挑战的自我游戏部分(2-5位玩家参加)达到了新的水平。

Meta-Learning Acquisition Functions for Transfer Learning in Bayesian Optimization

Michael Volpp, Lukas Froehlich, Kirsten Fischer, Andreas Doerr, Stefan Falkner, Frank Hutter, Christian Daniel

文章地址:

https://openreview.net/forum?id=ryeYpJSKwr

代码地址:

https://github.com/metabo-iclr2020/MetaBO

通过跨任务转移知识来提高数据效率是全局优化算法领域的开放式关键挑战之一。现成的算法通常被设计为通用优化器,因此,对于特定任务而言通常不是最佳的。我们提出了一种新颖的转移学习方法,以在完善的贝叶斯优化框架内获得定制的优化器,从而使我们的算法能够利用经过证明的高斯过程的泛化能力,通过使用强化学习对一组相关任务进行元训练获取功能(AF)。该方法学习了提取隐式结构信息并利用它来提高数据处理效率。我们进行了从模拟到真实的传输任务,开展了一些关于模拟函数和两个超参数搜索问题的实验。

你可能感兴趣的:(计算机会议,干货资料,人工智能)