Arxiv网络科学论文摘要5篇(2017-08-21)

  • 通过深度增强学习学习进行物理实验;
  • 适应度选民模式:阻尼振荡和异常共识;
  • 通过非线性模块化特征向量在网络中进行社区检测;
  • 社会网络中偏好在基于抽样的偏好聚合中的传播建模;
  • 公共博弈合作:留下,但不要太久;

通过深度增强学习学习进行物理实验

地址: http://arxiv.org/abs/1611.01843

作者: Misha Denil, Pulkit Agrawal, Tejas D Kulkarni, Tom Erez, Peter Battaglia, Nando de Freitas

摘要: 当遇到新颖的物体时,人类能够通过与目标驱动的方式相互作用来推测出广泛的物理特性,如质量,摩擦和变形能力。这个积极的互动过程与科学家们一样,在进行实验以发现隐藏事实的同时,人造智能的最新进展已经产生了可以在Go,Atari,自然语言处理和复杂控制问题中实现超人性能的机器;然而,不清楚这些系统是否可以对抗即使是一个小孩的科学直觉。在这项工作中,我们介绍了一组基本的任务,需要代理人来估计属性,如交互式模拟环境中的对象的质量和内聚,从而可以操纵对象并观察后果。我们发现,最先进的强化学习方法可以学会进行必要的实验来发现这些隐藏的属性。通过系统地操纵代理人进行实验所遇到的困难和成本,我们发现代理人学习了不同的策略,平衡收集信息的成本与在不同情况下犯错误的成本。

适应度选民模式:阻尼振荡和异常共识

地址: http://arxiv.org/abs/1708.05485

作者: Anthony Woolcock, Colm Connaughton, Yasmin Merali, Federico Vazquez

摘要: 我们在一个完整的图表中研究异质选民模型中的意见形成动态,除了$ $ $或$ - $意见状态外,每个代理都赋予整数适应度参数$ k \ ge 0 $。 $ k $ - 值的分布和意见动态的演变耦合在一起,以便允许系统以简单的方式动态地开发异质性和记忆。当两个具有不同意见的代理人进行互动时,他们的$ k $ - 值被比较,并且概率为$ p $,具有较低价值的代理人采用具有较高价值的代理人,而概率为$ 1-p $发生。获胜代理商然后将其$ k $ - 值增加1。我们在整个$ 0 \ le p \ le 1 $范围内研究系统的动态,并与案例$ p = 1/2 $进行比较,对应于标准选民模型。当$ 0 \ le p <1/2 $时,系统对于初始多数意见的协商一致状态呈指数级的速度。平均共识时间$ \ tau $与代理人$ N $的数量对数增长,相对于在选民模型中发现的线性行为$ \ tau \ sim N $,它大大减少。当$ 1/2

通过非线性模块化特征向量在网络中进行社区检测

地址: http://arxiv.org/abs/1708.05569

作者: Francesco Tudisco, Pedro Mercado, Matthias Hein

摘要: 在网络或数据集中揭示社区结构是许多科学领域中出现的一个中心问题。模块化函数$ Q $是量化社区质量的一种已建立的度量,被确定为具有高模块性的一组节点。在我们的术语中,具有正模块性的一组节点称为\ textit {module},并且使$ Q $最大化的集合被称为\ textit {leading module}。在网络中找到一个领先的模块是一项重要任务,但现实问题的维度使得$ Q $的最大化不可行。这就需要通过模块化矩阵$ M $的谱引起的通常基于$ Q $的线性弛豫的近似技术。在这项工作中,我们提出一种非线性弛豫,而不是基于非线性模块运算符$ \ mathcal M $的谱。我们显示$ \ mathcal M $的极值特征值提供了模块化度量$ Q $的确切放宽,但是以与$ M $相比更具挑战性的价格计算。因此,我们通过提出一种名为\ textit {generalized RatioDCA}的计算方案来扩展非线性拉普拉斯算子的工作,以解决这种极值特征值。我们显示单调上升和收敛的方法。我们最终将这种新方法应用到几个合成和现实世界的数据集中,显示了模型的有效性和方法的性能。

社会网络中偏好在基于抽样的偏好聚合中的传播建模

地址: http://arxiv.org/abs/1708.05690

作者: Swapnil Dhamal, Rohith D. Vallam, Y. Narahari

摘要: 鉴于人口众多,收集个人偏好的一组替代方案是一项非常重要的任务,并得出反映人口集体偏好的总体偏好。我们表明,通过对代表性节点的一小部分的偏好进行抽样,可以利用人口基础的社会网络有效地完成此任务。使用我们创建的Facebook数据集,我们开发了在典型社交网络中捕获节点之间偏好传播的模型。我们接下来提出了选择最佳代表性节点的问题的适当的目标函数,并且观察到贪心算法表现出优异的性能。为了计算的目的,我们设计了一个贪婪算法,它为广泛的流行投票规则提供了一个性能保证。我们设计了第二个算法贪婪算法,我们在实践中表现良好。我们将这些提出的算法的性能与随机轮询和流行的中心性度量进行比较,并对获得的结果进行详细分析。我们的分析还表明,使用社交网络信息选择代表有利于聚合与个人主题相关的偏好,而具有合理样本大小的随机投票对于聚合与社会话题有关的偏好是足够好的。

公共博弈合作:留下,但不要太久

地址: http://arxiv.org/abs/1708.05705

作者: Lucas Wardil, Marco A. Amaral

摘要: 反复公共博弈的合作几乎不能实现,除非有偶然的行为。当然,如果存在促进合作者之间积极分类的机制,那么合作者可能会殴打叛逃者,因为合作者会收获更大的回报。在进化博弈理论的背景下,永远合作的人不能赢得混合人口中的叛逃者的竞争。在这里,我们研究在重复的公共物品博弈中获得适应度的人口的演变,玩家有固定的下一轮的概率。因此,在比赛期间,组大小减少。人口很好,只有两种可行的策略:总是配合(ALLC)或总是缺陷(ALLD)。通过数值计算和分析近似,我们可以看出,如果玩家保持博弈的玩法,而不是太久,合作就会出现。主要机制是随着群体规模的减小,从强弱利他的过渡到存在时间有限的轮次数的上限的存在。

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在个人博客 https://www.complexly.me 进行更新,并提供RSS订阅。

你可能感兴趣的:(Arxiv网络科学论文摘要5篇(2017-08-21))