- 异构复杂系统波动行为的普遍性的偏离揭示了组件的固有属性:国际货币市场为例;
- 在图中搜索单个社区;
- 通过特征向量和聚类分析进行街道网络拓扑特征描述;
- 使用潜变量概率图语法生成更好的图;
- 重构具有未知和异质性错误的网络;
- 潜在异质多层社区检测;
- 应对产品需求的变化:搜索排名转化率(CR)预测应用;
- 国际足联动态网络排名:替换不准确、有偏见和可利用的足球排名系统;
- 在线请愿的数据挖掘以及结果:Avaaz.org上的一份请愿书数据库;
异构复杂系统波动行为的普遍性的偏离揭示了组件的固有属性:国际货币市场为例
原文标题: Deviations from universality in the fluctuation behavior of a heterogeneous complex system reveal intrinsic properties of components: The case of the international currency market
地址: http://arxiv.org/abs/1606.06111
作者: Abhijit Chakraborty, Soumya Easwaran, Sitabhra Sinha
摘要: 识别在不同条件下相对不变的行为在远离均衡的复杂系统中是一项具有挑战性的任务。作为一个半不变量签名的存在如何被构成这些系统的组件属性的异质性掩盖的例子,我们考虑了国际货币市场中的汇率动态。我们表明,表征不同货币波动分布的重尾的指数系统地偏离与指数中值(〜2)相关的假定通用形式。我们将特定货币的偏离程度与这种“平方反比法则”与相应经济的基本宏观特性即人均生产量和出口产品的多样性的度量联系起来。我们还表明,与属于发达经济体的货币汇率动态所表现的不相关的随机游走相比,欠发达经济体的货币显示出与扩散过程的反相关性相关的次扩散过程的特征。类似于这里介绍的方法可能有助于识别其他复杂系统中组件异构性所掩盖的不变特征。
在图中搜索单个社区
原文标题: Searching for a Single Community in a Graph
地址: http://arxiv.org/abs/1806.07944
作者: Avik Ray, Sujay Sanghavi, Sanjay Shakkottai
摘要: 在标准图聚类/社区检测中,人们有兴趣将图划分为更密集连接的节点子集。相反,本文的“搜索”问题旨在仅从可能存在的许多社区中找到这样一个“单一”社区,即目标的节点。为此,我们会获得有关目标的适当副信息;例如,来自目标的非常少量的节点被标记为这样。我们考虑一个普遍而简单的边信息概念:假设所有节点具有随机权重,目标中的节点平均具有较高的权重。考虑到这些权重和图,我们开发了一种变体方法,可以更可靠地识别目标中的节点,并且计算量更低,而不是使用边信息并划分整个图的通用社区检测方法。我们的实证结果显示运行时有显著的增益,并且与其他图聚类算法相比,其准确度也有所提高。
通过特征向量和聚类分析进行街道网络拓扑特征描述
原文标题: Topological street-network characterization through feature-vector and cluster analysis
地址: http://arxiv.org/abs/1806.07952
作者: Gabriel Spadon, Gabriel Gimenes, Jose F. Rodrigues-Jr
摘要: 复杂的网络提供了一种通过街道网格来描述城市的手段,表达了涉及城市区域结构和组织的特征。虽然其他研究已经使用复杂的网络来模拟街道网格,但我们观察到缺乏通过使用拓扑特征来表征城市之间关系的方法。因此,本文旨在描述城市之间的相互作用,通过使用表示为复杂网络的街道网格中提取的拓扑特征向量。本研究的方法基于使用数字地图。在这些地图的计算表示中,我们提取了体现城市特征的全球复杂网络特征。这些向量允许使用多维投影和聚类技术,使街道网格的基于相似度的比较成为可能。我们试验了来自巴西圣保罗州的645个城市。我们的研究结果显示,全球特征的联合是如何描述深深扎根于网络拓扑结构的城市指标,以及它们如何揭示相互分离的多组城市之间的特征和相似性。
使用潜变量概率图语法生成更好的图
原文标题: Growing Better Graphs With Latent-Variable Probabilistic Graph Grammars
地址: http://arxiv.org/abs/1806.07955
作者: Xinyi Wang, Salvador Aguinaga, Tim Weninger, David Chiang
摘要: 最近在图模型中的工作发现概率超立体替换语法(HRGs)可以从图中提取出来,并用于生成新的随机图,其图属性和子结构接近原始图。在本文中,我们展示了如何将潜在变量添加到使用期望最大化进行训练的模型中,以生成更好的图,即更好地推广到测试数据的图。我们通过分离训练和测试图来评估新方法,对前者建立模型并测量后者的可能性,作为模型如何更好地推广到新图的更严格测试。在这个度量标准中,我们发现我们的潜变量HRG始终超越了几个现有的图模型,并提供了有关真实世界网络构建模块的有趣见解。
重构具有未知和异质性错误的网络
原文标题: Reconstructing networks with unknown and heterogeneous errors
地址: http://arxiv.org/abs/1806.07956
作者: Tiago P. Peixoto
摘要: 绝大多数网络数据集包含错误和遗漏,尽管这在传统的网络分析中很少引入。最近,通过开发基于贝叶斯推断的网络重建方法来弥补这种方法上的差距,已经做出了越来越多的努力。然而,这些方法依赖于统一差错率的假设以及通过重复测量直接估计每个边的存在,这是大多数网络数据当前不可用的。在这里,我们开发了一种贝叶斯重建方法,通过不仅允许不均匀误差,而且在不直接估计误差的情况下进行单独边测量,解决了这些限制。我们的方法通过将推理方法与结构化生成网络模型耦合起来,使得边之间的相关性可用作可靠的误差估计。尽管我们的方法是一般性的,但我们专注于随机块模型作为基本生成过程,从中可以执行高效的非参数推断,并产生一个从噪声数据推断分层社区结构的原则方法。我们用各种经验和人工网络来证明我们的方法的有效性。
潜在异质多层社区检测
原文标题: Latent heterogeneous multilayer community detection
地址: http://arxiv.org/abs/1806.07963
作者: Hafiz Tiomoko Ali, Sijia Liu, Yasin Yilmaz, Alfred Hero, Romain Couillet, Indika Rajapakse
摘要: 我们提出了一种同时检测异构多层加权和无向网络中共享和非共享社区的方法。假定多层网络遵循生成概率模型,该模型考虑了社区之间的相似性和不相似性。我们利用变分贝叶斯方法从多层网络观测中共同推断共享和未共享的隐藏社区。我们展示了我们的方法与最先进的算法在检测合成数据以及真正的全基因组成纤维细胞增殖数据集上的不同(共享和私有)社区方面的稳健性。
应对产品需求的变化:搜索排名转化率(CR)预测应用
原文标题: Reacting to Variations in Product Demand: An Application for Conversion Rate (CR) Prediction in Sponsored Search
地址: http://arxiv.org/abs/1806.08211
作者: Marcelo Tallis, Pranjul Yadav
摘要: 在线互联网广告中,机器学习模型被广泛用于计算用户参与产品相关广告的可能性。然而,由于用户和广告客户行为的变化,传统机器学习模型的性能常常受到影响。例如,花店的搜索引擎流量通常会在情人节,母亲节等时达到峰值。为了克服这一挑战,本文中我们提出了三种模型,可以将因产品需求变化而产生的影响纳入其中。所提出的模型是产品需求功能,专用数据采样方法和集成技术的组合。我们证明了我们提出的模型在从现实世界中获得的数据集上的表现。我们的研究结果表明,所提出的模型能够更准确地预测用户与产品相关广告互动的结果,同时对用户和广告客户行为的波动具有强大的稳健性。
国际足联动态网络排名:替换不准确、有偏见和可利用的足球排名系统
原文标题: Dynamic Network 3 -- 0 FIFA Rankings: Replacing an inaccurate, biased, and exploitable football ranking system
地址: http://arxiv.org/abs/1806.08259
作者: Sam Abernethy
摘要: 国际足球的结果被解释为一个有向网络,为每个球队提供排名。两种基于网络的模型---静态和动态---被构建并与当前的FIFA排名进行比较。动态模型在世界杯预测准确性方面优于国际足联排名,同时也消除了大陆偏差并降低了国际足联排名受到剥削的风险。这是通过使用两个直观的参数来完成的 - 间接获胜和过去获胜的相对重要性 - 它们的值分别被确定为0.07和0.9。我们建议国际足联应该实施这个模式作为其未来的排名系统。
在线请愿的数据挖掘以及结果:Avaaz.org上的一份请愿书数据库
原文标题: Online Petitioning Through Data Exploration and What We Found There: A Dataset of Petitions from Avaaz.org
地址: http://arxiv.org/abs/1806.08282
作者: Pablo Aragón, Diego Sáez-Trumper, Miriam Redi, Scott A. Hale, Vicenç Gómez, Andreas Kaltenbrunner
摘要: 互联网已成为激进主义的基本资源,因为它有助于全球范围的政治动员。请愿平台是世界各地成千上万人能够为社会变革做出贡献的明显例子。 Avaaz.org在全球200多个国家设有分支机构,是这类机构中最受欢迎的机构之一。然而,很少有研究关注这个平台,可能是由于缺乏可用的数据。在这项工作中,我们检索了超过350K个请愿书,标准化了他们的字段值,并使用语言检测和命名实体识别增加了新的信息。为了用这个独特的全球抗议库来激励未来的研究,我们首先对数据集进行探索。我们特别研究了社交媒体宣传如何与请愿的成功有关,以及关于Avaaz.org全球社区的一些地理和语言发现。我们以可以用我们的数据集解决的示例研究问题结束。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。