- 网络中群集数量的交叉验证估算;
- 社区检测中群集选择的比较分析;
- 在具有吸引力的活动驱动网络上随机游走;
- 减少具有对称性破坏的多代理系统的复杂性:通过民意测验的意见动态应用;
- 巴西联邦犯罪网:拓扑,弱点和控制;
- 非线性马尔科夫链的$ \ ell_1 $中的稳定性理论和影响网络意见动态的随机模型;
- 多变量时间序列数据的Toeplitz逆协方差聚类;
- 协同知识生产中内容质量的动态;
- 丝绸之路:从信息域向社会用户推荐的项目;
- 挖掘人类流动性:通过头/尾断裂;
- 余震在复杂的系统中引发灾难:货币汇率崩溃;
- 符号网络动态;
- DenseAlert:增量式敏感检测器;
- 伊辛掺杂选民模型;
- 后处理分区,以识别模块化优化领域;
网络中群集数量的交叉验证估算
地址: http://arxiv.org/abs/1605.07915
作者: Tatsuro Kawamoto, Yoshiyuki Kabashima
摘要: 网络科学调查总结关系数据以获得更好的解释性的方法。确定模块化结构是一项基本任务,对粗粒化水平的评估是其关键一步。在这里,我们提出原则性,可扩展性和广泛适用的评估标准,以基于边预测误差的一次性交叉验证估计来确定模块化网络中的集群数量。
社区检测中群集选择的比较分析
地址: http://arxiv.org/abs/1606.07668
作者: Tatsuro Kawamoto, Yoshiyuki Kabashima
摘要: 对社区检测的各种模式选择标准进行比较分析。虽然详尽的比较需要对框架,算法和模型选择标准的所有可能组合进行测试,但我们主要关注使用随机块模型进行的统计推断及其通过信念传播的EM算法的实现。对于模型选择标准,我们考虑文献中常用的那些和与我们考虑的算法直接相关的那些。随着我们评估与其他标准相比,每个标准的过度和过度的趋势,我们还分析了EM算法中的模型参数学习如何影响模型评估的性能。此外,我们建议冲积图是可视化推理结果的合适工具,可用于确定簇数。
在具有吸引力的活动驱动网络上随机游走
地址: http://arxiv.org/abs/1701.06449
作者: Laura Alessandretti, Kaiyuan Sun, Andrea Baronchelli, Nicola Perra
摘要: 几乎所有的现实世界网络都是动态实体。在社交网络中,节点参与社会互动(活动)的倾向及其被活动节点(吸引力)选择的机会是非均匀分布的。在这里,我们提出一个时变网络模型,其中每个节点和联系的动态形成由这两个特征表征。当描述过程和网络演化的时间尺度相当时,我们研究这些属性如何影响在网络上展开的随机游走过程。我们为固定状态和过程的平均第一次通过时间推导出分析解,并且通过社会网络的实证观察来研究病例。我们的工作表明,以前忽视的真实社会系统的这种不均匀的活动和吸引力分布以及它们之间的相互关系的属性对网络上展现的动态过程产生了重大的影响。
减少具有对称性破坏的多代理系统的复杂性:通过民意测验的意见动态应用
地址: http://arxiv.org/abs/1706.03115
作者: Emiliano Cristiani, Andrea Tosin
摘要: 在本文中,我们研究降低由非常大量的相互作用因子组成的系统的复杂性的可能性,其动态特征是对称性破坏。我们考虑描述系统在粒子(即拉格朗日)水平下的行为的一阶随机微分方程,并且我们通过动力学描述得到其连续(即欧拉)对应物。然而,所产生的连续模型不能充分描述系统的演变,这是由于颗粒度的丧失,这阻碍了它再现粒子系统的对称破坏。通过适当地耦合这两个模型,我们能够显着减少必要数量的颗粒,同时仍然保持对称性破坏和一些其大规模的统计特性。我们在意见动态的背景下描述了这样一种多尺度技术,其中对称性破坏是由媒体报道的一些民意调查的结果引起的。
巴西联邦犯罪网:拓扑,弱点和控制
地址: http://arxiv.org/abs/1706.03153
作者: Bruno Requião da Cunha, Sebastian Gonçalves
摘要: 世界各地的执法和情报机构正在努力寻找有效的办法来打击和控制有组织犯罪。然而,非法网络在法律之外运行,并且大部分收集的数据被分类。因此,关于犯罪网络结构,拓扑弱点和控制的知之甚少。在这一贡献中,我们在巴西提出了一个独特的联邦犯罪网络。研究其结构,对不同攻击策略的反应及其可控性。令人惊讶的是,由联邦管辖的多个罪行组成的网络是一个巨大的组成部分,占据了其边的一半以上。这个组件显示了一些典型的社交网络特征,如小世界和高聚类系数,但是它比普通的社交网络“更暗”,具有低边密度和网络效率。另一方面,它具有非常高的模块化价值,$ Q = 0.96 $。比较多个攻击策略,我们表明,根据基于模块的处方,正是由于其高模块性,可以通过仅删除其边或节点的$ 2 \%$来破坏网络的巨大组件。最后,我们通过访问驱动程序节点的$ 20 \%$来显示组件是可控的,在确切的网络控制理论的意义上。
非线性马尔科夫链的$ \ ell_1 $中的稳定性理论和影响网络意见动态的随机模型
地址: http://arxiv.org/abs/1706.03158
作者: Zahra Askarzadeh, Rui Fu, Abhishek Halder, Yongxin Chen, Tryphon T. Georgiou
摘要: 我们研究马氏链模型,其中过渡机制在非线性上依赖于当前状态。这种模式的一个具体选择,其中国家代表“信仰”,被提出在\ cite {jia2015opinion}中来模拟意见动态,被称为DeGroot-Friedkin模型。在这里,我们考虑一类这样的非线性马尔科夫链模型,并开发一种评估稳定性的理论。我们的方法依赖于确定非线性动力学的差异(在适当的分析条件下)在$ \ ell_1 $指标中是收缩的。我们将理论应用于两种类型的非线性随机游走,即非线性适应转移概率,其中自适应是指数和线性的。后者包括DeGroot-Friedkin模型和泛化。我们还讨论连续时间泛化以及相互作用(粒子)模型,并讨论它们在影响网络上建模社会动态的相关性。最后,我们将过渡机制的非线性适应视为反馈,并量化外部偏差对静态分布的影响。
多变量时间序列数据的Toeplitz逆协方差聚类
地址: http://arxiv.org/abs/1706.03161
作者: David Hallac, Sagar Vare, Stephen Boyd, Jure Leskovec
摘要: 多元时间序列的子序列聚类是在时间数据中发现重复模式的有用工具。一旦发现这些模式,看似复杂的数据集可以被解释为只有少量状态或集群的时间序列。例如,来自适应度跟踪应用的原始传感器数据可以表示为选择的几个动作(即,行走,坐着,跑步)的时间线。然而,发现这些模式是具有挑战性的,因为它需要时间序列的同时分割和聚类。此外,解决所得到的集群是困难的,特别是当数据是高维度时。在这里,我们提出了一种基于模型的聚类的新方法,我们称之为Toeplitz逆协方差聚类(TICC)。 TICC方法中的每个簇由相关网络或马尔可夫随机场(MRF)定义,表征该簇的典型子序列中不同观测值之间的相互依赖关系。基于这种图表示,TICC同时对时间序列数据进行分段和聚类。我们通过使用期望最大化(EM)算法的变化通过交替最小化来解决TICC问题。我们推导出封闭形式的解决方案,通过动态规划和乘法器(ADMM)的交替方向方法分别以可扩展的方式有效地解决了两个产生的子问题。我们通过在一系列合成实验中将TICC与几个最先进的基准进行比较来验证我们的方法,然后我们在汽车传感器数据集上演示如何使用TICC来在现实世界场景中学习可解释的集群。
协同知识生产中内容质量的动态
地址: http://arxiv.org/abs/1706.03179
作者: Emilio Ferrara, Nazanin Alipourfard, Keith Burghardt, Chiranth Gopal, Kristina Lerman
摘要: 我们通过研究Stack Exchange上发布的问题的答案质量来探索协同知识生产中用户绩效的动态。我们提出四个答案质量指标:答案长度,代码行的数量以及其包含的外部Web内容的超链接,以及是否被asker接受为问题的最有帮助的答案。分析2008年至2014年期间发布的数百万个答案,我们发现定期的短期和长期质量变化。在短期内,质量在一次会议过程中恶化,每个连续的答案变短,代码行和链接较少,并且不太可能被接受。相比之下,性能在长期上有所改善,更有经验的用户提供更高质量的答案。这些趋势不是数据异质性的结果,而是具有行为来源。我们的研究结果突出了短期性能恶化之间的复杂相互作用,可能由于精神疲劳或注意力消耗,以及由于学习和技能获取而导致的长期绩效改善及其对用户生成内容质量的影响。
丝绸之路:从信息域向社会用户推荐的项目
地址: http://arxiv.org/abs/1706.03205
作者: Xiang Wang, Xiangnan He, Liqiang Nie, Tat-Seng Chua
摘要: 在线平台可分为面向信息和面向社会的领域。前者是指强调用户项目交互的论坛或电子商务网站,如Trip.com和Amazon;而后者则指具有丰富用户连接的社交网络服务(SNS),如Facebook和Twitter。尽管它们具有异质性,但这两个领域可以被几个重叠的用户桥接,被称为桥梁用户。在这项工作中,我们解决跨域社会推荐问题,即向社会网络的潜在用户推荐相关信息域。据我们所知,这是一个很少研究的新问题。现有的跨域推荐系统不适用于此任务,因为它们专注于同构信息域或假设用户完全重叠。为此,我们提出了一种新颖的神经社会协作排名(NSCR)方法,可以无缝地缝合SNS中信息域和用户用户连接中的用户项目交互。在信息域部分,利用用户和项目的属性来加强用户和项目的嵌入学习。在SNS部分,传播桥接用户的嵌入,以学习其他非桥接用户的嵌入。两个实际数据集的广泛实验证明了我们的NSCR方法的有效性和合理性。
挖掘人类流动性:通过头/尾断裂
地址: http://arxiv.org/abs/1706.03210
作者: Karim Keramat Jahromi
摘要: 当今世界人口越来越相互联系,依靠更快的交通方式,简化联系和缩短通勤时间,我们看到人流动性迅速增加。在这种情况下,揭示和理解人类流动模式已经成为在管理当今社会组织的复杂性时支持决策和预测活动的关键问题。在实践中,每个人的流动模式由被访问的地点的顺序组成。这些地方及其相关性代表了大多数建模和活动研究的基础,用于了解人的流动性。即使访问过的地方几乎占据了这一领域的大部分作品,它们的特征仍然在很大程度上是未知的,因为在以前的作品中,它们主要被认为是一个地区或社交聚会地点的无特征点,而不考虑地点的作用和重要性每个用户的行为。
余震在复杂的系统中引发灾难:货币汇率崩溃
地址: http://arxiv.org/abs/1706.03246
作者: Vasilya Usmanova, Yury V. Lysogorsky, Sumiyoshi Abe
摘要: 研究了大规模崩溃后货币汇率的动态行为。显示,与Lillo和Mantegna调查的股市崩盘情况类似。 Rev. E 68,016119(2003)],放松的特征在于幂律,其与地震余震的大森 - 宇宙定律类似。发现等待时间分布也符合幂律。此外,讨论了事件 - 事件相关性,并观察了老化现象和尺度属性。对余震过程的(非)马尔可夫性进行评论,以及崩溃后玻璃态动力学与市场体系的相关性。
符号网络动态
地址: http://arxiv.org/abs/1706.03362
作者: Guodong Shi, Claudio Altafini, John S. Baras
摘要: 符号网络是一个网络,每个链接与正号或负号相关联。在这种符号网络上交互的节点的模型分别来自于各种生物,社会,政治和经济系统,其中两种类型的互动分别沿着正和负链接定义。作为对正向链接的常规DeGroot动力学的修改,已经提出并广泛研究了沿着负面链接的两种基本类型的负相互作用,即相反的规则和排斥规则。本文回顾了一些基于统一代数图法的文献中关于确定性或随机符号网络动力学的基本趋同结果。我们表明,利用广义Perron-Frobenius理论,图论和基本代数递归可以获得一种研究节点状态演化的系统工具。
DenseAlert:增量式敏感检测器
地址: http://arxiv.org/abs/1706.03374
作者: Kijung Shin, Bryan Hooi, Jisu Kim, Christos Faloutsos
摘要: 考虑一轮转发事件 - 如何在这样的多方面数据(即张量)中随着时间的推移发现欺诈性的锁步行为?我们可以实时检测,准确保证吗?过去的研究表明,密集的检测器往往表示许多张量数据中的异常甚至欺诈行为,包括社交媒体,维基百科和TCP转储。因此,已经提出了几种用于快速和准确地检测致密子载波的算法。然而,现有的算法假设张量是静态的,而许多现实世界的张量,包括上面提到的那些,随着时间的推移而演变。我们提出DenseStream,一种维持和更新张量流(即张量变化序列)中的密集子传感器的增量算法,以及DenseAlert,这是一种增强算法,用于发现密集的子传感器突然出现。我们的算法是:(1)快速和“任何时间”,我们的算法的更新比最快的批处理算法快了百万倍,(2)准确度很高:我们的算法保证子传感器密度的下限维持和(3)有效:我们的DenseAlert成功地发现现实世界张量的异常,特别是现有算法忽视的那些。
伊辛掺杂选民模型
地址: http://arxiv.org/abs/1706.03575
作者: Adam Lipowski, Dorota Lipowska, Antonio L. Ferreira
摘要: 我们检查一个意见形成模型,这是一个混合的选民和伊辛代理。数值模拟显示,即使是非常小的部分($ \ sim 1 \%$)的Ising代理也大大改变了Voter模型的行为。选民代理人作为一种介质,其与稀疏分散的Ising剂相关联,并且所得铁磁排序持续到一定温度。在添加Ising代理后,Voter模型($ d = 2 $)或其活跃稳定状态($ d = 3 $)的对数慢速粗化变为Ising型幂律粗化。
后处理分区,以识别模块化优化领域
地址: http://arxiv.org/abs/1706.03675
作者: William H. Weir, Scott Emmons, Ryan Gibson, Dane Taylor, Peter J. Mucha
摘要: 我们引入可容许模块化分区(CHAMP)算法的Convex Hull来修剪并优先化可能的各种计算启发式的多次运行中的不同网络社区结构。给定一组分区,CHAMP识别每个分区(即,具有最大模块性的参数空间域)的模块化优化的域,丢弃具有空域的分区以获得“允许”子集。重要的是,CHAMP可用于多维参数空间,例如用于多层网络的参数空间,其中包括分辨率参数和层间耦合。使用CHAMP的结果,用户可以通过观察优化领域的大小和可容许子集中的分区之间的成对比较来更适当地选择可靠的社区结构。我们演示了具有几个示例网络的CHAMP的实用性。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在个人博客网络科学研究速递 进行同步更新,并提供RSS订阅。