- 促进信息传播:一种算法方法;
- 战争与和平的空间生态学;
- 不要游走,跳过!在线学习多尺度网络嵌入;
- 利用固定选项调查推断包括强弱关系的网络结构特征;
- HARP:网络的分层表示学习;
- 基于神经网络协同过滤的抽样策略;
- 动态随机块模型中的季节性;
- 使用地理标记视频的大规模人类活动映射;
- 高速公路交通流二维数据驱动模型;
- 社会好奇心对网络信息传播的影响;
- 用于收集丰富的推荐数据集的偏好引出界面;
- 电功率在哥伦比亚和来自生物质的不同来源的发电之间的比较研究;
促进信息传播:一种算法方法
地址: http://arxiv.org/abs/1602.03111
作者: Yishi Lin, Wei Chen, John C.S. Lui
摘要: 大多数影响力最大化(IM)研究侧重于针对有影响力的播种机,以触发社交网络中的大量信息传播。在本文中,我们考虑了如何进一步增加给定种子的影响力的新的和互补的问题。我们的研究是由于观察直接激励可以“提升”用户,使他们更有可能受到朋友的影响。我们研究$ k $ -boosting问题,其目的是找到$ k $用户来提升,以使最终的“提升”的影响传播最大化。 $ k $ -boosting问题与IM问题不同,因为增强的用户与播种机的行为不同:提升的用户最初没有受到影响,我们只会增加其受影响的概率。我们的工作也补充了IM研究,因为我们专注于在给定种子的基础上触发更大的影响传播。问题的NP-硬度和目标函数的非子模态性对于$ k $ -boosting问题都构成挑战。为了解决一般图上的问题,我们设计了两种具有数据相关近似率的高效算法。对于指向树的$ k $ -boosting问题,我们提出了一种高效的贪心算法和一个完整的多项式时间近似方案的四舍五入动态规划。我们使用真实的社交网络和合成的指导树进行广泛的实验。我们表明,我们的算法返回的增强解决方案可以提高影响力,这比通过直观基线提供的解决方案所达到的效果高出几倍,这些解决方案不能保证解决方案的质量。我们还在我们的实验中探讨“预算分配”问题。与具有所有预算的瞄准种子相比,当我们将预算分配给播种机和提升用户时,影响传播就会更大。
战争与和平的空间生态学
地址: http://arxiv.org/abs/1604.01693
作者: Weisi Guo, Xueke Lu, Guillem Mosquera Donate, Samuel Johnson
摘要: 人类的繁荣往往受到持续暴力的严重限制。定量冲突研究发现战争中存在共同的时间和其他统计模式,但对其一般空间格局的理解很少。虽然拓扑在地缘战略中的重要性早已得到承认,但城市空间格局在确定一个地区的冲突脆弱性方面的作用尚未得到开发。在这里,我们展示了战争与和平中的全球格局与城市在全球互动网络中的相对位置密切相关。我们发现,具有中间性高于某一阈值的区域经常被吞噬在根深蒂固的冲突中,而高度相关于和平。事实上,间断次数占袭击数量的80%以上。这个指标也是与冲突地区距离的一个很好的预测因素,并且可以估计冲突的风险。我们推测,高度的两性之间确定了具有模糊文化边界的区域,而高度城市则是维系和平的核心。这是由一个简单的基于主体的模式支持的,城市在这些模型中影响着邻居,这种模式在冲突数据中看到了相同的阈值行为。这些结果不仅揭示了暴力事件的原因,而且可以用来估计与城市合并,交通基础设施建设或贸易或移民模式干预等行动相关的风险。
不要游走,跳过!在线学习多尺度网络嵌入
地址: http://arxiv.org/abs/1605.02115
作者: Bryan Perozzi, Vivek Kulkarni, Haochen Chen, Steven Skiena
摘要: 我们提出了Walklets,一种学习网络顶点多尺度表示的新方法。与以前的作品相比,这些表示方法以可分析的方式明确地编码多尺度顶点关系。 Walklets通过对图的顶点上的短随机散列进行子采样来生成这些多尺度关系。通过在每个随机游走中跳过步骤,我们的方法生成可通过固定长度的路径到达的顶点对的语料库。然后,该语料库可用于学习一系列潜在表示,每个潜在表示从相邻矩阵中逐次捕获更高阶的关系。我们展示了Walklets潜在表示对诸如BlogCatalog,DBLP,Flickr和YouTube等社交网络的多标签网络分类任务的功效。我们的研究结果表明,Walklets优于基于神经矩阵分解的新方法。具体来说,在挑战性多标签分类任务的情况下,我们的DeepWalk优于10%,而58%的Micro-F1则超过了58%。最后,Walklets是一种在线算法,可以轻松地扩展到具有数百万个顶点和边的图。
利用固定选项调查推断包括强弱关系的网络结构特征
地址: http://arxiv.org/abs/1706.07828
作者: Naghmeh Momeni, Michael Rabbat
摘要: 了解离线社交网络的结构有助于进行各种分析,包括研究传染病可能传播的速度,以及确定一部分免疫人员,以尽可能减少传播速度。离线社交网络拓扑结构通常由测量人员估计,并要求他们列出他们的邻居。通常可以可靠地确定亲密的朋友和家人(即强有力的关系),列出所有的熟人(即弱关系)由于受访者疲劳而受到错误。通常通过使用所谓的“固定选择”调查来规避这个问题,在这些调查中,受访者被要求确定一小部分固定的弱关系(例如两到十个)。当然,由此产生的粗视网络将省略许多关系,并且使用这个粗网来推断网络的属性,如其度数分布或聚类系数,将导致偏差估计。本文通过使用固定选择调查数据,针对多个网络特征(包括与度数分布的第一和第二时刻相关的网络特征以及网络大小),基于时刻的方法开发估计器。使用模拟数据的实验表明,所提出的估计器在各种网络拓扑和测量场景中表现良好,并且所得到的估计值比直接使用文献中常用的粗观观察网络获得的估计值显着更准确。我们还描述了可以用于获得估计方差估计的Jackknife过程的变体。
HARP:网络的分层表示学习
地址: http://arxiv.org/abs/1706.07845
作者: Haochen Chen, Bryan Perozzi, Yifan Hu, Steven Skiena
摘要: 我们提出HARP,一种用于学习图节点的低维嵌入的新颖方法,保留了高阶结构特征。我们提出的方法通过在嵌入之前压缩输入图来实现这一点,有效地避免了可能对非凸优化造成问题的麻烦的嵌入配置(即局部最小值)。 HARP通过找到一个较小的图,其近似于其输入的全局结构。该简化图用于学习一组初始表示,它们作为原始详细图中学习表示的良好初始化。我们通过分解一系列级别的图,然后将最粗糙的图的层次结构嵌入到原始图,从而引入了这一想法。 HARP是一种通用的元策略,用于改进用于嵌入图的所有最新的神经算法,包括DeepWalk,LINE和Node2vec。实际上,我们表明,应用HARP的层次结构,对于所有这三种方法的改进,实现了对现实世界图表(如DBLP,BlogCatalog,CiteSeer和Arxiv)的分类任务的评估。实现高达14%的宏F1。
基于神经网络协同过滤的抽样策略
地址: http://arxiv.org/abs/1706.07881
作者: Ting Chen, Yizhou Sun, Yue Shi, Liangjie Hong
摘要: 神经网络的最新进展激发了人们设计可以并入(1)用户项目交互信息和(2)包括图像,音频和文本的内容信息的混合推荐算法。尽管神经网络的推荐算法具有前瞻性的成果,但却具有广泛的计算成本,从而使其具有挑战性。在本文中,我们提出了一种基于神经网络的通用推荐框架,其中包含了几种现有的最先进的推荐算法,并通过调查框架随机梯度下降训练中的抽样策略来解决效率问题。我们通过首先建立损失函数和用户项目交互二分图之间的连接来解决这个问题,其中损失函数术语在链接上定义,而主要计算负担位于节点处。我们称这种类型的损失函数为“基于图表”的损失函数,各种小批量抽样策略可以具有不同的计算成本。基于这一见解,提出了三种新颖的抽样策略,可以显着提高拟议框架的培训效率(在实验中高达$ $ 30倍的速度),以及改进推荐性能。还提供了计算成本和收敛性的理论分析。我们认为抽样策略的研究对于一般的基于图的损失函数有进一步的影响,并且还将在基于神经网络的推荐框架下进行更多的研究。
动态随机块模型中的季节性
地址: http://arxiv.org/abs/1706.07895
作者: Jace Robinson, Derek Doran
摘要: 社会技术和地理空间过程显示时变结构,使洞察发现具有挑战性。本文提出了一种以动态网络为模型的系统的新统计模型,以应对这一挑战。它假设顶点落入k类中的一种,并且在特定时间的边形成的概率取决于入射节点的类型和当前时间。时间依赖性是由独特的季节性过程驱动的,许多系统显示(例如,每天地理空间或网络流量的可预测的尖峰)。本文将模型定义为生成过程和推理过程,以便在数据未知时从数据中恢复季节过程。使用合成动态网络进行评估显示了促成其形成的潜在季节过程的恢复。
使用地理标记视频的大规模人类活动映射
地址: http://arxiv.org/abs/1706.07911
作者: Yi Zhu, Sen Liu, Shawn Newsam
摘要: 本文是使用地理标签视频的可视内容执行人类活动的时空映射的第一个工作。我们利用最近深入学习的视频分析框架(称为隐藏的双流网络)来识别YouTube视频中的一系列活动。该框架是高效的,可以实时或更快地运行,这对于识别事件在流式视频中发生或者为了减少分析已捕获的视频的延迟而重要。反过来,这对于在智能城市应用中使用视频非常重要。我们进行一系列实验,以表明我们的方法能够准确地在空间和时间上映射活动。我们还展示了使用视觉内容超过标签/标题的优势。
高速公路交通流二维数据驱动模型
地址: http://arxiv.org/abs/1706.07965
作者: Michael Herty, Giuseppe Visconti
摘要: 基于从德国和美国高速公路获得的实验交通数据,我们提出了一种新颖的二维一阶宏观交通流模型。目标是重现真实道路几何的交通动态的详细描述。在我们的方法中,沿着道路和车道的动态是连续的。完成流体动力学方程所需的闭合关系是通过对基础图数据进行回归得到的。与一维模型预测的比较显示出新型模型的性能提高。
社会好奇心对网络信息传播的影响
地址: http://arxiv.org/abs/1706.07972
作者: Didier A. Vega-Oliveros, Lilian Berton, Federico Vazquez, Francisco A. Rodrigues
摘要: 大多数信息传播模型认为所有个人在心理上都是相同的。他们忽视了人们的好奇心,这可能意味着他们可以受到影响,寻求有兴趣的信息。例如,由于用户引起好奇,博弈Pok 'emon GO迅速蔓延。本文提出了一种考虑每个人的好奇心水平的信息传播模型,这是随着时间演变的动态参数。与传统的信息传播模型(如SIR或IC)相比,我们评估了模型的效率,并对不同类型的人造和现实世界网络(如Google+,Facebook和美国路线图)进行了分析。我们提出一种平均场方法,以良好的准确度再现宏观量的演变,例如窒息密度,对系统的行为与好奇心的演化。我们还获得了一个平均场方程的解析解,它可以预测从信息保持局限于少数用户到阶段的过渡,而这个阶段在大部分人口中传播。结果表明,与没有好奇心的传播相比,好奇心增加了所有网络中的信息传播,空间网络中的这种增长比社交网络更大。当考虑到好奇心时,知情人数最多达到接近过渡点。由于好奇的人对新产品,概念和想法更开放,这是传播建模中要考虑的重要因素。我们的结果有助于理解扩散过程和社会网络中的动态异构传输之间的相互作用。
用于收集丰富的推荐数据集的偏好引出界面
地址: http://arxiv.org/abs/1706.08184
作者: Pantelis P. Analytis, Tobias Schnabel, Stefan Herzog, Daniel Barkoczi, Thorsten Joachims
摘要: 我们提供一个可以用来快速,轻松地引导人们喜欢视觉刺激的界面,例如照片,视觉艺术和屏幕保护程序,以及关于用户的丰富的侧面信息。我们计划采用新的界面来收集密集的推荐数据集,以补充现有稀疏的行业规模数据集。新界面和收集的数据集旨在促进推荐系统研究与社会和行为科学研究的整合。例如,我们将使用数据集来评估不同视觉体验领域的人际偏好的多样性。此外,使用数据集,我们将能够测量关键的心理影响,如偏好一致性,尺度敏锐度和锚定偏差。最后,我们的数据集将有助于评估反事实学习实验。
电功率在哥伦比亚和来自生物质的不同来源的发电之间的比较研究
地址: http://arxiv.org/abs/1706.08441
作者: Juan Garcia-Torres
摘要: 本文比较了哥伦比亚的不同发电方式(主要是每种方法的运行),关于在欧洲制造的技术,重点是利用生物质或固体废物开发能源,考虑到哥伦比亚是一个国家以经济为基础的农业进程。本文介绍了每种方法中的优点和缺点,其中包括生成,投资,就业和环境方面的变量,并且通过这些信息,提出了一个建议,就像在国内生成能源的最佳方式。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在个人博客网络科学研究速递 进行同步更新,并提供RSS订阅。