- 结构强化的弹性:单层和复合网络的动态随着突然改变成本的增加;
- 社会媒体用户在独立运动中的态度分类;
- 在通过在线极端主义空间漫游的个人的普遍性和相关性;
- 网络之星的崛起与衰落;
- 层叠交替更新过程模型中风险预测的限制;
- NPGLM:用于含时链路预测的非参数方法;
- 侧面信息在图匹配问题中的意义;
- 基于度的均值场和多状态接触过程的近似方程;
- 理论是预测的,但它是完整的吗?人类对随机感知的应用;
结构强化的弹性:单层和复合网络的动态随着突然改变成本的增加
地址: http://arxiv.org/abs/1610.07221
作者: Paul E. Smaldino, Raissa D'Souza, Zeev Maoz
摘要: 我们检查单层和多路网络中网络形成的模型,其中个人对社会关系,封闭三角形和外溢边有积极的激励。特别是,我们调查冲击对网络的影响,社会关系的成本在初始平衡之后发生变化。我们强调结构性巩固的出现:保持结构特征,如闭合三角形和溢出边,这些结构特征在历史上与目前驱动网络演化的条件不同。这项工作对于理解单层和复用网络的结构和动力学中的路径依赖性具有广泛的意义。
社会媒体用户在独立运动中的态度分类
地址: http://arxiv.org/abs/1702.08388
作者: Arkaitz Zubiaga, Bo Wang, Maria Liakata, Rob Procter
摘要: 社会媒体和数据挖掘越来越多地用于分析政治和社会问题。在这里,我们承认社会媒体用户的分类是支持或反对其领土内正在进行的独立运动。独立运动发生在公民有冲突的国家身份的地区;反对国家认同的用户将支持或反对成为与正式承认的国家不同的独立国家的一部分。我们描述一种依赖用户自我报告的位置来构建三个地区(加泰罗尼亚,巴斯克地区和苏格兰)的数据集的方法,我们使用四种类型的特征来测试与语言无关的分类器。我们展示了构建大型注释数据集的方法的有效性,以及在正在研究的三个领域实现85%至97%的精确语言独立分类表现的能力。数据分析显示存在相互反对的国家认同的回声室。
在通过在线极端主义空间漫游的个人的普遍性和相关性
地址: http://arxiv.org/abs/1706.06627
作者: Z. Cao, M. Zheng, Y. Vorobyeva, C. Song, N.F. Johnson
摘要: 最近恐怖袭击的“蓝色”性质和明显动机的多样性,突显了在发展高水平的极端主义支持之前了解个人所遵循的在线轨迹的重要性。在这里我们显示随机游走的物理学,有无时间相关性,提供了对这些在线轨迹的统一描述。我们独特的数据集包含全球社交媒体网站的所有用户,揭示了个人在线时间的普遍特征。我们的伴随理论产生了分析和数值解决方案,描述了继续发展高水平的极端主义支持的个人所显示的特征,以及那些没有的极端主义支持。这些时间和许多身体相关性的存在表明现有的物理机械可以用于量化并且可能减轻未来事件的风险。
网络之星的崛起与衰落
地址: http://arxiv.org/abs/1706.06690
作者: Michael Fire, Carlos Guestrin
摘要: 趋势在当今世界迅速发生变化,并且在最重要的人物列表,全球公司排名,传染病模式,政治观点和在线社交网络的普及中被轻易地观察到。一个关键问题出现:新趋势出现的机制是什么?为了回答这个问题,我们可以将现实世界的动态系统建模为网络,网络由一组顶点及其对应的链接表示。然后可以分析这些网络的特征和拓扑结构,包括它们如何在长时间内演化。然而,这些动态系统背后的实际机制仍然难以理解。在这里,我们展示了迄今为止最大的公共网络演进数据集的构建,我们用它来揭示网络中的关键实体如何获得权力。我们采用最先进的数据科学工具和广泛的云计算资源来创建这个包含38,000个现实世界网络和250万个图的大规模语料库。然后,对各种规模的网络演进进行了第一次精确的广泛分析。出现了三个主要观察:首先,链接在同一时间加入网络的顶点中最为普遍;第二,新顶点加入网络的速度是模拟网络拓扑的核心因素;第三,网络星(高度顶点)的出现与快速增长的网络相关。我们应用我们的学习来开发简单的网络生成模型 - 一种基于大规模现实世界数据的灵活模型。我们的结果适用于自然界和社会中的动态系统,并更好地了解这些网络中的星星如何上升和下降。
层叠交替更新过程模型中风险预测的限制
地址: http://arxiv.org/abs/1706.06734
作者: Xin Lin, Alaa Moussawi, Gyorgy Korniss, Jonathan Z. Bakdash, Boleslaw K. Szymanski
摘要: 大多数风险分析模型通过不考虑风险的互连性和相互依赖性来系统地低估灾难性事件(例如经济危机,自然灾害和恐怖主义)的概率和影响。为了解决这个弱点,我们提出了级联交替更新过程(CARP)来预测相互关联的全球风险。然而,模型的预测精度的评估受到缺乏足够的地面真实数据的限制。这里,我们通过使用具有已知参数的CARP模型的模拟产生的替代长地面真值数据,建立预测精度作为输入数据大小的函数。我们说明了从具有多样化住房的基本城市街区组装的人造城市火灾模式的做法。结果证实参数恢复方差表现出幂律衰减作为可用地面真值数据长度的函数。使用CARP,我们还使用不同的数据集来展示估计,该数据集也具有依赖性:基于世界经济论坛全球风险报告的全球风险模型的现实世界预测精度。我们得出结论,CARP模型是预测灾难性级联事件的有效方法,可能应用于新兴的本地和全球互联风险。
NPGLM:用于含时链路预测的非参数方法
地址: http://arxiv.org/abs/1706.06783
作者: Sina Sajadmanesh, Jiawei Zhang, Hamid R. Rabiee
摘要: 在本文中,我们尝试解决信息网络中时态链路预测的问题。这意味着预测链接在将来出现的时间,因为它在当前网络快照中提取的功能。为此,我们引入了一种称为“非参数广义线性模型”(NP-GLM)的概率非参数方法,该方法根据其特征推断了链接出现时间的隐藏潜在概率分布。然后,我们提出了一种用于NP-GLM的学习算法和一种推理方法来回答与时间有关的查询。综合数据和现实的新浪微博社交网络进行的大量实验展示了NP-GLM在竞争性基线上解决时间链接预测问题的有效性。
侧面信息在图匹配问题中的意义
地址: http://arxiv.org/abs/1706.06936
作者: Kushagra Singhal, Daniel Cullina, Negar Kiyavash
摘要: 基于渗透的图匹配算法依赖于种子顶点对的可用性作为辅助信息,以有效地匹配网络中的用户。尽管这种算法在实践中运行良好,但还有其他类型的边信息可用于攻击者。在本文中,我们考虑当攻击者以社区标签的形式或不完全的初始匹配访问边信息时匹配两个相关图的问题。在前一种情况下,我们提出了一种天真的图匹配算法,通过引入社区度向量,以有效的方式利用来自社区标签的信息。此外,我们分析文献中提出的具有社区结构图的基本渗透算法的变体。在后一种情况下,我们提出了一种具有两个阈值的新型渗滤算法,其使用不完全匹配作为输入来匹配相关图。我们使用各种实验来评估所提出的关于合成和现实世界数据集的算法。实验结果表明,社区作为边信息的重要性,特别是当种子数量少,网络弱相关时。
基于度的均值场和多状态接触过程的近似方程
地址: http://arxiv.org/abs/1706.06964
作者: Charalampos Kyriakopoulos, Gerrit Grossmann, Verena Wolf, Luca Bortolussi
摘要: 联系过程在网络上形成了一个非常有意义的大型动态过程,包括流行病和信息传播。在设计这种过程的随机模型时相对容易,从计算的角度分析它们是非常具有挑战性的,特别是对于出现在实际应用中的大型网络。降低分析复杂性的一个策略是依赖于近似,通常采用一组捕获随机节点演化的微分方程,区分具有不同拓扑上下文(即不同程度的不同邻域)的节点,例如度数(DBMF),近似主方程(AME)或对近似(PA)。如此获得的微分方程的数量通常与网络的最大程度kmax成比例,其远小于底层随机模型的主方程的大小,但是对于大kmax,数值求解这些方程式仍然是有问题的。在本文中,我们将仅针对二进制状态情况提出的AME和PA扩展到多状态设置,并提供将具有相似度的节点聚集在一起的聚合过程,将同一集群中的那些处理为不可区分,从而减少方程数,同时保留对感兴趣的全球可观测量的准确描述。我们还提供了一种自动的方法来建立这样的方程式,并且识别少量的度数集群,从而给出准确的结果。该方法在几个案例研究中进行了测试,其中显示出高水平的压缩和大型网络的几个数量级的计算时间的减少,精度损失最小。
理论是预测的,但它是完整的吗?人类对随机感知的应用
地址: http://arxiv.org/abs/1706.06974
作者: Jon Kleinberg, Annie Liang, Sendhil Mullainathan
摘要: 当我们使用数据测试理论时,通常将重点放在正确性上:理论的预测是否与数据中看到的相符?但我们也关心完整性:数据中可预测的变化多少被理论所捕获?这个问题很难回答,因为一般来说,我们不知道这个问题有多少“可预见的变化”。在本文中,我们考虑了以机器学习算法为动机的方法,作为构建可达到最佳预测水平的基准的一种手段。我们说明了我们预测人为随机序列的任务的方法。相对于理论机器学习算法基准,我们发现现有的行为模型大约解释了这个问题的可预测变化的15%。这个部分在问题的几个变体上是稳健的。我们还考虑一种用于分析来自领域的现场数据的方法,其中将人的感知和随机性的产生用作概念框架;这些包括顺序决策和重复的零和博弈。在这些领域中,我们用于测试理论完整性的框架提供了一种在不同背景下评估其有效性的方法;我们发现尽管存在一些差异,但现有理论在整个领域相对于基准测试表现相当稳定。总体而言,我们的研究结果表明:(i)现有的模型尚未被捕获,这个问题中存在大量的结构,(ii)机器学习可以为测试完整性提供可行的方法。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在个人博客网络科学研究速递 进行同步更新,并提供RSS订阅。