- 部分双重集团上的q邻域伊辛模型的三重性;
- 复杂网络中富人俱乐部现象的几何解释;
- 城市生产力规模化的起源规律:数学模型和新的经验证据;
- 配水管网污染源推断;
- 有保障的动态图上快速,准确的带重启随机游走;
- 学习潜伏性传播者激活的可能性;
- 城市技术部署对当地商业活动的影响;
- 用合并与拆分算子遗传算法揭示网络中的动态社区;
- 在线投票的联合主题 - 语义意识的社会推荐;
- 全球网络统计的随机游走快速贝叶斯推断;
- 人类相互作用中疾病通路的大规模分析;
- 网络科学在矿业开发人员软件工程协作中的应用:系统文献综述;
- Yelp评论中的级联行为;
- 复杂网络中远程度相关的一般公式;
- 人口动态的增长和风险的平衡;
- 将像素连接到隐私和实用程序:自动对图像中的私人信息进行编辑;
- 在SNAP上加速BigClam的实施;
部分双重集团上的q邻域伊辛模型的三重性
原文标题: Tricriticality in the $q$-neighbor Ising model on a partially duplex clique
地址: http://arxiv.org/abs/1611.07938
作者: Anna Chmiel, Julian Sienkiewicz, Katarzyna Sznajd-Weron
摘要: 我们分析了一个改进的动力学伊辛模型,所谓的$ q $ - 邻近伊辛模型,与大都会动态,[Phys。 Rev. E 92,052105],在一个双重派系和一个部分双重派系。在$ q $ -neighbor Ising模型中,每个自旋仅与从其整个邻域中随机选择的$ q $自旋相互作用。在双重集团的情况下,只有在两个等级同时引起这种变化的情况下,才允许自旋的变化。由于模型的类似于平均场的性质,我们可以推导出转移概率的解析形式并求解相应的主方程。第二级的存在极大地改变了相变的特征。在monoplex集团的情况下,$ q $ -neighbor Ising模型展现出$ q = 3 $的连续相变,$ q \ ge 4 $的不连续相变以及$ q = 1 $和$ q = 2 $没有观察到相变。另一方面,在双链团中,对于$ q $的所有值都观察到连续的相变,即使对于$ q = 1 $和$ q = 2 $也是如此。随后,我们引入一个部分双工团,参数为$ r \ in [0,1] $,它允许我们将网络从monoplex($ r = 0 $)调整为duplex($ r = 1 $)。这样一个广义的拓扑结构,其中所有节点的分数$ r $出现在两个水平上,允许获得临界值$ r = r ^ *(q)$,在这个临界值下三重性(从连续到不连续的相变)出现。
复杂网络中富人俱乐部现象的几何解释
原文标题: Geometric explanation of the rich-club phenomenon in complex networks
地址: http://arxiv.org/abs/1702.02399
作者: Máté Csigi, Attila Kőrösi, József Bíró, Zalán Heszberger, Yury Malkov, András Gulyás
摘要: 丰富的俱乐部组织(在网络中存在高度连接的集线器核心)影响网络的许多结构和功能特征,包括拓扑结构,路径效率和负载分配。尽管其主要作用,文献只包含一个非常有限的一套模型能够产生具有现实的富人俱乐部结构的网络。一个可能的原因是,富裕俱乐部组织在复杂网络中具有分化性质,与其他度量标准(例如直径,聚类或程度分布)相比,表现出极大的多样性,而其他度量标准似乎在许多网络中表现得非常相似。在这里,我们提出了一个简单而强大的基于几何的增长模型,通过控制一个单一的几何参数,可以生成具有高富人俱乐部多样性的现实复杂网络不断增长的模式通过互联网,蛋白质 - 蛋白质相互作用,机场和电网网络进行验证。
城市生产力规模化的起源规律:数学模型和新的经验证据
原文标题: The origin of urban productivity scaling laws: mathematical model and new empirical evidence
地址: http://arxiv.org/abs/1712.00476
作者: Vicky Chuqiao Yang, Andrew V. Papachristos, Daniel M. Abrams
摘要: 更大的城市与更高的人均生产率相关 - 在正面方面,如发明和负面方面,如犯罪。理解这种现象起源的一个困难是超线性标度,即相似的量表现出不同的尺度行为。我们制定了超线性标度的第一原则公式,也解释了这些差异。我们的模型表明,超线性尺度可能是在更大的相互关联的人群中找到所需合作的可能性增加的结果,并且需要更多参与者的活动将显示更显著的超线性尺度。我们使用一个新颖的数据集来测试这个模型,这个数据集涉及七种类型的犯罪以及专利,并且得到了强大的支持。
配水管网污染源推断
原文标题: Contamination source inference in water distribution networks
地址: http://arxiv.org/abs/1712.00486
作者: Alfredo Braunstein, Alejandro Lage-Castellanos, Ernesto Ortega
摘要: 我们通过观察网络中少数几个节点的污染物,研究了配水管网中污染的起源和模式的推断
有保障的动态图上快速,准确的带重启随机游走
原文标题: Fast and Accurate Random Walk with Restart on Dynamic Graphs with Guarantees
地址: http://arxiv.org/abs/1712.00595
作者: Minji Yoon, Woojeong Jin, U Kang
摘要: 给定一个时间演化图,如何快速准确地跟踪节点之间的相似度,并对收敛和误差进行理论保证?随机重新启动(RWR)是估计节点之间相似性的常用措施,并已在众多应用中被利用。许多现实世界的图是动态的,频繁插入/删除边;从而有效地跟踪动态图上的RWR得分,引起了数据挖掘研究者的极大兴趣。最近,已经提出了基于给定图中分数传播的动态RWR模型,并且已经成功地超越了先前其他动态计算RWR的方法。然而,这些模型不能以一般的形式保证更新RWR的正确性和收敛时间。在本文中,我们提出OSP,一种快速而准确的算法,用于在有向/无向图中插入/删除节点/边的动态RWR。当图更新时,OSP首先计算修改边的偏移分数,在更新图上传播偏移分数,然后将它们与当前RWR分数合并,以获得更新的RWR分数。我们证明了OSP的精确性,并引入了OSP-T,这是OSP的一个版本,它通过使用容错{ε}来调节准确性和计算时间之间的平衡。给定重新启动概率c,OSP-T保证在O(log({ε/ 2)/ log(1-c))次迭代中返回RWR分数的O({ε} / c)误差。通过大量的实验,我们发现OSP在动态图上跟踪RWR比现有的静态RWR方法快4605倍,而OSP-T要求的时间减少15倍,同时减少730倍的L1范数误差和3.3倍的降级误差。最先进的动态RWR方法。
学习潜伏性传播者激活的可能性
原文标题: Learning the Probability of Activation in the Presence of Latent Spreaders
地址: http://arxiv.org/abs/1712.00643
作者: Maggie Makar, John Guttag, Jenna Wiens
摘要: 当感染在社区蔓延时,个体受感染的可能性取决于她的易感性和通过与他人接触而传染的风险。虽然人们通常对个体的易感性有所了解,但在许多情况下,个体的交往是否具有传染性是未知的。我们研究预测一个人在多种感染模式(暴露/易感性)和潜在邻居影响下是否会感染传染病的问题。我们提出了一个生成概率模型和一个变分推理方法来学习我们模型的参数。通过对合成数据的一系列实验,我们测量了提出的模型识别潜伏扩散器的能力,并预测了感染风险。应用于20,000名医院病人的真实数据集,我们证明了我们的模型在使用病房共享和护士共享网络来预测与医疗保健相关的感染发作中的效用。我们的模型胜过现有的基准,并为设计和实施有针对性的干预措施以抑制感染传播提供可操作的见解。
城市技术部署对当地商业活动的影响
原文标题: Impact Of Urban Technology Deployments On Local Commercial Activity
地址: http://arxiv.org/abs/1712.00659
作者: Stanislav Sobolevsky, Ekaterina Levitskaya, Henry Chan, Shefali Enaker, Joe Bailey, Marc Postle, Yuriy Loukachev, Melinda Rolfs, Constantine Kontokosta
摘要: 虽然智慧城市创新似乎是对城市化挑战的普遍和必要的反应,但预见其对复杂城市系统的影响对于做出明智的决策至关重要。而且,城市干预的效果往往超出了原先的预期,包括多重间接影响。本研究考虑了城市部署花旗自行车(自行车共享系统)和LinkNYC售货亭对纽约市受影响街区的当地商业活动的影响。这项研究使用匿名,并通过从万事达中心的包容性增长的赠款,以提供聚合的洞察,以提供对花旗自行车站附近刺激行为当地的销售在吃饭的地方,而LinkNYC亭帮助人们假设初始数据驱动的证据,尤其是游客,导航本地企业,从而激励商业活动在不同的业务类别。
用合并与拆分算子遗传算法揭示网络中的动态社区
原文标题: Revealing Dynamic Communities in networks using genetic algorithm with Merging and Splitting Operators
地址: http://arxiv.org/abs/1712.00690
作者: Weihua Zhan, Lei Deng, Jihong Guan, Jun Niu
摘要: 社区结构在各种现实世界中普遍存在,描绘了强大的本地节点聚类。揭示网络的社区结构被认为是理解网络动态的关键一步。实际上,大多数现实世界的网络都是动态的,它们的社区结构随着时间的推移而演变。如何揭示动力社区最近成为一个迫切的问题。在这里,我们提出一个准确识别网络中的动态社区的演化方法。在这个方法中,我们首先引入了一个适应度函数,它是网络当前和以前快照的渐近突变值的组合。其次,我们开发了专门的合并和拆分算子,这样可以在保留低成本的同时进行大规模的搜索。第三,这种大规模搜索与局部变异和交叉相结合,增强了对网络每个快照的更好的解决方案。该方法不需要指定提前社区的数量,并且在满足时间平滑约束的同时没有分辨率限制。在模型和实际动态网络上的实验结果表明,与现有技术方法相比,该方法可以找到更好的解决方案。
在线投票的联合主题 - 语义意识的社会推荐
原文标题: Joint Topic-Semantic-aware Social Recommendation for Online Voting
地址: http://arxiv.org/abs/1712.00731
作者: Hongwei Wang, Jia Wang, Miao Zhao, Jiannong Cao, Minyi Guo
摘要: 网络投票是社会网络中一个新兴的特征,用户可以在这个网站上表达自己对各种问题的态度,展示他们独特的兴趣。在线投票对推荐带来了新的挑战,因为投票的传播严重依赖于社会网络的结构以及投票的内容。在本文中,我们研究如何在投票推荐时综合运用这两个因素。首先,由于现有的文本挖掘方法如主题模型和语义模型不能很好地处理通常短而模糊的投票内容,因此我们提出了一种新颖的话题增强型字嵌入(TEWE)方法来学习单词和文档通过共同考虑其主题和语义来表示。然后,我们提出了投票建议的联合主题 - 语义意识社会矩阵分解(JTS-MF)模型。 JTS-MF模型通过结合社会网络的TEWE表示和结构信息,计算用户和表决之间的相似度,并在矩阵分解过程中保留这个主题 - 语义 - 社会相似度。为了评估TEWE表示和JTS-MF模型的性能,我们对真实的在线投票数据集进行了广泛的实验。结果证明了我们的方法对几个最先进的基线的有效性。
全球网络统计的随机游走快速贝叶斯推断
原文标题: Rapid Bayesian Inference of Global Network Statistics using Random Walks
地址: http://arxiv.org/abs/1712.00804
作者: Willow B. Kion-Crosby, Alexandre V. Morozov
摘要: 我们提出了一种新的贝叶斯方法,它使用随机行走来快速推断具有加权或不加权边的无向网络的统计特性。我们的形式主义可以在任何网络节点属性的概率分布和网络大小的高精度估计之后,只有少部分网络节点被探索。我们的方法的贝叶斯性质提供了所有参数不确定性的严格估计。我们在几个标准的例子中展示了我们的框架,包括随机的,无标度的和小世界的网络,并且把它应用到由Wikipedia页面之间的链接组成的大型网络。
人类相互作用中疾病通路的大规模分析
原文标题: Large-scale analysis of disease pathways in the human interactome
地址: http://arxiv.org/abs/1712.00843
作者: Monica Agrawal, Marinka Zitnik, Jure Leskovec
摘要: 发现疾病通路可被定义为与给定疾病相关的蛋白质组,这是一个重要的问题,有可能为疾病诊断,预后和治疗提供临床可行的见解。计算方法通过依赖蛋白质 - 蛋白质相互作用(PPI)网络来帮助发现。他们从几个已知的疾病相关蛋白开始,通过探索已知疾病蛋白周围的PPI网络来寻找其余途径。但是,这种方法的成功是有限的,失败案例还没有得到很好的理解。在这里我们研究了519个疾病通路的PPI网络结构。我们发现90%的路径不符合PPI网络中单个连接良好的组件。相反,与单一疾病相关的蛋白质倾向于在网络中形成许多独立的连接组分/区域。然后,我们评估最先进的疾病途径发现方法,并显示它们的表现对于通路不连通的疾病特别差。因此,我们得出结论,仅仅网络连接结构可能不足以用于疾病路径发现。然而,我们表明高阶网络结构,如路径的小子图,为新方法的发展提供了一个有前途的方向。
网络科学在矿业开发人员软件工程协作中的应用:系统文献综述
原文标题: On Using Network Science in Mining Developers Collaboration in Software Engineering: A Systematic Literature Review
地址: http://arxiv.org/abs/1712.00865
作者: Mohammed Abufouda, Hadil Abukwaik
摘要: 这项研究的目标是确定,审查和分析已发表的研究成果,将网络分析作为了解不同层次软件开发人员协作的工具。预计这项研究及其发现对于使用网络科学领域工具挖掘软件库的软件工程从业人员和研究人员是有利的。我们进行了一个系统的文献回顾,其中我们根据包含和排除标准分析了来自不同数字图书馆的一些选定论文。我们从4个数字图书馆中确定了35美元的初级研究(PS),然后根据预定义的数据提取表从每个PS中提取数据。我们数据分析的结果显示,并非所有在PS中使用的构建的网络都是有效的,因为这些网络的边并不反映网络实体之间的真实关系。另外,PS中使用的措施在许多情况下不适合于所使用的网络。另外,在大多数情况下,PS报告的分析结果并不使用任何统计模型进行验证。最后,许多PS并没有为软件从业者提供可以改进软件工程实践的经验教训或指导方针。虽然挖掘网络分析在开发人员协作方面取得了一些令人满意的成果,但是网络分析的应用需要更加谨慎。也就是说,构建的网络应该具有代表性和有意义,所采用的措施需要适合上下文,并且应该考虑结果的验证。更重要的是,我们列举了一些可以应用网络科学的研究空白,并指出了可以用来挖掘协作网络的最新进展。
Yelp评论中的级联行为
原文标题: Cascading Behavior in Yelp Reviews
地址: http://arxiv.org/abs/1712.00903
作者: Muhammad Raza Khan
摘要: 社交媒体已经改变了营销和消费者研究的格局,因为企业的采用和推广越来越依赖于客户如何在Facebook,Twitter,Yelp等平台上互动和感受业务。社交评论网站如Yelp已成为不同业务信息的重要来源。这些在线平台上的社会影响力可能导致个人采纳或推动产生信息级联的想法和行动。在过去的几年中,信息级联的研究越来越受欢迎,但大部分的研究都集中在像Twitter和Facebook这样的平台上。研究采用或推广使用级联的产品可以帮助确定重要的社会影响潜在模式。在这项工作中,我们分析了信息的传播,即跨越欧洲和北美不同城市的Yelp的级联。我们列举并分析了Yelp社会网络中发生的不同级联拓扑结构。我们的一些重要发现包括Yelp评论中存在大量级联,表明社会影响的重要性,级联的重尾分布以及在初始评估的基础上准确预测级联的大小的可能性。此外,我们还发现非根节点和非根评论的特征与级联的根节点和根评论的属性相比是更重要的特征类型。这些发现可以帮助社会科学家以更系统的方式分析不同城市的客户行为。此外,它还可以帮助一个城市的企业了解不同的消费趋势,从而改善他们的流程和服务。
复杂网络中远程度相关的一般公式
原文标题: A general formulation of long-range degree correlations in complex networks
地址: http://arxiv.org/abs/1712.00910
作者: Yuka Fujiki, Taro Takaguchi, Kousuke Yakubo
摘要: 我们提供了一个通用框架来分析在复杂网络中多个步骤(即,超出最近的邻居)分离的节点之间的度相关性。引入一个概率和四个条件概率来完全描述两个节点的$ k $和$ k $ $和它们之间的最短路径长度$ l $的远程度相关性。我们介绍这些概率之间的一般关系,并阐明与最近邻关联度的相关性。与最近邻居相关不同,这些概率中的一些仅在有限大小的网络中才有意义。此外,作为基线,以确定在网络中的存在或长程度相关性的有无,这些概率为网络的无任何长程度相关性功能形式解析地一个平均场近似内进行评价。我们的论点的有效性通过将其应用于现实世界的网络来证明。
人口动态的增长和风险的平衡
原文标题: The balance of growth and risk in population dynamics
地址: http://arxiv.org/abs/1712.00979
作者: Thomas Gueudré, David Martin
摘要: 在人群中共同观察到成长和探索,无论是动物和细胞还是无生命的物质和金钱。但是,他们的移动能力是应对不确定性和优化回报的关键,受到环境空间/时间特性的影响。我们调查环境如何在这样的条件下形成最佳的增长和人口分布。我们通过重新审视通用图的通用增长模型,揭示了风险与收益之间的权衡。我们的结果揭示了丰富而细致的画面:卓有成效的策略通常会导致危险的立场,但这种张力可能会被探索空间的几何结构缓解。随后通过对财务数据的实证研究来说明我们的结论的适用性。
将像素连接到隐私和实用程序:自动对图像中的私人信息进行编辑
原文标题: Connecting Pixels to Privacy and Utility: Automatic Redaction of Private Information in Images
地址: http://arxiv.org/abs/1712.01066
作者: Tribhuvanesh Orekondy, Mario Fritz, Bernt Schiele
摘要: 图像传达了广泛的个人信息。如果这些图片是在社交媒体平台上分享的,这些个人信息会被泄露,这与个人隐私相冲突。因此,我们的目标是自动化的方法来编辑这些隐私信息,从而保护个人的隐私。通过进行用户研究,我们发现混淆与私人信息相关的图像区域导致隐私,同时保留图像的实用性。而且,通过改变区域的大小,可以实现不同的隐私效用权衡。我们的研究结果认为是一种“分段编辑”范式。因此,我们提出了第一个可以在广泛的隐私类别中使用像素和实例级别标签注释的“野外”私人图像的大型数据集。我们提供了第一个自动编辑多样化私人信息的模型。
在SNAP上加速BigClam的实施
原文标题: Speeding Up BigClam Implementation on SNAP
地址: http://arxiv.org/abs/1712.01209
作者: C. H. Bryan Liu, Benjamin Paul Chamberlain
摘要: 我们对斯坦福网络分析项目(SNAP)的大型网络集群联盟模型(BigClam)的C ++实现进行了详细的分析。 BigClam是一种流行的图挖掘算法,能够在包含数百万个节点的网络中找到重叠的社区。我们的分析显示了该算法的一个关键阶段 - 确定一个节点是否属于一个社区 - 主导实现的运行时间,但计算不是并行化的。我们表明,通过使用OpenMP跨多个线程并行计算,我们可以在解决大型社区网络时加快5.3倍的算法速度,同时保持程序和结果的完整性。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。