- 测量相关突发的记忆系数的限制;
- 推导复杂网络上稀疏观测扰动的传播路径;
- 用于验证社区检测算法的模块化网络;
- 如何战胜科学与影响人:决策者与认知网络的宣传;
- 瓶颈实验的微观旅行时间分析;
- 叙述网络;
- 有限存储容量的动态多层网络中的移动性和拥塞;
- 在可调节聚类的双层静态 - 动态多路复用网络上,基于边的SIR流行病房间建模;
- 通用网络拆解;
- 关联网络中聚类与度的关系;
- 从社交媒体数据中检测交通事故的深度学习方法;
- 用设计的拉普拉斯谱对网络动力学进行功能控制;
- 基于本体的社会大数据语义数据提取方法:最新进展和研究方向;
- 社交媒体上的政治话语:回声室、守门人和两党制的代价;
- 谱图伪造:图生成目标模块化;
- 屏蔽Google的语言毒性模型以对抗攻击;
- 政治腐败网络的动力结构;
测量相关突发的记忆系数的限制
原文标题: Limits of memory coefficient in measuring correlated bursts
地址: http://arxiv.org/abs/1801.01118
作者: Hang-Hyun Jo, Takayuki Hiraoka
摘要: 自然现象和社会现象的事件序列中的时间不均一性已经用事件发生时间和事件发生时间之间的相关性来表征。事件之间的不均匀性已经被广泛的研究,而事件之间的相关性,通常被称为相关性爆发,在很大程度上是未知的。为了测量相关突发,建议了两种相关的方法,即记忆系数和突发尺寸分布。实证分析表明,较大的记忆系数倾向于与突发尺寸分布的较重尾部相关联。特别是,人类活动的实证结果显得不一致,记忆系数接近于$ 0 $,而突发尺寸分布遵循幂律。为了理解这些观察,我们导出记忆系数的分析形式作为描述事件间时间和突发大小分布的参数的函数。我们的分析结果可以解释更大的记忆系数与突发尺寸分布的较重尾部相关联的总趋势。我们还发现,人类活动中明显不一致的观察结果是相互兼容的,这表明记忆系数对相关爆发的测量是有限的。
推导复杂网络上稀疏观测扰动的传播路径
原文标题: Inferring propagation paths for sparsely observed perturbations on complex networks
地址: http://arxiv.org/abs/1801.01179
作者: Francesco Alessandro Massucci, Jonathan Wheeler, Raul Beltran-Debon, Jorge Joven, Marta Sales-Pardo, Roger Guimera
摘要: 在一个复杂的系统中,扰动通过系统单元之间的交互网络上的跟随路径传播。与传播流行病相反,一般扰动的观测往往是非常稀疏的(对扰动系统有一个单一的观测),而在“空间”(只观察到一些扰动和不受影响的单位)。从生物学到社会科学的许多领域面临的主要挑战是在这些稀疏性条件下通过观察扰动的影响来推断传播路径。我们解决了这个问题,并且表明可以超越使用连接已知扰动节点的最短路径的通常方法。具体来说,我们展示了一个简单而一般的概率模型,我们使用信念传播来解决,提供了对被扰动的节点概率的快速而准确的估计。
用于验证社区检测算法的模块化网络
原文标题: Modular Networks for Validating Community Detection Algorithms
地址: http://arxiv.org/abs/1801.01229
作者: Justin Fagnan, Afra Abnar, Reihaneh Rabbany, Osmar R. Zaiane
摘要: 我们如何准确比较不同的社区检测算法?这些算法聚集给定网络中的节点,并且其性能通常在具有明确地面真实社区的基准网络上进行验证。鉴于真实世界网络中缺少集群标签,需要一个生成逼真网络的模型来精确评估这些算法。在本文中,我们提出了一个简单,直观,灵活的基准测试生成器来生成用于社区验证的内在模块化网络。我们展示了生成的网络如何严格遵守真实网络观察到的特征。而他们的特点可以直接控制,以匹配广泛的现实世界网络。我们进一步展示了常用的社区检测算法在对这些基准进行评估时与当前可用的替代方法相比排名有何不同
如何战胜科学与影响人:决策者与认知网络的宣传
原文标题: How to Beat Science and Influence People: Policy Makers and Propaganda in Epistemic Networks
地址: http://arxiv.org/abs/1801.01239
作者: James Owen Weatherall, Cailin O'Connor, Justin Bruner
摘要: Naomi Oreskes和Erik Conway在他们最近出版的“怀疑商人”一书中描述了“烟草战略”,烟草业被用来影响政策制定者对烟草制品的健康风险。该战略涉及两部分,包括(1)促进和分享支持行业优先地位的独立研究,(2)资助额外的研究,但有选择地公布结果。我们引入了一个烟草战略的模型,并用它来论证,即使决策者理性地更新了所有可用的证据,策略的两个方面都可以是非常有效的。正如我们所阐述的,这个模型有助于说明烟草战略特别成功的条件。此外,我们还展示了从事“公平”报道的记者如何在不经意间模仿行业对公众信仰的影响。
瓶颈实验的微观旅行时间分析
原文标题: Microscopic Travel Time Analysis of Bottleneck Experiments
地址: http://arxiv.org/abs/1801.01303
作者: Marek Bukáček, Pavel Hrabák, Milan Krbálek
摘要: 这个贡献提供了在瓶颈前行人运动的微观实验研究。在进行的实验中识别个体行人能够解释人群异质性造成的旅行时间的高度变化。一些行人能够在人群中有效地推进,有些则被困在人群中时间更长。这种穿过人群的能力与旅行时间依赖的个体线性模型的斜率与瓶颈前行人的数量相关。通过路线选择进行对这种能力的起源的进一步详细研究,即是绕过人群还是直接穿过人群。研究表明,推动人群的能力是冲突的积极性和超越人群的意愿的组合。
叙述网络
原文标题: Narrating Networks
地址: http://arxiv.org/abs/1801.01322
作者: Liliana Bounegru, Tommaso Venturini (DANTE), Jonathan Gray, Mathieu Jacomy
摘要: 网络已经成为大数据时代的事实图表(尝试搜索谷歌图像[大数据和可视化],看看)。网络的概念已经成为许多人类探究领域的中心,据说可以彻底革新从医学到市场再到军事情报。尽管多年来网络的数学和分析能力已经得到了广泛的研究,但在本文中,我们认为网络的故事可供性已经相对被忽略了。为了解决这个问题,我们使用多模式分析来研究网络在一系列新闻报道中引起的故事。我们制定了一个协议,通过这个协议,可以从网络图像和嵌入的环境中解读叙事的意义,并讨论网络的五种不同的叙述性阅读,并通过对新闻事例的分析来说明。最后,为了支持这一领域的进一步研究,我们讨论了我们所遇到的方法学问题,并提出了未来研究的方向,以便在数字化转向之后推进和扩大视觉文化这一定义方面的研究。
有限存储容量的动态多层网络中的移动性和拥塞
原文标题: Mobility and Congestion in Dynamical Multilayer Networks with Finite Storage Capacity
地址: http://arxiv.org/abs/1801.01332
作者: Sabato Manfredi, Edmondo Di Tucci, Vito Latora
摘要: 多层网络描述了许多真正的互联通信和运输系统,从计算机网络到多模式移动基础设施。在这里,我们引入了一个模型,其中节点在多层网络上移动的代理存储和处理的能力有限,并且它们的拥塞触发了临时故障,这反过来又动态地影响了寻求不拥塞路径的代理的路由。对不同层速度和节点最大容量的网络性能的研究表明,服务代理人数量和到达目的地的时间之间存在微妙的折中。我们提供了最佳缓冲区大小的分析估计,在这个区间内,行程时间最短,并且依赖于不同层的链路的速度和数量。在我们的动态多层装置中观察到了更慢的速度(SIF)效应和Braess'悖论的现象。
在可调节聚类的双层静态 - 动态多路复用网络上,基于边的SIR流行病房间建模
原文标题: Edge-based compartmental modelling of an SIR epidemic on a dual-layer static-dynamic multiplex network with tunable clustering
地址: http://arxiv.org/abs/1801.01337
作者: Rosanna C Barnard, Istvan Z Kiss, Luc Berthouze, Joel C Miller
摘要: 现实世界的人群表现出不同的特征,研究人员开发改进的模型和建模方法,能够捕捉和量化其影响至关重要。其中,连接的持续时间,类型和结构在疾病如何通过人群侵入和传播方面发挥着至关重要的作用。在这里,我们通过考虑双层静态 - 动态多路复用网络,将上述异质性纳入模型。静态网络层提供可调整的集群,并描述个人的永久社区或家庭结构。动态网络层以一个恒定的速率实施边重连,并描述个人与更广泛的人群中的个人之间的短暂连接。我们遵循基于边的房室建模方法来推导描述通过个体的多重网络传播的易感染 - 恢复(SIR)流行过程的时间演变的模型方程,并且我们推导出基本复制数,测量期望的一个感染人群中的一个传染病个体造成新的传染病。我们验证模型方程通过显示收敛到预先存在的基于边界的房室模型方程在极限情况下,并与随机模拟的流行病进行比较。我们探讨改变模型参数和多重网络属性对结果的流行动态的影响。我们通过探索不同的参数设置来重连和感染率,发现模型可以实现的行为体制。我们验证了基本的繁殖数量,通过绘制其数值与相关的最终疫情规模,从模拟测量和模型方程预测一些设置。此外,我们探讨了各种模型参数对基本复制数的影响。
通用网络拆解
原文标题: Generalized Network Dismantling
地址: http://arxiv.org/abs/1801.01357
作者: Xiao-Long Ren, Niels Gleinig, Dirk Helbing, Nino Antulov-Fantulin
摘要: 寻找被删除或禁用的节点集可以阻止(dis)信息的传播,遏制疫情或破坏腐败/犯罪组织的运作,仍然是网络科学面临的主要挑战之一。在本文中,我们介绍广义网络拆除问题,其目的是找到一组节点,当从网络中删除时,导致网络分裂成亚临界网络组件成本最低。对于单位成本,我们的公式等同于标准的网络拆解问题。我们的非单位成本泛化允许包含与节点中心性相关的拓扑成本函数和节点的价格,保护水平甚至社会价值等非拓扑性特征。为了解决这个优化问题,我们提出了一种基于新型节点加权拉普拉斯算子谱特性的方法。该方法适用于具有数百万个节点的大规模网络。它胜过当前最先进的方法,并为理解复杂系统的脆弱性和健壮性打开了新的方向。
关联网络中聚类与度的关系
原文标题: Correlation between clustering and degree in affiliation networks
地址: http://arxiv.org/abs/1801.01521
作者: Mindaugas Bloznelis, Justinas Petuchovas
摘要: 我们感兴趣的是两个随机选择的度数(至少)$ k $的顶点相邻的概率。我们评估一个幂律随机交叉图的概率,其中每个顶点规定了一组属性,并且每当它们共享一个公共属性时,两个顶点相邻。我们证明概率服从比例$ k ^ { - \ delta} $为$ k \ to + \ infty $。我们的结果在数学上是严格的。参数$ 0 \ le \ delta \ le 1 $是由定义顶点和属性之间的链接的幂律随机权重的尾索引确定的。
从社交媒体数据中检测交通事故的深度学习方法
原文标题: A deep learning approach for detecting traffic accidents from social media data
地址: http://arxiv.org/abs/1801.01528
作者: Zhenhua Zhang, Qing Heb, Jing Gao, Ming Ni
摘要: 本文采用深度学习技术从社交媒体数据中检测交通事故。首先,我们深入调查了两个大都市地区的1年超过300万鸣叫内容:北弗吉尼亚州和纽约市。我们的研究结果表明,成对的令牌可以捕捉事故相关推文中固有的关联规则,进一步提高交通事故检测的准确性。其次,深入研究深度信息网络(DBN)和长期短期记忆(LSTM)两种深度学习方法。结果显示,DBN可以获得大约44个单独的令牌特征和17个配对令牌特征的85%的总体准确度。 DBN的分类结果优于支持向量机(SVM)和监督潜在狄利克雷分配(sLDA)。最后,为了验证这项研究,我们将事故相关推文与高速公路上的交通事故记录和来自15,000个回路探测器的当地道路交通数据进行比较。发现有近66%的事故相关推文可以通过事故记录找到,其中80%以上可以与附近的异常交通数据绑定。通过比较包括位置和时间偏差,以及有影响力的用户和主题标签的特点,提出了使用Twitter检测交通事故的几个重要问题。
用设计的拉普拉斯谱对网络动力学进行功能控制
原文标题: Functional control of network dynamics using designed Laplacian spectra
地址: http://arxiv.org/abs/1801.01573
作者: Aden Forrow, Francis G. Woodhouse, Jörn Dunkel
摘要: 可以通过动态网络模型高效地描述从航空和互联网流量到电子和基因调控电路中的信号传播等各种规模的复杂现实世界现象。在许多这样的系统中,底层图拉普拉斯算子的谱在控制事物或信息流中起着关键作用。谱图论传统上将未加权的网络放在优先位置。在这里,我们介绍一个补充框架,提供一个精确的数学严格的加权图结构,实现任何所需的谱。我们通过展示设计师谱如何被用来控制各种原型物理系统的动力学来说明这种方法的广泛适用性。具体而言,我们证明了在Kuramoto型振荡器网络中的战略位置差距诱导嵌合状态,完全抑制了通用Swift-Hohenberg模型中的模式形成,并导致在离散的Gross-Pitaevskii量子网络中持续定位。我们的方法可以推广到通过有限网络的周期性扩展来设计连续带隙。
基于本体的社会大数据语义数据提取方法:最新进展和研究方向
原文标题: Ontology-based Approach for Semantic Data Extraction from Social Big Data: State-of-the-art and Research Directions
地址: http://arxiv.org/abs/1801.01624
作者: Pornpit Wongthontham, Bilal Abu-Salih
摘要: 管理和从社交媒体数据源中提取有用知识的挑战已经引起了学术界和工业界的广泛关注。为了解决这个挑战,本文重点研究了文本数据的语义分析。我们提出一种基于本体的方法来提取文本数据的语义并定义数据域。换句话说,我们在语义上分析了两个层次的社会数据,即实体层面和领域层面。我们选择Twitter作为社交渠道挑战,以达到概念证明的目的。领域知识被捕获在本体中,然后用于丰富提供了在推特中出现的实体的特定语义概念表示的推文的语义。案例研究被用来证明这种方法。我们用从Twitter和政治领域收集的公共数据集来实验和评估我们提出的方法。基于本体的方法在概念识别的数量和准确性方面利用了实体提取和概念映射。
社交媒体上的政治话语:回声室、守门人和两党制的代价
原文标题: Political Discourse on Social Media: Echo Chambers, Gatekeepers, and the Price of Bipartisanship
地址: http://arxiv.org/abs/1801.01665
作者: Kiran Garimella, Gianmarco De Francisci Morales, Aristides Gionis, Michael Mathioudakis
摘要: 回声分庭,即只暴露与自己意见相一致的意见的情况,是许多民主国家政治话语越来越关注的问题。本文研究社交媒体上的政治回声室现象。我们确定这个现象的两个组成部分:共享的观点(“回声”)和允许其暴露的地方(“分庭” - 社会网络),并仔细研究这两个组成部分如何相互作用。我们为社交媒体用户定义了一个生产和消费的衡量标准,体现了他们共享和接受的内容的政治倾向。通过比较两者,我们发现Twitter用户在很大程度上接触到与自己相符的政治观点。我们还发现,试图通过分享内容多元化的方式来弥合回声分庭的用户,在网络中心性和内容升值方面,必须付出“两党合一的代价”。此外,我们还研究了“看门人”的角色,他们是消费内容多样化,但产生党派内容(单边倾向)的用户,形成回音室。最后,我们将这些发现应用于从社交和内容特征预测党羽和守门人的任务。虽然党派用户相对容易识别,但守门人证明是更具挑战性的。
谱图伪造:图生成目标模块化
原文标题: Spectral Graph Forge: Graph Generation Targeting Modularity
地址: http://arxiv.org/abs/1801.01715
作者: Luca Baldesi, Athina Markopoulou, Carter T. Butts
摘要: 社区结构是捕捉大型网络中常见的不均匀性的重要属性,模块化是这种社区结构最广泛使用的指标之一。在本文中,我们介绍了一个原则性的方法,谱图成,用于生成随机图,从模块性角度来看,从一个真实感兴趣的网络保存社区结构。我们的方法利用了这样的事实,即图的矩阵表示的谱结构编码关于社区结构的全局信息。谱图伪造使用模块化矩阵的低秩近似来生成合成图,其在用户可选择的准确度内匹配目标模块性,同时允许结构的其他方面改变。我们表明,谱图伪造在针对实现的模块性和随机性的准确性方面优于最先进的技术,同时还保留其他局部结构性质和节点属性。我们讨论Spectral Graph Forge的扩展,目标是模块化以外的其他属性,以及它的应用到匿名化。
屏蔽Google的语言毒性模型以对抗攻击
原文标题: Shielding Google's language toxicity model against adversarial attacks
地址: http://arxiv.org/abs/1801.01828
作者: Nestor Rodriguez, Sergio Rojas-Galeano
摘要: 网络社区缺乏适度的参与,使得参与者在当代后真理政治情景中遭受到极端主义激演化所强化的个人侵略,骚扰或网络欺凌。这种敌意通常通过有毒的语言,亵渎或辱骂的言论来表达。最近,Google开发了一种基于机器学习的毒性模型,试图评估评论的敌意;不幸的是,有人提出,可以通过操纵评论的文本序列的对抗性攻击来欺骗所述模型。在本文中,我们首先将这种敌对攻击描述为使用混淆和极性转换。前者通过印刷编辑破坏有毒触发内容来欺骗,而后者则通过语法上否定有毒内容而蒙骗。然后,我们提出了一个两阶段的方法来反击这些异常,建立在最近提出的文本去混淆方法和毒性评分模型。最后,我们进行了大约24000个扭曲的评论的实验,显示如何以这种方式恢复敌对变体的毒性,同时使处理时间大致增加两倍。尽管来自书面语言的多样化本质的新的对手挑战将不断涌现,但我们预计将需要结合机器学习和文本模式识别方法的技术,每种技术都针对不同层次的语言特征,以实现有毒语言的强大检测从而促进无侵略的数字互动。
政治腐败网络的动力结构
原文标题: The dynamical structure of political corruption networks
地址: http://arxiv.org/abs/1801.01869
作者: Haroldo V. Ribeiro, Luiz G. A. Alves, Alvaro F. Martins, Ervin K. Lenzi, Matjaz Perc
摘要: 政治中的腐败行为限制了经济增长,贪污公共资金,促进了现代民主国家的社会经济不平等。我们分析了过去27年来巴西政治腐败丑闻的记录,重点介绍了两个人如果涉及同一丑闻的网络的动态结构。我们的研究表明,腐败是由很少有八人以上的小团体组成的,网络中有中心和模块化结构,包含多起腐败丑闻。我们观察到最大的连接成分和程度分布的大小突然变化,这是由于新丑闻曝光或政府变化时不同模块的聚合。我们进一步表明,政治腐败网络的动态结构可以用来成功预测未来丑闻中的伙伴。我们讨论网络科学在侦测和缓解政治腐败中的重要作用。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。