- 扩散协议控制级联增长吗?;
- 通过标签传播检验节点属性与网络结构的对齐;
- Twitter上的政治讨论和倾向:2016年意大利宪法公民投票;
- 通过智能设备之间的通信减少电网波动;
- 闭环游走采样器:一种估计大图特征值的有效方法;
- 异构图的半监督学习及其在Facebook新闻馈送中的应用;
- 宗派冲突中激进化的双稳态信念动力学模型;
- 纳入网络循环结构以改善社区检测的新方法;
- 足球比赛中编队的分类算法;
- 你喜欢我喜欢的东西吗?基于接近度的移动社会网络的相似性估计;
- 解剖信任网络:比特币场外交易市场;
- 探索与控制结构的规则性:网络重构的视角;
- 停电统计的负荷依赖性;
- 极化排名:Facebook上欧洲新闻研究;
- 女性稍微比男性更合作一点(在线单次囚徒困境博弈);
- Delaunay三角剖分的度分布;
- “您知道该怎么做”:主动侦测以协调仇恨攻击为目标的YouTube视频;
扩散协议控制级联增长吗?
原文标题: Do Diffusion Protocols Govern Cascade Growth?
地址: http://arxiv.org/abs/1805.07368
作者: Justin Cheng, Jon Kleinberg, Jure Leskovec, David Liben-Nowell, Bogdan State, Karthik Subbian, Lada Adamic
摘要: 随着人们彼此分享信息,大型瀑布可以在在线社会网络中发展。虽然简单的转载级联已被广泛研究,但社交媒体上的各种级联行为更为多样化。在这里,我们研究扩散协议或使信息传输的社会交换如何影响级联增长,类似于通信协议定义信息如何从一个点传输到另一个点的方式。在Facebook上研究98个最大的信息级联,我们发现了各种各样的扩散协议 - 从图像的级联转换,使用一个简单的协议,点击一个按钮传播,到ALS冰桶挑战,其扩散协议涉及个人创建并发布视频,然后提名特定的其他人也这样做。我们发现了重复使用的扩散协议类型,并在这些协议的构建中确定了两个关键的平衡因素,并对级联的增长产生了影响:参与级联所需的努力和留在场外的社会成本。需要更多个人努力的协议减缓了级联的传播,而那些不参与的社会成本更高的协议会增加级联的采用可能性。传播的可预测性也随着协议而变化。但不管机制如何,我们分析中的级联都有相似的复制数量($ \约1.8美元),这意味着更低的暴露率可以通过采用更高的每次暴露率来抵消。最后,我们展示级联的结构不仅可以区分这些协议,还可以通过分支进程建模。总之,这些发现提供了一个框架,用于理解各种信息级联如何在整个网络中实现大量采用。
通过标签传播检验节点属性与网络结构的对齐
原文标题: Testing Alignment of Node Attributes with Network Structure Through Label Propagation
地址: http://arxiv.org/abs/1805.07375
作者: Natalie Stanley, Marc Niethammer, Peter J. Mucha
摘要: 归因于网络数据在各个领域越来越普遍,因为我们除了配对连接模式之外还经常配备有关节点的信息。这些额外的信息可以表现为分类,或者作为特征的多维向量。最近开发的试图将社区检测方法扩展到归属网络的方法探索了如何最有效地将连接性和属性信息组合起来以识别优质社区。这些方法通常依赖于对属性和连接性之间的依赖关系的一些假设。在这项工作中,我们试图开发一个统计测试来评估节点属性是否与网络连接一致。目标是定量评估具有相似连接模式的节点是否也具有相似的属性。为了解决这个问题,我们使用节点采样和标签传播方法。我们将我们的方法应用于几个综合例子,探索网络结构和属性特征如何影响我们的方法计算的经验p值。最后,我们将测试应用于由单细胞质量流式细胞仪(CyTOF)数据集生成的网络,并且显示我们的测试可以鉴定与单个细胞的不同亚群相关联的标记。
Twitter上的政治讨论和倾向:2016年意大利宪法公民投票
原文标题: Political Discussion and Leanings on Twitter: the 2016 Italian Constitutional Referendum
地址: http://arxiv.org/abs/1805.07388
作者: Jacopo Bindi, Davide Colombi, Flavio Iannelli, Nicola Politi, Michele Sugarelli, Raffaele Tavarone, Enrico Ubaldi
摘要: 最近提供的在线人类活动的大型高分辨率数据集使人们能够以前所未有的准确度对人类相互作用进行研究和描述。为此,已经提出了许多努力来理解人们在对某个话题发表意见时如何分享和检索信息。具体而言,基于其在线活动检测到个人的政治倾向可以支持预测特定人群的意见趋势。在这里,我们结合了复杂的网络理论和机器学习技术来解决这个具有挑战性的任务具体而言,我们从一系列超过600万条推文开始,对2016年12月举行的关于宪法公民投票的意大利在线政治辩论的结构和动态进行了描述。我们分析了不同政治社群之间的讨论模式并描述了联系人网络在其中。此外,我们建立了一个程序来推断意大利Twitter用户的政治倾向,这使我们能够准确地重建官方民意调查给出的总体意见趋势(皮尔逊的r = 0.88),并且准确预测意大利的最终结果公投。我们的研究通过情绪分析提供了对意大利在线政治讨论的大规模审查,从而为未来在线政治辩论建模研究奠定了基础。
通过智能设备之间的通信减少电网波动
原文标题: Reduction of power grid fluctuations by communication between smart devices
地址: http://arxiv.org/abs/1805.07432
作者: Eder Batista Tchawou Tchuisseu, Damià Gomila, Pere Colet
摘要: 电力需求的增加和可再生能源的逐步整合威胁到电网的稳定。为了解决这个问题,已经提出了几种方法来控制需求侧而不是增加供应侧的旋转储备。在这里,我们关注动态需求控制(DDC),即电器频率超出适当范围时,家用电器可以延迟其预定运行的方法。我们最近表明,DDC有效地减少了中小尺寸的频率波动,但由于需要恢复未完成的任务,需求高峰的可能性以及频率大幅波动可能实际上会增加。虽然这些事件非常罕见,但它们可能会引发系统故障,因此必须解决避免它们的策略。在这项工作中,我们介绍了一种新方法,包括属于给定组的DDC设备之间的通信,以便它们可以协调相反的操作以保持组的需求更加稳定。我们表明,对于这种方法,未完成任务的数量减少了10倍,而频率大幅波动明显减少甚至完全避免。
闭环游走采样器:一种估计大图特征值的有效方法
原文标题: Closed Walk Sampler: An Efficient Method for Estimating Eigenvalues of Large Graphs
地址: http://arxiv.org/abs/1805.07448
作者: Guyue Han, Harish Sethu
摘要: 由于图的特征值与图的许多重要属性相关,包括网络弹性,社区检测和病毒传播的速度,因此图的特征值对于大数据的图分析具有高度的兴趣。精确计算极大图的特征值通常是不可行的,这是由于计算和存储成本过高以及许多社会网络图的完全访问通常仅限于大多数研究人员。在本文中,我们提出了一系列新的采样算法,它们解决了上述两个问题,并且有效且高精度地估计了大图的两个最大特征值。与以前的方法试图提取具有最大影响力的节点的子图不同,我们的算法通过简单的随机游走仅对大图的一小部分进行采样,并通过估计一个最大特征值的估计来估计两个最大特征值一定的长度。我们使用实际图的实验结果表明,我们的算法速度大幅提高,同时在大多数图上的准确度明显高于当前最先进的算法。
异构图的半监督学习及其在Facebook新闻馈送中的应用
原文标题: Semisupervised Learning on Heterogeneous Graphs and its Applications to Facebook News Feed
地址: http://arxiv.org/abs/1805.07479
作者: Cheng Ju, James Li, Bram Wasti, Shengbo Guo
摘要: 基于图的半监督学习是一个基本的机器学习问题,并且已经得到很好的研究。大多数研究集中在同质网络(例如引文网络,朋友网络)。在本文中,我们提出异构嵌入标签传播(HELP)算法,一种基于图的半监督深度学习算法,用于以异构节点类型为特征的图。从经验上讲,我们证明了这种方法在使用Facebook用户域交互图的域分类任务中的有效性,并比较了所提出的HELP算法与最先进算法的性能。我们显示HELP算法提高了跨多个任务的预测性能,以及对下游分类或回归任务具有区别性的语义上有意义的嵌入。
宗派冲突中激进化的双稳态信念动力学模型
原文标题: A bistable belief dynamics model for radicalization within sectarian conflict
地址: http://arxiv.org/abs/1805.07480
作者: Yao-Li Chuang, Maria R. D'Orsogna, Tom Chou
摘要: 我们引入一个双变量模型来描述空间极化,激演化和冲突。模型中的个体具有连续的信念变量以及离散的激演化水平,表达他们对具有不同信仰的邻居的宽容度。我们模型的一个新特点是它结合了一个双稳态的激进化过程来解决记忆相关的社会行为。我们证明双稳态激演化可能解释关于社会隔离是加剧还是缓解冲突的矛盾观察。我们还通过引入一种机制来扩大我们的模式,包括宣传或教育等机构影响力,并检查其有效性。在一些参数制度中,制度影响可能会抑制激演化的进展,并使人口随着时间的推移实现社会整合。在其他情况下,机构干预可能会通过混合信仰人口加剧激演化的蔓延。在这种情况下,我们的分析意味着社会隔离可能是反对宗派冲突的可行选择。
纳入网络循环结构以改善社区检测的新方法
原文标题: New methods for incorporating network cyclic structures to improve community detection
地址: http://arxiv.org/abs/1805.07484
作者: Behnaz Moradi, Heman Shakeri, Pietro Poggi-Corradini, Michael Higgins
摘要: 网络中社区的一个显著特点是社区内的循环比社区更普遍。因此,通过使用循环结构的局部“丰富性”的措施可以帮助检测这些群落。我们调查使用两种方法来量化这种丰富度 - 环路模数(LM)和更新非回溯随机游走(RNBRW)---以改善现有社区检测算法的性能。 LM解决了一个二次程序,以找到跨周期的边使用的最佳分配,以最小化周期重叠,从而提供了一种量化边重要性的严格方法。在本文中首次引入的RNBRW将边重要性量化为边在非回溯随机游走中完成周期的可能性。我们认为RNBRW为LM提供了一种高效且可扩展的替代方案。我们给出的仿真结果表明,通过所提出的方法预加权边可以大大提高流行社区检测算法的性能。我们的方法对于检测稀疏图中社区的具有挑战性的案例特别有效。
足球比赛中编队的分类算法
原文标题: Classification algorithm for formations in football games
地址: http://arxiv.org/abs/1805.07525
作者: Takuma Narizuka, Yoshihiro Yamazaki
摘要: 本文为团队运动中的编队开发了一种分类算法,重点是足球比赛。我们的方法首先将地层分成几个平均地层:“424”,“4141”,“433”,“541”和“343”。然后,每个平均队形被进一步分成更具体的模式,其中球员的配置略有不同。后一步是基于层次聚类和Delaunay方法,Delaunay方法将团队的形成定义为Delaunay三角网的邻接矩阵。用我们的方法分类的地层以诸如“424-C1”的形式表示。
你喜欢我喜欢的东西吗?基于接近度的移动社会网络的相似性估计
原文标题: Do You Like What I Like? Similarity Estimation in Proximity-based Mobile Social Networks
地址: http://arxiv.org/abs/1805.07651
作者: Felix Beierle
摘要: 尽管现有的社会网络服务倾向于将认识的人联系起来,但人们也表现出希望在物理上接近与未知的人联系的愿望。现有的研究表明,人们倾向于联系到类似的人。利用技术来激发陌生人之间的人际交往,我们考虑两个陌生人会面的场景。在音乐趣味相似性的例子中,我们针对基于邻近的移动社会网络中的相似性估计问题开发了解决方案。我们表明,两个设备之间的概率数据结构的单个交换可以精确地估计两个用户的相似度 - 而不需要联系第三方服务器。我们引入了用于两个Dice系数的快速和空间高效近似的度量multisets - 基于两个Counting Bloom Filters或两个Count-Min草图的比较。我们的分析表明,在比较这些概率数据结构时,利用单个散列函数可以最大限度地减少错误。应为数据结构选择的大小取决于预期的唯一输入元素的平均数量。使用真实的用户数据,我们显示具有单个散列函数和128的长度的Counting Bloom Filter足以准确估计表示两个用户的音乐品味的两个多重集之间的相似性。我们的方法适用于任何其他表示为多重频率的其他频率的相似性估计。
解剖信任网络:比特币场外交易市场
原文标题: The anatomy of a Web of Trust: the Bitcoin-OTC market
地址: http://arxiv.org/abs/1805.07667
作者: Ilaria Bertazzi, Sylvie Huet, Guillaume Deffuant, Floriana Gargiulo
摘要: 比特币otc是一个点对点(非柜台)市场,用于比特币加密货币交易。为了减轻p2p无监督交换的风险,需要建立可靠的信誉系统:因此,网站上实施了一个信任网络。所有历史用户交互数据的可用性使得该数据集成为通过其他评估来研究声誉动态的独特场所。我们用多层网络方法分析这种信任网络的结构和动态,区分奖励和惩罚性行为。我们表明奖励和惩罚性行为具有相似的紧急拓扑性质(除了奖励层的聚类系数更高)以及由此产生的声誉源自层上更规则行为的复杂交互。我们显示哪些是与声誉相关(即奖励活动)或不相关(即惩罚性活动)的行为。我们表明,网络活动在两个层次上呈现突发行为,并且随着网络演进,不平等达到稳定值(对于奖励层而言更高)。最后,我们描述声誉轨迹,并确定与三类用户相关的原型行为:可信,不可信和有争议。
探索与控制结构的规则性:网络重构的视角
原文标题: Structural Regularity Exploring and Controlling: A Network Reconstruction Perspective
地址: http://arxiv.org/abs/1805.07746
作者: Tao Wu, Shaojie Qiao, Wei Wang, Xingping Xian
摘要: 无处不在的复杂网络通常由规则和不规则的组成部分组成,这使得揭示网络结构的复杂性成为网络科学的根本挑战。探索网络组织中常规信息和识别微观要素的作用可以帮助从业人员认识到网络形成的普遍原理并促进网络数据挖掘。尽管已经提出了许多用于链路预测和网络重构的算法,估计和调整了网络重建的可重构性复杂的网络仍然是一个未充分探讨的问题。在网络的局部结构和相应的邻接矩阵之间具有一致性的实际假设近似于低秩的情况下,我们获得了一种自我表示网络模型,其中网络的组织原理被表示矩阵捕获。根据该模型,原始网络可以根据观测结构进行重构。更重要的是,该模型使我们能够估计网络可调整的程度,换句话说,衡量复杂网络的可重构性。此外,该模型使我们能够衡量网络链接对于网络规则性的重要性,从而使我们能够规范网络的可重构性。在不同网络上的广泛实验证明了所提出的算法和度量的有效性。具体而言,结构规律性反映了网络的可重构性,通过删除与特定算法无关的不规则网络链路,可以提高重构精度。
停电统计的负荷依赖性
原文标题: Load Dependence of Power Outage Statistics
地址: http://arxiv.org/abs/1805.07792
作者: Soumyajyoti Biswas, Lucas Goehring
摘要: 显示停电的大小分布取决于应力,或电网的负载接近以完成故障。使用2002-2017年间美国的数据,我们表明,中断统计数据取决于一天中的不同时段和一年中的月份的使用情况。在更高的负载下,不仅可能出现更多故障,而且故障大小的分布也会发生变化,以支持更大的事件。在更精细的空间尺度上,美国不同地区的停电统计可以表现出不同的使用情况(负荷)变化。反过来,对应于这些地区对较大或较小失败的偏见。我们提供了一个简单的模型,使用逼真的网格拓扑,但它仍然可以将偏差表示为应用负载的函数,就像数据一样。如果有足够的小规模事件数据,该方法可用于识别大面积停电前的电网脆弱区域。
极化排名:Facebook上欧洲新闻研究
原文标题: Polarization Rank: A Study on European News Consumption on Facebook
地址: http://arxiv.org/abs/1805.08030
作者: Ana Lucía Schmidt, Fabiana Zollo, Antonio Scala, Walter Quattrociocchi
摘要: WWW的出现改变了我们制作和访问信息的方式。最近的研究表明,用户倾向于选择与他们的信仰系统相一致的信息,围绕共同的叙述形成了志同道合的人群的两极分化群体,其中不同意见的信息被忽略。在这种环境下,用户通过合作来构建和加强他们的共享叙述,使任何揭穿无效的尝试成为可能。这种配置甚至发生在网上新闻的消费中,并且考虑到63%的用户直接从社交媒体获取新闻,一种假设是更多的偏振允许误传的进一步传播。沿着这条道路,我们专注于欧洲不同国家(意大利,法国,西班牙和德国)在脸书新闻媒体上围绕用户的两极分化。首先,我们比较各个国家/地区的发布行为和用户互动模式,并观察不同的发布,喜好和评论率。其次,我们探索用户与不同页面交互的趋势(即选择性曝光)以及围绕特定页面生成的极化社区的出现。然后,我们引入一个新的度量标准 - 即极化等级 - 来衡量每个国家社区的两极分化情况。我们发现意大利是最分化的国家,其次是法国,德国,最后是西班牙。最后,我们通过考虑用户对新闻的参与度和对新闻的信任,提出了有界置信模型的变体,以模拟这些社区的出现。我们的研究结果表明,信息广播公司对网络用户的两极分化起着举足轻重的作用。
女性稍微比男性更合作一点(在线单次囚徒困境博弈)
原文标题: Women are slightly more cooperative than men (in one-shot Prisoner's dilemma games played online)
地址: http://arxiv.org/abs/1805.08046
作者: Valerio Capraro
摘要: 男女之间的差异引起了一代又一代社会科学家的兴趣,他们发现两性在需要竞争,冒险,利他主义,诚实以及其他许多方面的行为不同。然而,对合作行为是否存在性别差异知之甚少。以前的证据是混合的,没有定论。在这里,我通过分析我的研究小组自2013年以来进行的所有研究,阐明了这个话题。这是一个来自7,322名来自美国的男性和女性的10,951个观察数据集,通过Amazon Mechanical Turk招募,并且通过了四位理解问题,以确保他们理解合作问题(一次性囚徒困境)。分析表明,女性比男性更合作。效应规模很小(约4个百分点,这也许可以解释为什么以前的研究未能发现它),但具有非常显著性(p <.0001)。
Delaunay三角剖分的度分布
原文标题: Degree Distribution of Delaunay Triangulations
地址: http://arxiv.org/abs/1805.08063
作者: Gang Mei, Nengxiong Xu, Salvatore Cuomo
摘要: Delaunay三角剖分可以被认为是一种复杂的网络。对于复杂的网络,度分布是最重要的固有特征之一。在本文中,我们首先将二维和三维Delaunay三角网(DT)视为一种复杂网络,并将其称为DT网络。然后我们统计调查DT网络的程度分布。我们发现DT网络的度分布在大多数情况下都遵循高斯分布,这与知名的小世界网络和无标度网络的泊松分布和幂律分布不同。
“您知道该怎么做”:主动侦测以协调仇恨攻击为目标的YouTube视频
原文标题: "You Know What to Do": Proactive Detection of YouTube Videos Targeted by Coordinated Hate Attacks
地址: http://arxiv.org/abs/1805.08168
作者: Enrico Mariconti, Guillermo Suarez-Tangil, Jeremy Blackburn, Emiliano De Cristofaro, Nicolas Kourtellis, Ilias Leontiadis, Jordi Luque Serrano, Gianluca Stringhini
摘要: 多年来,网络缩小了世界,允许个人与现实生活中的人分享更多的观点。然而,与此同时,它也使反社会和毒性行为以前所未有的规模发生。 YouTube等视频共享平台接收来自数百万用户的上传内容,涵盖各种主题,并允许其他人评论和互动。不幸的是,这些社区经常受到侵略和仇恨袭击的困扰。特别是最近的工作表明,这些攻击经常是由于“突袭”而发生的,即由第三方社区的特殊暴徒协调组织的努力。尽管这种现象越来越重要,但在线服务往往缺乏有效的对策来减轻这种现象。与诸如垃圾邮件和网络钓鱼等经过深入研究的问题不同,协调攻击性行为既是目标攻击行为,也是人类犯下的攻击行为,这使得寻找自动化活动的防御机制不适用。因此,事实上的解决方案是反应性地依赖于用户报告和人类评论。在本文中,我们提出了一种自动化解决方案来识别可能成为协调骚扰者目标的视频。首先,我们根据袭击受害者的地面实况数据集对多个坐标轴(元数据,音频记录,缩略图)的YouTube视频进行分类和建模。然后,我们使用分类器集合来确定以高准确度(AUC高达94%)扫描视频的可能性。总体而言,我们的工作为YouTube等视频平台提供主动式系统以检测和缓解协调的仇恨攻击铺平了道路。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。