- 新颖、破坏性和科学影响力的演化;
- 从高技能劳动力流网络的角度揭示高科技产业集聚中的空间溢出效应;
- 有向和标签网络中的模体驱动的稠密子图发现;
- 网络拓扑对信用网络通量的影响;
- 时间粒度对基础设施和业务网络的系统仿真中的扰动传播影响;
- 通过推断交互链接在社交媒体中找到高度协调的社区的一般方法;
- 探索流式社交媒体数据变化对社会网络分析的影响;
- 单纯复形上的演化博弈;
- 差分隐私模型下的中心性度量分析;
- 网络社区政治新闻讨论与共享的多平台分析;
- 高阶结构上的社会传染;
- 表征Twitter用户的不同社区:移民和本地人;
- 使用卷积神经网络归类新闻媒体中的自杀;
- 使用双网分析器从双网中提取社区;
- 匹配算法:基本原理,应用和挑战;
新颖、破坏性和科学影响力的演化
原文标题: Novelty, Disruption, and the Evolution of Scientific Impact
地址: http://arxiv.org/abs/2103.03398
作者: Yiling Lin (University of Chicago, University of Pittsburgh), James Allen Evans (University of Chicago), Lingfei Wu (University of Pittsburgh)
摘要: 自1950年代以来,引文影响一直是科学定量评估的主要指标。但是,研究贡献在不断展开的科学辩论,共识和进步中扮演着不同的角色,并且机构可能会重视不同种类的进步。计算能力,对引文数据的访问以及一系列建模技术已经引起了越来越多的度量标准组合,以提取有关其贡献的不同信号。在这里,我们探讨了引文影响与新颖性和破坏之间复杂,随时间变化的关系,这是两个新兴的衡量指标,它们反映了科学不仅影响并改变以后的工作的程度。新奇性抓住了研究如何利用先前工作的不同寻常组合的特点。颠覆性抓住了研究如何使它之前建立的工作黯然失色的趋势,被公认为是新的科学方向。我们证明:1)新颖的论文破坏了现有的理论并扩大了科学前沿; 2)从长远来看,新颖的论文更有可能成为“沉睡中的美女”并积累被引用的影响; 3)可以将新颖性重新定义为期刊嵌入空间中的距离,以绘制科学的动态边界。随着时间的推移,嵌入空间的演变揭示了昨天的新颖性如何形成当今的科学惯例,从而制约了明天突破的新颖性和惊奇性。
从高技能劳动力流网络的角度揭示高科技产业集聚中的空间溢出效应
原文标题: Revealing spatial spillover effect in high-tech industry agglomeration from a high-skilled labor flow network perspective
地址: http://arxiv.org/abs/2103.03486
作者: Chen Wang, Lu Wang, Yanbo Xue, Ruiqi Li
摘要: 从空间溢出的角度理解高科技产业集聚对于城市获得经济和技术竞争优势至关重要。随着快速的城市化和快速交通网络的发展,城市之间的社会经济互动一直在增加,传统的空间度量还不足以描述实际的城市间联系。城市之间的高技能劳动力流动对高科技产业集聚有很大影响,但受到的关注却较少。通过利用复杂网络和数据挖掘中独特的大规模数据集和工具,我们构建了一个城市间高技能劳动力流网络,该网络已集成到空间计量经济模型中。我们的回归结果表明,长江三角洲城市群地区高科技产业的发展中存在空间溢出效应。此外,在高技能劳动力流动量较大的城市中,空间溢出效应要比在地理联系更强的城市中更强。此外,我们调查了溢出效应的渠道,发现地方政府在科学和技术上的支出不足可能会阻碍高科技产业集聚,地方教育提供的不足也会受到阻碍。由于对传统产业的政策惯性,在一个城市增加的外国直接投资可能会鼓励其他城市的高科技产业集聚。
有向和标签网络中的模体驱动的稠密子图发现
原文标题: Motif-driven Dense Subgraph Discovery in Directed and Labeled Networks
地址: http://arxiv.org/abs/2103.03374
作者: Ahmet Erdem Sariyuce
摘要: 网络中的密集区域是有趣和不寻常信息的指示。但是,大多数现有方法仅考虑简单,无向,无权的网络。但是,现实世界中的复杂网络通常具有丰富的信息:边不对称,并且节点/边具有分类和数值属性。根据这些丰富的信息在此类网络中查找密集的子图是许多应用程序中的重要问题。此外,大多数现有算法忽略了节点之间的高阶关系(即,主题)。母题被证明对发现密集的子图很有帮助,但是它们在异构网络中的广谱性使其难以有效利用。在这项工作中,我们提出了夸克分解框架来定位富含给定基序的密集子图。我们专注于在节点/边具有有向边和分类属性的网络。对于给定的主题,我们的框架以变化的质量和层次关系构建子图,称为夸克。我们的框架是通用,高效和可扩展的。我们讨论了我们框架的局限性和实际实例,以及在有向网络中需要考虑的角色混淆问题。我们对有向,有向标和节点标记的网络中的框架进行了广泛的评估。我们考虑了各种模体,并使用多个实际网络评估了夸克分解。结果表明,夸克分解的性能优于最新技术。我们的框架也很实用,并且可以扩展到具有101M边的网络。
网络拓扑对信用网络通量的影响
原文标题: The Effect of Network Topology on Credit Network Throughput
地址: http://arxiv.org/abs/2103.03288
作者: Vibhaalakshmi Sivaraman, Weizhao Tang, Shaileshh Bojja Venkatakrishnan, Giulia Fanti, Mohammad Alizadeh
摘要: 信用网络依靠分散的,成对的信任关系(渠道)来交换金钱或商品。信用网络在许多金融系统中自然而然地出现,包括最近在区块链系统中构建的支付渠道网络。这些网络的重要性能指标是它们的事务吞吐量。但是,预测信用网络的吞吐量并非易事。与传统的沟通渠道不同,信用渠道可能会变得不平衡。一旦达到信用额度,他们将无法在给定的方向上支持更多交易。这种不平衡的可能性在网络的吞吐量及其拓扑,路径选择以及每个通道上的信用余额(状态)之间造成了复杂的依赖关系。更糟糕的是,这些因素的某些组合可能导致信贷网络陷入僵局,在僵局中,任何交易都无法取得进展。在本文中,我们研究了信用网络的吞吐量与其拓扑和信用状态之间的关系。我们表明,死锁的存在完全说明了网络对不同信用状态的吞吐量敏感性。尽管我们证明了识别任意拓扑中的死锁是NP困难的,但我们还是提出了一种剥皮算法,该算法的灵感来自于擦除代码的解码算法,从而使死锁的严重性达到了上限。我们使用剥离算法作为一种工具来比较随机拓扑的性能,并有助于对死锁鲁棒的拓扑进行综合。
时间粒度对基础设施和业务网络的系统仿真中的扰动传播影响
原文标题: Time granularity impact on propagation of disruptions in a system-of-systems simulation of infrastructure and business networks
地址: http://arxiv.org/abs/2103.03247
作者: Mateusz Iwo Dubaniowski, Hans Rudolf Heinimann
摘要: 系统级(SoS)方法通常用于模拟对业务和基础架构系统网络的破坏,从而允许将多个模型集成到一个模拟中。但是,由于每个系统都是根据不同的特性(例如时间粒度)单独设计的,因此集成常常面临挑战。理解时间粒度对业务和基础架构系统之间中断传播的影响,以及为SoS仿真找到合适的粒度仍然是主要挑战。为理解决这些问题,我们探索了时间粒度,恢复时间和中断大小如何影响SoS仿真的组成系统之间中断的传播。为理解决此问题,我们开发了3个网络的高级体系结构(HLA)仿真,并进行了一系列仿真实验。我们的结果表明,时间粒度,尤其是恢复时间,对中断的传播具有巨大影响。因此,我们开发了一个模型,用于根据预期的恢复时间为SoS仿真选择合适的时间粒度。我们的模拟实验表明,时间粒度应小于预期恢复时间的1.13。我们确定了一些未来的研究领域,围绕扩展实验因素空间展开。
通过推断交互链接在社交媒体中找到高度协调的社区的一般方法
原文标题: A General Method to Find Highly Coordinating Communities in Social Media through Inferred Interaction Links
地址: http://arxiv.org/abs/2103.03409
作者: Derek Weber, Frank Neumann
摘要: 政治错误信息,捣乱和有组织的拖钓是具有重大现实影响的在线恶意行为。先前许多研究这些现象的方法都集中在广泛的运动上,而不是负责煽动或维持这种运动的小团体。为了揭示合作帐户的潜在(即隐藏)网络,我们提出了一种新颖的时间窗口方法,该方法仅依赖于帐户交互和元数据。它检测参与各种行为的帐户组,这些帐户一起执行不同的基于目标的策略,我们将描述其中的许多策略。该方法依赖于从社交媒体帖子中提取相关元素的管道,根据与协调策略相匹配的标准推断帐户之间的联系,以建立无向加权帐户网络,然后将其挖掘出来,以显示具有高水平协调证据的社区使用新颖的社区提取方法。我们通过使用开窗机制来解决数据的时间方面,该机制可能适用于近实时应用。我们还将进一步强调与多个窗口上的滑动框保持一致的协调以及衰减因子的应用。我们的方法与其他近期类似的处理方法和社区检测方法进行了比较,并通过使用内容,时间和网络分析以及三个一类的设计,培训和应用,针对具有地面真实数据的两个相关数据集进行了验证。使用基本事实构建的分类器;此外,在有争议的在线讨论的两个案例研究中证明了其实用性。
探索流式社交媒体数据变化对社会网络分析的影响
原文标题: Exploring the effect of streamed social media data variations on social network analysis
地址: http://arxiv.org/abs/2103.03424
作者: Derek Weber, Mehwish Nasim, Lewis Mitchell, Lucia Falzon
摘要: 为了研究在线社会网络(OSN)活动对现实世界中离线事件的影响,研究人员需要访问OSN数据,其可靠性对社会网络分析具有特殊意义。这不仅与收集的任何数据集的完整性有关,而且与从中构建有意义的社会和信息网络有关。在这项多学科研究中,我们考虑了从OSN数据构建传统社会网络的问题,然后提出了一些测量案例研究,这些案例显示了收集的OSN数据的变化如何影响社会网络分析。为此,我们开发了一种系统的比较方法,将其应用于四个案例研究中从Twitter收集的五对平行数据集。我们发现在使用不同工具收集的几个数据集中存在相当大的差异,这些差异极大地改变了后续分析的结果。我们的结果为打算收集在线数据流以推断社会网络的研究人员提供了一组指南。
单纯复形上的演化博弈
原文标题: Evolutionary games on simplicial complexes
地址: http://arxiv.org/abs/2103.03498
作者: H. Guo, D. Jia, I. Sendiña-Nadal, M. Zhang, Z. Wang, X. Li, K. Alfaro-Bittner, Y. Moreno, S. Boccaletti
摘要: 阐明导致合作的机制仍然是当今时代的主要科学挑战之一,因为许多常见的合作方案仍然难以捉摸,并且与达尔文的自然选择理论背道而驰。在这里,我们研究了基于成对交互作用之外的种群的演化博弈。具体而言,我们介绍了一种通用的演化方法,该方法允许研究以下情况:通过直接配对对以外的邻居(或通过一组邻居)进行的间接交互影响焦点参与者的策略。为此,我们考虑对两人和三人互动进行编码的简单图,这使得能够研究所有可能的社会困境对之间的竞争,并研究三人互动在所有观察到的现象学中的作用。我们同时研究了具有不同纳什均衡性的社会困境如何在简单结构中竞争,以及这种竞争是如何通过2和1简单形式的不平衡来调节的,这反过来又反映了参与者之间成对或小组互动的相对普遍性。我们报告了以下结果:(i)支持高阶博弈允许非主导策略者出现并与主导策略并存,无论接触者网络如何,都无法用任何成对方案来解释这种情况; (ii)根据人口的简单结构,描述从支配叛变到支配合作的新转变; (iii)证明2-简单互动是策略多样性的源泉,即增加群体互动的相对普遍性总是会促进个人的不同策略身份。我们的研究为寻求理解合作的根源以及在现实世界和社会环境中维持合作的机制迈出了一步。
差分隐私模型下的中心性度量分析
原文标题: Analysis of centrality measures under differential privacy models
地址: http://arxiv.org/abs/2103.03556
作者: Jesse Laeuchli, Yunior Ramírez-Cruz, Rolando Trujillo-Rasua
摘要: 本文使用平滑灵敏度方法,对任意加权图上的三个中心性度量(特征向量,拉普拉斯中心性和紧密度中心性)的差分私有计算进行了首次分析。为此,我们找到了随机算法需要添加的噪声量的下限,以使每个量度的输出具有不同的私有性。我们的结果表明,就大范围的平滑灵敏度无穷大的图而言,这些计算要么是不可行的。从某种意义上说,这是不切实际的或不切实际的,即使对于灵敏度有限的情况,所需的噪声量也会导致无法接受的巨大效用损失。
网络社区政治新闻讨论与共享的多平台分析
原文标题: A Multi-Platform Analysis of Political News Discussion and Sharing on Web Communities
地址: http://arxiv.org/abs/2103.03631
作者: Yuping Wang, Savvas Zannettou, Jeremy Blackburn, Barry Bradlyn, Emiliano De Cristofaro, Gianluca Stringhini
摘要: 新闻生态系统变得越来越复杂,涵盖了范围广泛,来源各异的可信赖程度,并且公共评论为相同的故事提供了不同的旋转方式。在本文中,我们提出了对该生态系统的多平台测量。我们编制了一个1,073个新闻网站的列表,并从四个Web社区(Twitter,Reddit,4chan和Gab)中提取了帖子,其中包含来自这些来源的URL。这样就产生了一个包含3800万个帖子的数据集,其中包含1500万个新闻URL,涵盖了将近三年的时间。我们沿多个轴研究数据,评估共享新闻的可信赖性,设计一种将新闻文章归类为故事的方法,对这些故事进行分析并讨论各种Web社区对此的影响。我们的分析表明,不同的社区讨论不同类型的新闻,而两极分化的社区(例如Gab和/ r / The_Donald subreddit)过多地引用了不可靠的消息来源。我们还发现,边社区通常对其他平台的影响不成比例。围绕某些新闻发布叙述,例如有关政治选举,移民或外交政策的新闻。
高阶结构上的社会传染
原文标题: Social contagion on higher-order structures
地址: http://arxiv.org/abs/2103.03709
作者: Alain Barrat, Guilherme Ferraz de Arruda, Iacopo Iacopini, Yamir Moreno
摘要: 在本章中,我们讨论了高阶结构对类似于SIS的社会传染过程的影响。在简短的动机介绍(其中我们说明了网络上的标准SIS过程以及简单和复杂的传染之间的区别)之后,我们从高图上最笼统的公式开始,介绍了在高阶结构上的扩展过程,然后转移到多个均值场和异构场平均场方法。结果强调了通过考虑高阶传染效应所带来的丰富现象:观察到连续和不连续的转变,并且出现了临界质量效应。我们以关于流行病过渡的性质以及为验证这些模型所需的数据的一般需求的理论结果的简短讨论作为结束。
表征Twitter用户的不同社区:移民和本地人
原文标题: Characterising different communities of Twitter users: Migrants and natives
地址: http://arxiv.org/abs/2103.03710
作者: Jisu Kim, Alina Sîrbu, Fosca Giannotti, Giulio Rossetti
摘要: 如今,许多用户都在积极使用Twitter表达意见和分享信息。由于数据的可用性,研究人员研究了这些用户的行为和社会网络。国际移徙研究也得益于该社交媒体平台,以改善移徙统计数据。尽管到目前为止,已经在Twitter上研究了各种类型的社会网络,但之前尚未研究过移民和本地人的社会网络。本文旨在通过研究Twitter上的移民和本地人的特征和行为来填补这一空白。为此,我们对功能进行常规评估,包括配置文件和推文,以及对网络进行广泛的网络分析。我们发现,移民的追随者多于朋友。尽管这两个小组的帐户年龄相似,但他们也发布了更多推文。更有趣的是,分类得分显示,用户倾向于基于国籍而不是居住国家来进行联系,对于移民而言,与本地居民相比,这种情况更为明显。此外,本地人和移民都倾向于与本地人建立联系。
使用卷积神经网络归类新闻媒体中的自杀
原文标题: Suicide Classificaction for News Media Using Convolutional Neural Network
地址: http://arxiv.org/abs/2103.03727
作者: Hugo J. Bello, Nora Palomar-Ciria, Enrique Baca-García, Celia Lozano
摘要: 当前,评估自杀的过程是高度主观的,这限制了预防工作的有效性和准确性。人工智能(AI)已经成为一种调查大型数据集的方法,以识别“大数据”中可以确定自杀结果因素的模式。在这里,我们使用AI工具从(媒体和社交)媒体文本中提取主题。但是,新闻媒体的文章缺乏自杀标签。使用带有与自杀相关的标签的推文,我们训练了一个神经元模型,该模型可以识别给定的文本是否具有与自杀有关的传染性。我们的结果表明,媒体对自杀案件的影响程度很高,并且自杀新闻具有内在的主题关系。这些结果为建立更多可解释的自杀数据铺平了道路,这可能有助于更好地追踪,理解其起源并改善预防策略。
使用双网分析器从双网中提取社区
原文标题: Using Dual-Network Analyser for extracting communities from Dual Networks
地址: http://arxiv.org/abs/2103.03728
作者: Pietro Hiram Guzzi, Giuseppe Tradigo, Pierangelo Veltri
摘要: 在许多研究领域,例如计算生物学,医学信息学和社会网络,都普遍使用网络来表示数据及其关系。最近,已经引入了复杂的网络模型,以更好地刻画建模场景的见解。除其他外,已经引入了基于双网络的模型,其包括将信息映射为包含相同节点但不同边的网络对。我们专注于使用一种新颖的方法来可视化和分析双重网络。该方法使用两种算法进行社区发现,并且作为具有图用户界面的基于Python的工具提供。该工具能够加载双重网络,并提取最密集的连接子图以及常见的模块化社区。后者是通过使用Louvain算法的改进实现而获得的。所提出的算法和图工具已通过使用社交,生物学和共同作者网络进行了测试。结果表明,所提出的方法是有效的,并且能够从双重网络中提取有意义的信息。最后,作为贡献,可以将所提出的图用户界面视为对上下文的有价值的创新。
匹配算法:基本原理,应用和挑战
原文标题: Matching Algorithms: Fundamentals, Applications and Challenges
地址: http://arxiv.org/abs/2103.03770
作者: Jing Ren, Feng Xia, Xiangtai Chen, Jiaying Liu, Mingliang Hou, Ahsan Shehzad, Nargiz Sultanova, Xiangjie Kong
摘要: 从市场运作到人们的日常生活,匹配在许多领域的资源合理配置中都起着至关重要的作用。在经济学中,术语“匹配理论”是为了将特定市场中的两个主体商配对以达到稳定或最佳状态而创造的。在计算机科学中,出现了匹配问题的所有分支,例如信息检索中的问答匹配,推荐系统中的用户项目匹配以及知识图中的实体关系匹配。偏好列表是匹配过程中的核心元素,它可以直接从主体获取,也可以通过预测间接生成。基于优先级列表访问,匹配问题分为两类,即显式匹配和隐式匹配。在本文中,我们首先介绍显式匹配中匹配理论的基本模型和算法。综述理解决隐式匹配中各种匹配问题的现有方法,例如检索匹配,用户项匹配,实体关系匹配和图像匹配。此外,我们研究了这些领域中的代表性应用,包括显式匹配中的婚姻和劳动力市场以及隐式匹配中的一些基于相似性的匹配问题。最后,本调查文件以对匹配领域的开放性问题和有希望的未来方向的讨论作为结尾。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。