- 网络持续同调:方法与应用;
- 图中心性是一个尺度问题;
- 主动-被动行人动力学的格子模型:探索漂移效应;
- 人口或密度变化对城市二氧化碳排放的影响;
- 基于链接划分和围绕中心点划分的网络重叠社区检测;
- 通过中心加权抽样改进基于Skip-Gram的图嵌入;
- 网络上传染病模型的自适应易感性和异构性;
- 检测社交媒体中的网络欺凌和网络攻击;
- 基于谱的有向图图卷积网络;
- 对Twitter趋势主题的综合分析;
- 使用LSTM的基于文献的知识发现预测框架;
- 桁架和梯形:社会网络中易于解释的社区;
网络持续同调:方法与应用
原文标题: Persistence Homology of Networks: Methods and Applications
地址: http://arxiv.org/abs/1907.08708
作者: Mehmet Emin Aktas, Esra Akbas, Ahmed El Fatmaoui
摘要: 信息网络越来越受欢迎,以捕捉各种学科的复杂关系,例如社会网络,引用网络和生物网络。该领域的主要挑战是基于拓扑测量网络之间的相似性或距离。然而,经典的图论理论测量通常是局部的,主要基于节点或边测量或相关性之间的差异,而不考虑诸如连接的组件或孔之类的网络的拓扑。近年来,基于数学工具和基于深度学习的方法已经变得流行以提取网络的拓扑特征。持久同源性(PH)是计算拓扑中的一种数学工具,用于测量数据的拓扑特征,这些特征在多个尺度上持续存在,应用范围从生物网络到社会网络。在本文中,我们提供了在复杂网络科学中使用PH的这一领域的关键进展的概念性回顾。我们给出了关于PH的简要数学背景,回顾了不同的方法(即过滤)以在网络上定义PH并突出显示不同的算法和应用,其中PH用于解决网络挖掘问题。在这样做的过程中,我们开发了一个统一的框架来描述这些最近的方法,并强调主要的概念区别。我们总结了未来工作的方向。我们将重点放在最近的方法上,这些方法在从事网络数据工作的数学和数据挖掘社区得到了极大的关注。我们相信,我们对网络上PH分析的总结将为应用网络科学研究人员提供重要的见解。
图中心性是一个尺度问题
原文标题: Graph centrality is a question of scale
地址: http://arxiv.org/abs/1907.08624
作者: Alexis Arnaudon, Robert L. Peach, Mauricio Barahona
摘要: 图中心性的经典度量捕获节点重要性的不同方面,从局部(例如,度)到全局(例如,接近度)。在这里,我们利用扩散和几何之间的联系来引入多尺度中心度量。如果节点由于图中的有效边界和不均匀性而破坏了扩散的度量,则将节点定义为中心。我们的度量自然是多尺度的,因为它是在扩散的变化时间范围内相对于图邻域计算的。我们发现节点的中心性在不同的尺度上可以有很大的不同。特别是,我们的测量与小规模的程度(即集线器)和大规模的接近程度(即桥梁)相关,并且还揭示了复杂网络中多中心结构的存在。通过检查跨尺度的中心性,我们的度量因此提供了相对于网络上的本地和全局过程的节点重要性的评估。
主动-被动行人动力学的格子模型:探索漂移效应
原文标题: A lattice model for active--passive pedestrian dynamics: a quest for drafting effects
地址: http://arxiv.org/abs/1907.08621
作者: Emilio N. M. Cirillo, Matteo Colangeli, Adrian Muntean, T. K. Thoa Thieu
摘要: 我们使用具有两种粒子的格子气体模型研究了从一条不起眼的走廊逃离的行人。一种称为被动物的物种在晶格上执行对称随机游走,而第二物种(称为主动物)经受漂移,引导粒子朝向出口。漂移模仿了一些行人对走廊几何形状和出口位置的认识。我们提供的数值证据表明,尽管颗粒之间存在硬核相互作用 - 即,每个部位最多可存在一个任何物种的颗粒, - 在系统中添加一部分活性颗粒可提高所有颗粒的疏散率从走廊。当观察出射粒子通量时,当系统与引起稳态开始的外部粒子储存器接触时,也观察到类似的效果。我们将这种现象解释为通常在连续体设置中观察到的牵伸效应的离散空间对应物,即由竞争骑车者的大部队经历的空气动力阻力。
人口或密度变化对城市二氧化碳排放的影响
原文标题: Effects of changing population or density on urban carbon dioxide emissions
地址: http://arxiv.org/abs/1907.08623
作者: Haroldo V. Ribeiro, Diego Rybski, Jürgen P. Kropp
摘要: 城市化是否有助于增加二氧化碳排放的问题主要通过扩大与人口或人口密度的关系来研究。然而,这些方法忽略了人口与面积之间的相关性,忽略了这些量之间可能的相互作用。在这里,我们提出了一个广义框架,同时考虑人口和面积的影响以及这些城市指标之间可能的相互作用。我们的研究结果显著改善了排放的描述,揭示了人口与密度之间在排放方面的耦合作用。这些模型表明,与人口或密度的比例变化相关的排放变化可能不仅取决于这些变化的大小,还取决于这些变化的初始值。对于美国地区,城市越大,其人口或密度的变化对其排放的影响就越大;但人口变化对排放的影响总是大于人口密度。
基于链接划分和围绕中心点划分的网络重叠社区检测
原文标题: Overlapping community detection in networks based on link partitioning and partitioning around medoids
地址: http://arxiv.org/abs/1907.08731
作者: Alexander Ponomarenko, Leonidas Pitsoulis, Marat Shamshetdinov
摘要: 在本文中,我们提出了一种新方法,用于检测具有预定义数量的聚类的网络中的重叠社区。图中的重叠社区是通过链接分区和围绕中心分区来检测相关线图中的不相交社区而获得的。通过使用在线性图的节点集上定义的距离函数来完成对中间体的分区。在本文中,我们将通勤距离和放大的通勤距离视为距离函数。通过对现实实例的计算实验证明了所提出方法的性能。
通过中心加权抽样改进基于Skip-Gram的图嵌入
原文标题: Improving Skip-Gram based Graph Embeddings via Centrality-Weighted Sampling
地址: http://arxiv.org/abs/1907.08793
作者: Pedro Almagro-Blanco, Fernando Sancho-Caparrini
摘要: 受word2vec启发的网络嵌入技术代表了一种有效的无监督关系学习模型。通常,通过Skip-Gram过程,这些技术通过采样节点上下文示例来学习图中节点的低维矢量表示。尽管已经提出了许多对节点的上下文进行采样的方法,但是没有深入分析选择节点的方式的影响。为了填补这一空白,我们在同一框架下重新实现了主要的四个word2vec启发图嵌入技术,并分析了在节点分类问题中测试时不同的采样分布如何影响嵌入性能。我们在不同的众所周知的真实数据集上展示了一组实验,展示了在采样中使用流行的中心性分布如何导致改进,在学习时间内获得高达2倍的速度以及在所有情况下提高准确性。
网络上传染病模型的自适应易感性和异构性
原文标题: Adaptive Susceptibility and Heterogeneity in Contagion Models on Networks
地址: http://arxiv.org/abs/1907.08829
作者: Renato Pagliara, Naomi E. Leonard
摘要: 传染病,社会行为或计算机病毒的传播等传染过程会影响生物,社会和技术系统。用于大群体和网络上有限群体的流行病模型已被用于理解和控制瞬态和稳态行为。通常,假设在从感染恢复后,每个药剂将返回其原始易感状态或获得对再感染的完全免疫。我们研究了网络SIRI(易感染 - 感染 - 恢复 - 感染)模型,这是一种流行病模型,用于在异构药物网络上传播传染过程,可以调整其对再感染的易感性。该模型推广现有模型以适应现实条件,其中药剂在首次暴露于感染后获得部分或受损的免疫力。我们证明了模型参数和网络结构的必要和充分条件,它们区分了四种动态机制:无感染,流行,地方性和双稳态。对于传统模型中未考虑的双稳态体制,我们展示了在看似收敛于无感染人群之后如何迅速复苏的流行病。我们使用该模型及其预测能力来展示如何设计控制策略以减轻有问题的传染行为。
检测社交媒体中的网络欺凌和网络攻击
原文标题: Detecting Cyberbullying and Cyberaggression in Social Media
地址: http://arxiv.org/abs/1907.08873
作者: Despoina Chatzakou, Ilias Leontiadis, Jeremy Blackburn, Emiliano De Cristofaro, Gianluca Stringhini, Athena Vakali, Nicolas Kourtellis
摘要: 网络欺凌和网络攻击是越来越令人担忧的现象,影响着所有人口统计数据的人。全球超过一半的年轻社交媒体用户遭受过长时间和/或协调的数字骚扰。受害者可以体验各种各样的情绪,带来诸如尴尬,抑郁,与其他社区成员隔离等负面后果,这些后果会导致风险导致更严重的后果,例如自杀未遂。在这项工作中,我们采取了第一个具体步骤,以了解Twitter,这是当今最大的社交媒体平台之一的滥用行为的特征。我们分析了120万用户和210万条推文,将参与围绕看似正常主题的讨论的用户与那些更可能与仇恨有关的用户进行比较,例如Gamergate争议,或BBC电视台的性别薪酬不平等。我们还在其中一个与仇恨有关的社区(Gamergate)中探讨了滥用行为的具体表现,即网络欺凌和网络犯罪。我们提出了一种强大的方法,通过考虑文本,用户和基于网络的属性来区分恶霸和攻击者与普通Twitter用户。使用各种最先进的机器学习算法,我们将这些帐户分类为90%以上的准确度和AUC。最后,我们讨论了我们的方法标记为滥用的Twitter用户帐户的当前状态,并研究了Twitter可用于将来暂停用户的潜在机制的性能。
基于谱的有向图图卷积网络
原文标题: Spectral-based Graph Convolutional Network for Directed Graphs
地址: http://arxiv.org/abs/1907.08990
作者: Yi Ma, Jianye Hao, Yaodong Yang, Han Li, Junqi Jin, Guangyong Chen
摘要: 图卷积网络(GCN)已成为当今最流行的图数据方法,因为它们具有从图中提取特征的强大能力。 GCNs方法分为两类,基于谱和基于空间。作为最早的图数据卷积网络,基于谱的GCN在许多图相关的分析任务中取得了令人瞩目的成果。然而,基于谱的模型不能直接在有向图上工作。在本文中,我们通过利用重新定义的拉普拉斯算子来改进其传播模型,为有向图提出了一种改进的基于谱的GCN。我们的方法可以直接在半监督节点分类任务中的有向图数据上工作。在许多有向图数据集上的实验表明,我们的方法优于最先进的方法。
对Twitter趋势主题的综合分析
原文标题: A Comprehensive Analysis of Twitter Trending Topics
地址: http://arxiv.org/abs/1907.09007
作者: Issa Annamoradnejad, Jafar Habibi
摘要: Twitter是最常用的微博和在线社会网络服务之一。在Twitter中,以比其他人更高的速度提及的名称,短语或主题称为“趋势主题”或简称为“趋势”。推特趋势在许多公共活动,选举和市场变化中表现出了强大的能力。然而,很少有工作重点是了解这些趋势主题的动态。在本文中,我们彻底检查了Twitter的2018年趋势主题。为此,我们访问了2018年全年的Twitter趋势API,并设计了六个标准来分析我们的数据集。这六个标准是:词汇分析,到达时间,趋势再现,趋势时间,推文数量和语言分析。除了提供有关每个标准的一般统计数据和最热门主题之外,我们还计算了几个可解释大量数据的分布。
使用LSTM的基于文献的知识发现预测框架
原文标题: Towards an LSTM-based Predictive Framework for Literature-based Knowledge Discovery
地址: http://arxiv.org/abs/1907.09395
作者: Nazim Choudhury, Fahim Faisal, Matloob Khushi
摘要: 基于文献的知识发现过程识别出版文献中嵌入的信息之间的重要但隐含的关系。来自信息检索和自然语言处理的现有技术试图识别已发表文献中信息概念之间隐藏或未发表的联系,然而,这些技术破坏了预测未来的概念以及文献中包含的科学知识组件之间的新兴关系。基于作者选择的关键词(即知识实体)构建的关键词共现网络(KCN)被认为是通过检查知识实体之间的关系而集中于这些知识组件和科学领域的知识结构的知识图。利用来自医学领域以外的两个多学科研究领域的数据,利用文献计量学,时间KCN的动态性和长期短期记忆复发神经网络,本研究提出了一个成功预测未来基于文献的发现的框架 - 新兴知识单位之间的联系。将问题框定为动态监督链路预测任务,所提出的框架集成了一些新颖的节点和边级特征。从二分网络和单网络计算关键词的时间重要性,基于家谱关系的关键词社区,以及在特征构建过程中使用的时间引用计数的相对重要性。节点和边级功能都输入到LSTM网络中,以预测正负标记的非连接关键字对的特征值,并对其进行准确分类。高分类绩效率表明,这些特征在预测科学知识单元之间新兴的联系和新兴趋势分析方面都具有支持作用。
桁架和梯形:社会网络中易于解释的社区
原文标题: Trusses and Trapezes: Easily-Interpreted Communities in Social Networks
地址: http://arxiv.org/abs/1907.09417
作者: Jonathan D. Cohen
摘要: 桁架是基于三角形的团的放松,用于以易于解释且具有计算吸引力的方式识别演员集群。本文介绍了相对于桁架的4循环,称为梯形,提出了桁架和梯形的加权延伸,并提供了强桁架和梯形以及顶桁架和梯形的改进。梯形图的使用允许应用于二部图,而加权版本允许由于自然边权重而改变支持而不增加计算复杂度。最后,强大的和峰值版本可以在不同密度的图表中轻松确定社区。这些结构中的每一个都在多项式时间内提供有保证的计算,由社会凝聚力的自然观察驱动,并且与其他标准结构很好地相关。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。