- 多关系社区发现的系统综述;
- 节点回归的迁移学习在扩散预测中的应用;
- 卢干达语-英语代码混合社交媒体文本中的错误信息检测;
- 自我伤害:Twitter上的检测和支持;
- 使用免费效用模型描述旅行者的选择行为;
- 基于延迟容忍共识的分布式估计:具有潜在不稳定动态特性的全排名系统;
- 动态平衡有向网络上的分布式支持向量机;
- 基于主体的模拟,可优化预防SARS-CoV-2在养老院中的传播;
- 图的代数连通性的边差分隐私;
多关系社区发现的系统综述
原文标题: A Systematic Survey on Multi-relational Community Detection
地址: http://arxiv.org/abs/2103.15698
作者: Zahra Roozbahani, Hanif Emamgholizadeh, Jalal Rezaeenour, Mahshid Hajialikhani
摘要: 复杂的网络包含相似或不同实体之间的各种交互。这些类型的网络称为多关系网络,其中每个层对应于一种特殊类型的交互。多关系网络是一种特殊类型的多层网络,其中节点是相似的实体。但是,边或通信表明相似实体之间的交互类型不同。在这项调查中,我们研究了多关系网络的社区检测方法。所考虑的模型分为两大类,即直接方法和间接方法。我们将间接方法分为两类:展平和集合,直接方法又分为四类:概率方法,代数方法,基于模块的方法和基于图特征的方法。对于每种方法和每种方法,我们都会说明其优缺点。此外,多层社区检测研究中所有使用的数据集都被分类为合成数据和真实数据。我们详细介绍最重要的数据集。然后,描述了论文所利用的评估指标。最后,讨论了当前模型的挑战和不足。最后,为将来的研究提出了一些建议。综合所有信息,就我们所知,本研究是致力于多关系网络社区检测的最全面的调查。
节点回归的迁移学习在扩散预测中的应用
原文标题: Transfer Learning for Node Regression Applied to Spreading Prediction
地址: http://arxiv.org/abs/2104.00088
作者: Sebastian Mežnar, Nada Lavrač, Blaž Škrlj
摘要: 理解信息如何在现实生活中的复杂网络中传播,可以更好地理解动态过程,例如错误信息或流行病传播。最近引入的用于学习节点表示的机器学习方法分支提供了许多新颖的应用程序,其中之一就是本文所讨论的扩展预测的任务。我们将探索最先进的节点表示学习器的用途,该学习器用于评估通过给定节点进行的扩展所产生的影响,并通过广泛的模拟进行估算。此外,由于许多现实生活中的网络在拓扑上相似,因此我们系统地研究了学习到的模型是否可以推广到以前看不见的网络,这表明在某些情况下可以获得很好的模型转换。这项工作是探索用于节点回归任务的学习表示形式的可移植性的第一项工作。我们显示存在一对结构相似的网络,经过训练的模型可以在两个网络之间进行转移(零射),并证明它们的竞争表现。据我们所知,这是评估零散传输在节点回归任务中的效用的首次尝试之一。
卢干达语-英语代码混合社交媒体文本中的错误信息检测
原文标题: Misinformation detection in Luganda-English code-mixed social media text
地址: http://arxiv.org/abs/2104.00124
作者: Peter Nabende, David Kabiito, Claire Babirye, Hewitt Tusiime, Joyce Nakatumba-Nabende
摘要: 错误信息在社交媒体平台上的出现,形式和负面影响越来越多,这就需要更多的错误信息检测工具。目前,针对COVID-19错误信息的工作正在进行,但是,针对40种不同的乌干达土著语言中的任何一种,都没有错误信息检测工具。本文通过提供基本语言资源和基于来自Facebook和Twitter社交媒体平台的代码混合的Luganda-English消息的错误信息检测数据集来解决此差距。将几种机器学习方法应用于错误信息检测数据集,以开发分类模型,以检测混合了代码的Luganda-English消息是否包含错误信息。在实验错误信息检测任务中对分类方法进行的十倍交叉验证评估表明,判别多项式朴素贝叶斯(DMNB)方法分别实现了78.19%和77.90%的最高准确度和F测度。同样,支持向量机和装袋集成分类模型也达到了可比的结果。这些结果很有希望,因为机器学习模型仅基于错误信息检测数据集中的n-gram特征。
自我伤害:Twitter上的检测和支持
原文标题: Self-harm: detection and support on Twitter
地址: http://arxiv.org/abs/2104.00174
作者: Muhammad Abubakar Alhassan, Isa Inuwa-Dutse, Bello Shehu Bello, Diane Pennington
摘要: 自从Twitter和Facebook等在线社交媒体平台问世以来,已经使用在线参与者发布的信息进行了有益的健康相关研究。由于用户经常在这样的平台上分享他们的故事,因此研究了与个人健康有关的问题,例如心理健康,自我伤害和抑郁。在线用户之所以诉诸共享,是因为在线社区的同理心和支持对于帮助受影响的个人至关重要。初步分析显示与非自杀性自残(NSSI)相关的内容如何在Twitter上激增。因此,我们使用Twitter收集相关数据,进行分析,并提供支持容易出现NSSI行为的用户的方法。我们的方法利用自定义搜寻器从自我报告用户和对打击自我伤害感兴趣的相关组织中检索相关推文。通过文本分析,我们确定了自我伤害用户的六大类别,包括遭受伤害,反自我伤害,寻求支持者,康复者,赞成自我伤害和处于危险之中。受影响的类别主导了集合。从参与度的角度来看,我们展示了在线用户如何响应自我伤害支持组织在Twitter上发布的信息。通过注意最活跃的组织,我们运用了一种有用的技术来揭示组织的战略。在线参与者对与心理健康相关属性相关的在线帖子表现出强烈的兴趣。我们的研究基于这样一个前提,即社交媒体可以用作支持采取主动措施缓解自我伤害的负面影响的工具。因此,我们提供了一些方法来防止潜在用户进行自我伤害,并通过一系列建议来支持受影响的用户。为了支持进一步的研究,该数据集将提供给感兴趣的研究人员。
使用免费效用模型描述旅行者的选择行为
原文标题: Describing traveler choice behavior using the free utility model
地址: http://arxiv.org/abs/2104.00223
作者: Hao Wang, Xiao-Yong Yan
摘要: 出行需求预测是运输计划和管理的重要组成部分。四步旅行模型是用于旅行需求预测的传统且最常用的过程,并且文献中已经提出了许多模型来分别描述每个步骤。但是,仍然缺少可以成功描述旅行者在不同步骤进行交互的集体选择行为的统一建模框架。这项研究使用了自由效用模型,该函数的目标函数在数学上与物理学中的亥姆霍兹自由能一致,分别并同时描述了旅行者的模式,目的地和路线选择行为。免费效用模型的基本假设是,旅行者将在预期效用和信息处理成本之间进行权衡,以最大化自己的效用。该模型不仅为旅行者的选择行为提供了统一的建模框架,而且为理解交通科学中的用户均衡模型和博弈论中的潜在博弈模型提供了新的视角。
基于延迟容忍共识的分布式估计:具有潜在不稳定动态特性的全排名系统
原文标题: Delay-Tolerant Consensus-based Distributed Estimation: Full-Rank Systems with Potentially Unstable Dynamics
地址: http://arxiv.org/abs/2104.00394
作者: Mohammadreza Doostmohammadian, Usman A. Khan, Themistoklis Charalambous
摘要: 经典的分布式估计方案通常假设通过多主体网络及时且可靠地交换信息。相比之下,本文考虑了经过多时延的多智能体网络对(可能)不稳定的全秩动力学系统的单时标分布式估计。拟议的网络估算器包括两个步骤:(i)关于(延迟的)先验估算的共识,以及(ii)度量更新。主体仅在延迟的传输链路上与邻居共享先验估计。考虑到最一般的情况,假定延迟是时变的,任意的,未知的,但是是上限。与大多数最近的分布式观测器假设每个主体附近的系统可观测性不同,我们提出的估计器不做这样的假设。这可以显著减少大规模主体上的通信/传感负载,同时使(分布式)可观察性分析更具挑战性。使用增广矩阵和Kronecker乘积的概念,证明了所提估计器在强连通网络上的几何收敛性,而与时滞上的界限无关。提供模拟以支持我们的理论结果。
动态平衡有向网络上的分布式支持向量机
原文标题: Distributed support-vector-machine over dynamic balanced directed networks
地址: http://arxiv.org/abs/2104.00399
作者: Mohammadreza Doostmohammadian, Alireza Aghasi, Themistoklis Charalambous, Usman A. Khan
摘要: 在本文中,我们通过分布式支持向量机(SVM)考虑二进制分类问题,其思想是训练具有有限数据共享的主体网络,以协作学习全局数据库的SVM分类器。主体仅共享有关分类器参数和局部损失函数的梯度的已处理信息,而不是其原始数据。与现有工作相反,我们提出了一种连续时间算法,该算法在离散跳跃中合并了网络拓扑变化。这种混合特性使我们可以消除由于底层CT过程离散化而产生的颤动。我们表明,通过使用矩阵扰动理论的参数,该算法在时变权重有向图上收敛到SVM分类器。
基于主体的模拟,可优化预防SARS-CoV-2在养老院中的传播
原文标题: Agent-based simulations for optimized prevention of the spread of SARS-CoV-2 in nursing homes
地址: http://arxiv.org/abs/2104.00550
作者: Jana Lasser, Johannes Zuber, Johannes Sorger, Elisabeth Klager, Maria Kletečka-Pulker, Harald Willschke, Katrin Stangl, Sarah Stadtmann, Christian Haslinger, Peter Klimek, Thomas Wochele-Thoma
摘要: 由于老年人之间具有很高的杀伤力,因此,养老院已成为COVID-19风暴的重灾区。新兴的新检测程序,例如抗原或RT-LAMP检测,可能使我们能够通过预防性筛查策略来保护疗养院居民。在这里,我们针对SARS-CoV-2在疗养院中的传播,开发了一种基于病原体的新型流行病学模型,以识别最佳的预防测试策略,以遏制这种传播。该模型在显微镜下进行了校准,以适应来自奥地利实际疗养院的高分辨率数据,包括其居民的社交联系的详细网络以及过去爆发的信息。我们发现,预防性筛查的有效性关键取决于检测与检测结果之间的时间跨度,检测病毒载量的检测阈值以得出阳性结果以及居民和员工的筛查频率。在现实情况下,我们发现,仅对员工进行预防性筛查就足以控制疗养院的爆发(平均每个索引病例一次或少于二次感染),前提是检测的周转时间和检测阈值足够低。对于本研究中考虑的测试,我们得出结论,与抗原和PCR测试相比,当日营业额PCR和RT-LAMP程序可提供更有效的预防。
图的代数连通性的边差分隐私
原文标题: Edge Differential Privacy for Algebraic Connectivity of Graphs
地址: http://arxiv.org/abs/2104.00654
作者: Bo Chen, Calvin Hawkins, Kasra Yazdani, Matthew Hale
摘要: 图是建模多主体系统的主要形式主义。图的代数连通性特别重要,因为它提供了共识算法的收敛速度,这些共识算法是许多多智能体控制和优化技术的基础。但是,共享代数连接的价值可能会无意间透露有关图拓扑的敏感信息,例如社会网络中的连接。因此,在这项工作中,我们提出了一种以图论形式的差分隐私(称为边差分隐私)释放图的代数连通性的方法。边差异隐私掩盖了图边集之间的差异,因此掩盖了其中不存在或存在敏感连接的情况。我们为有界拉普拉斯噪声提供了保密性,与传统的无界噪声相比,它可以提高准确性。解析显示了私有代数连接性值,可以提供对共识收敛速度的准确估计,以及图的直径及其节点之间的平均距离的准确界限。仿真结果证实了在这些情况下私有代数连通性的实用性。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。