- 提取图神经网络知识并超越它:一个有效的知识提取框架;
- 理解微信用户首选项和“哇”扩散;
- 用于稳健表示的深度图结构学习:综述;
- 亚线性主导和核心边缘网络;
- 多尺度动态网络中的渗流和连接时间;
- 在社交媒体上检测和建模信息的真实渗流和相变;
- 使用ReCom抽样方法量化区域紧凑度的第一步;
- 探索本地出行方式,社会经济状况和锁定政策在塑造COVID-19传播方式中的作用;
- 基于Agent的模型中关键路径的统计分析;
- 关于社交云的批判笔记;
- Weisfeiler和Lehman进入拓扑:通过简单网络传递消息;
- 基于Agent的人才流失建模方法;
提取图神经网络知识并超越它:一个有效的知识提取框架
原文标题: Extract the Knowledge of Graph Neural Networks and Go Beyond it: An Effective Knowledge Distillation Framework
地址: http://arxiv.org/abs/2103.02885
作者: Cheng Yang, Jiawei Liu, Chuan Shi
摘要: 图上的半监督学习是机器学习领域中的一个重要问题。近年来,基于图神经网络(GNN)的最新分类方法已显示出其优于传统方法(如标签传播)的优势。但是,这些神经模型的复杂架构将导致复杂的预测机制,无法充分利用数据中有价值的先验知识,例如,结构相关的节点往往具有相同的类别。在本文中,我们提出了一个基于知识提炼的框架来解决上述问题。我们的框架提取了任意学习的GNN模型(教师模型)的知识,并将其注入精心设计的学生模型中。学生模型是通过两个简单的预测机制构建的,即标签传播和特征转换,它们自然地分别保留了基于结构的知识和基于特征的先验知识。具体来说,我们将学生模型设计为参数化标签传播和特征转换模块的可训练组合。结果,学习的学生可以从先验知识和GNN教师的知识中受益,以获得更有效的预测。此外,与GNN相比,学习型学生模型具有更可解释的预测过程。我们在五个公开基准数据集上进行了实验,并采用了七个GNN模型(包括GCN,GAT,APPNP,SAGE,SGC,GCNII和GLP)作为教师模型。实验结果表明,学习型学生模型平均可以持续优于其相应的教师模型1.4%-4.7%。代码和数据可在https://github.com/BUPT-GAMMA/CPF获得
理解微信用户首选项和“哇”扩散
原文标题: Understanding WeChat User Preferences and "Wow" Diffusion
地址: http://arxiv.org/abs/2103.02930
作者: Fanjin Zhang, Jie Tang, Xueyi Liu, Zhenyu Hou, Yuxiao Dong, Jing Zhang, Xiao Liu, Ruobing Xie, Kai Zhuang, Xu Zhang, Leyu Lin, Philip S. Yu
摘要: 微信是中国最大的社交即时通讯平台,每月活跃用户达11亿。 “热门故事”是微信中一种新颖的好友增强推荐引擎,用户可以根据自己和好友的喜好阅读文章。具体来说,当用户通过打开文章阅读文章时,“点击”行为是不公开的。而且,如果用户单击“哇”按钮,(仅)她/他的直接联系将知道该操作/偏好。基于独特的微信数据,我们旨在理解用户的喜好以及不同级别的热门故事中的“哇”声传播。我们取得了一些有趣的发现。例如,一个用户的“哇”概率与她/他的活跃朋友形成的连接组件的数量负相关,但是点击概率却相反。我们进一步研究了用户的“哇”和点击行为在多大程度上可以从他们的社交关系中预测出来。为理解决这个问题,我们提出了一个基于层次图表示学习的模型DiffuseGNN,它能够刻画上面发现的基于结构的社会观察结果。我们的实验表明,与替代方法相比,该方法可以显著提高预测性能。
用于稳健表示的深度图结构学习:综述
原文标题: Deep Graph Structure Learning for Robust Representations: A Survey
地址: http://arxiv.org/abs/2103.03036
作者: Yanqiao Zhu, Weizhi Xu, Jinghao Zhang, Qiang Liu, Shu Wu, Liang Wang
摘要: 图神经网络(GNN)被广泛用于分析图结构数据。大多数GNN方法对图结构的质量高度敏感,并且通常需要用于学习信息嵌入的完美图结构。但是,图中的噪声无处不在,因此有必要为现实世界中的问题学习可靠的表示形式。为了提高GNN模型的鲁棒性,围绕图结构学习(GSL)的中心概念提出了许多研究,旨在共同学习优化的图结构和相应的表示形式。为此,在提出的调查中,我们广泛回顾了GSL方法在学习鲁棒表示中的最新进展。具体来说,我们首先制定GSL的一般范式,然后回顾按模型结构建模方式分类的最新方法,然后将结合GSL理念的应用程序应用到其他图任务中。最后,我们指出了当前研究中的一些问题,并讨论了未来的方向。
亚线性主导和核心边缘网络
原文标题: Sublinear Domination and Core-Periphery Networks
地址: http://arxiv.org/abs/2103.03135
作者: Marios Papachristou
摘要: 在本文中,我们设计了一个具有核心外围属性的生成随机网络模型,其核心节点充当次线性支配者,也就是说,如果网络具有 n 个节点,则核心的大小为 o(n)并支配整个网络。我们证明了该模型生成的实例展示了幂律度分布,并包含了小世界现象。我们还将模型拟合到各种现实网络中。
多尺度动态网络中的渗流和连接时间
原文标题: Percolation and connection times in multi-scale dynamic networks
地址: http://arxiv.org/abs/2103.03171
作者: Christian Hirsch, Benedikt Jahnel, Elie Cali
摘要: 我们研究了移动性对多尺度动态网络中两个关键特征的影响:渗透和连接时间。我们的分析提供了对该问题的见解,在何种程度上,长期平均值与相应数量的期望值(即渗透和连接概率)很好地近似。特别是,我们表明在多尺度模型中,强随机效应可能会持续存在于极限中。根据精确的模型选择,这些可以采取空间出生死亡过程或布朗运动的形式。尽管出现在极限中的结构多种多样,但我们表明可以在一个通用框架中解决它们,并且有可能更普遍地应用,以便确定动态空间网络模型中的极限,而这些极限超出了本工作中考虑的示例。
在社交媒体上检测和建模信息的真实渗流和相变
原文标题: Detecting and modelling real percolation and phase transitions of information on social media
地址: http://arxiv.org/abs/2103.02804
作者: Jiarong Xie (1), Fanhui Meng (1), Jiachen Sun (1), Xiao Ma (1), Gang Yan (2 and 3), Yanqing Hu (1 and 4) ((1) School of Computer Science and Engineering, Sun Yat-sen University, Guangzhou, China, (2) School of Physics Science and Engineering, Tongji University, Shanghai, China, (3) Shanghai Institute of Intelligent Science and Technology, Tongji University, Shanghai, China, (4) Southern Marine Science and Engineering Guangdong Laboratory, Zhuhai, China)
摘要: 人们普遍认为,在社交媒体上传播的信息是一个渗流过程,与理论物理学中的相变相似。但是,该假设的证据有限,因为尚未在任何社交媒体中直接观察到相变。在这里,通过对1亿个微博和4000万个Twitter用户的分析,我们发现了类似渗流的扩散,并且发现这种扩散比当前理论模型所预测的更容易发生。较低的渗透阈值可以用网络结构和用户活动级别之间的协同演化中存在正反馈来解释,这样,更多的活跃用户会获得更多的关注者。此外,这种共同发展导致用户影响力的极端失衡。我们的发现表明,信息在社会网络中传播的能力比预期的要高,这对许多信息传播问题具有影响。
使用ReCom抽样方法量化区域紧凑度的第一步
原文标题: First steps towards quantifying district compactness in the ReCom sampling method
地址: http://arxiv.org/abs/2103.02699
作者: Jeanne N. Clelland, Nicholas Bossenbroek, Thomas Heckmaster, Adam Nelson, Peter Rock, Jade VanAusdall
摘要: 合奏分析已成为分析和量化搬运需求的重要工具。主要思想是生成一个大型的,随机的选区规划样本(“整体”),任何拟议的规划都可以与之进行比较。如果就各种重新划分标准而言,拟议的计划与总体相比是一个极端的异常值,则这可能表明该计划是经过精心设计的,可以产生特定的结果。已经使用了多种方法来构建计划集合,并且出现了一个基本问题:通过特定方法构建的集合如何准确地表示有效计划的整个空间-或者,如果一种方法固有地偏向于特定类型的计划,是否可以识别和量化这种偏见?最近,马尔可夫链蒙特卡罗(MCMC)方法已成为构建计划整体的主要工具。在本文中,我们重点介绍由Metric Geometry and 改划选区 Group在2018年引入的称为“ ReCom”的MCMC方法。与其他方法相比,此方法似乎产生的区域相对紧凑的计划,并且我们试图更详细地理解这种现象。为了对基本的ReCom步骤建模,我们为两个网格图和科罗拉多州博尔德县的区域图构建了由两个区组成的大型计划集合。我们发现,从高度上讲,任何区域的抽样概率特定计划与离散量度的指数衰减函数成比例,该离散量近似于计划中两个区域之间的边界长度。这表明ReCom倾向于产生相对紧凑的地区的观测结果的定量化表示,它代表了理解ReCom方法的完整采样概率分布的重要的第一步。
探索本地出行方式,社会经济状况和锁定政策在塑造COVID-19传播方式中的作用
原文标题: Exploring the roles of local mobility patterns, socioeconomic conditions, and lockdown policies in shaping the patterns of COVID-19 spread
地址: http://arxiv.org/abs/2103.02701
作者: Mauricio Herrera
摘要: COVID-19危机表明,我们只能通过及时,大规模,协调和果断的行动来防止大规模传染的风险。但是,专家(决策者从中获得主要建议的专家)所使用的模型通常只关注单一观点(例如,流行病学观点),而没有考虑影响COVID-19暴发模式的多种因素。 COVID-19的流行病学,社会经济和人类流动性可以被认为是一个复杂的适应性系统。因此,这些干预措施(例如锁定)可能会产生许多和/或意外的后果。这种情况很难理解任何公共政策措施产生的总体效果,因此很难评估其实际效果和便利性。通过使用在整个大流行过程中记录的手机数据,社会经济数据和COVID-19病例数据,我们旨在理解和解释(有意义)跨时间和空间观察到的异质性传染区域模式。我们还将通过开发基于数据的模型来探索,模拟和评估这些政策的有效性,来考虑限制政策所产生的因果关系。我们打算开发一种方法来评估和改善与大流行作斗争相关的公共政策的有效性,强调其便利性,适用时间和扩展时间。无论地区如何,都可以使用这项工作的贡献。唯一可能的障碍是适当数据的可用性。
基于Agent的模型中关键路径的统计分析
原文标题: Statistical Analysis of Tipping Pathways in Agent-Based Models
地址: http://arxiv.org/abs/2103.02883
作者: Luzie Helfmann, Jobst Heitzig, Péter Koltai, Jürgen Kurths, Christof Schütte
摘要: 基于主体的模型是对复杂的社会系统进行建模的自然选择。在这样的模型中,大量个体的简单随机交互规则会导致宏观尺度上的动态变化,例如多数意见或行为的突然转变。在这里,我们关注的是研究代表特征配置的主体状态空间的相关子集之间的噪声诱发的倾斜。由于互动个体的数量众多,基于主体的模型是高维的,尽管通常会出现新兴的集体行为的低维结构。因此,我们应用了非线性降维技术Diffusion Maps来揭示固有的低维结构。我们通过过渡路径理论来表征倾翻行为,这有助于获得倾翻路径的统计信息,例如其分布,通量和流量。通过系统地研究两种基于主体的模型,这些模型表现出大量的倾销途径和连锁效应,我们说明了该方法的实用性。
关于社交云的批判笔记
原文标题: A Critical Note on Social Cloud
地址: http://arxiv.org/abs/2103.03180
作者: Pramod C. Mane, Kapil Ahuja, Pradeep Singh
摘要: 社交云的概念已成为一种社会网络环境中的资源共享范例。毫无疑问,最先进的社交云系统展示了社交云作为其他计算范例(如云,网格,对等和志愿者计算)的补充的潜力。但是,在本文中,我们对社交云文献进行了批判性调查,得出的结论是,这些最初的努力未能提供社交云的总体框架,也未能显示社交云的独特性。此简短说明显示,在社交云的概念,资源定义,资源共享和分配机制及其应用和利益相关者方面存在重大差异。这项研究旨在表达对社交云通用框架的需求,该框架可以纳入文献中讨论的各种观点和资源共享设置。
Weisfeiler和Lehman进入拓扑:通过简单网络传递消息
原文标题: Weisfeiler and Lehman Go Topological: Message Passing Simplicial Networks
地址: http://arxiv.org/abs/2103.03212
作者: Cristian Bodnar, Fabrizio Frasca, Yu Guang Wang, Nina Otter, Guido Montúfar, Pietro Liò, Michael Bronstein
摘要: 图机器学习的成对交互范例主要控制着关系系统的建模。但是,仅凭图不能刻画许多复杂系统中存在的多级交互,并且这种方案的表达能力被证明是有限的。为了克服这些限制,我们提出了消息传递简单网络(MPSN),这是一类在简单复合体(SC)上执行消息传递的模型-拓扑对象将图推广到更高的维度。为了从理论上分析我们模型的表现力,我们引入了一个简单的Weisfeiler-Lehman(SWL)着色过程来区分非同构SC。我们将SWL的功能与区分非同构图的问题联系起来,并表明SWL和MPSN严格比WL测试更强大,并且不比3-WL测试更强大。通过将我们的模型与具有ReLU激活的传统图神经网络进行比较,我们可以深化分析,这些模型神经网络可以表示函数的线性区域。通过显示MPSN可以区分GNN失败的具有挑战性的强规则图,并在配备方向等变层时,与GNN基线相比,它们可以提高有向SC的分类精度,从而从经验上支持我们的理论主张。此外,我们实现了一个用于在简单复合体上传递消息的库,我们计划在适当的时候发布该复合体。
基于Agent的人才流失建模方法
原文标题: An Agent-Based Modelling Approach to Brain Drain
地址: http://arxiv.org/abs/2103.03234
作者: Furkan Gürsoy, Bertan Badur
摘要: 人才流失的现象,即高技术人才的移民,产生了许多不良影响,特别是对发展中国家而言。在这项研究中,基于主体的模型被开发来理解这种移民的动态。我们假设技术人员的移民决定基于多个因素,包括本国与所在国之间的总体经济和社会差异,人们获得良好工作和在国外生活的能力和能力以及出国的障碍。此外,个人的社会网络也起着重要作用。该模型使用定性和定量模式与现实世界的观察结果进行了验证。除了进行几种情景分析外,还进行了敏感性和不确定性分析。创建线性和随机森林响应面模型,以提供对移民数量的快速预测,并理解各个参数的影响大小。总的来说,这项研究提供了一个抽象的模型,可以探索人才流失的动态。模拟输出的结果表明,该国未来的社会经济状况比当前状况更为重要,缺乏障碍会导致大量移民,网络效应必然会对移民产生复合影响。经过进一步的开发和定制,将来的版本可以帮助社会决策者做出有关人才流失的决策。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。