- 具有无标度属性的隐变量网络模型的广义阈值;
- 用相对论引力理论建模在线讨论的参与动力学;
- 网络的经典信息论;
- 非正式导师在学术合作中的作用;
- 用顶点替换语法进行图建模;
- 多层网络中的边相关性;
- 用于假新闻检测的带标签信息的张量分解;
- RWR-GAE:图自动编码器的随机游走正则化;
- 用于网络嵌入的深度内核监督哈希;
- 从社交媒体中自动提取时尚知识;
- 众包实时病毒性疾病和有害生物信息:一个发展中国家的全国性木薯病监测案例;
具有无标度属性的隐变量网络模型的广义阈值
原文标题: Generalised thresholding of hidden variable network models with scale-free property
地址: http://arxiv.org/abs/1908.03757
作者: Sámuel G. Balogh, Péter Pollner, Gergely Palla
摘要: 隐藏变量形式(基于一些内在节点参数的假设)在描述和分析复杂网络的拓扑结构方面证明是一种非常有效和强大的方法。由于其最有利的特性之一 - 即被证明能够再现各种不同程度的分布形式 - 它已成为生成具有无标度特性的网络的标准工具。该模型研究最深入的版本之一是基于与节点相关的指数分布隐藏变量的阈值机制(内部顶点权重),这导致了无标度网络的出现,其中度分布 p (k) sim k ^ - gamma 使用指数 gamma = 2 进行衰减。在这里,我们通过扩展导致上述度分布的连接概率和隐藏变量分布的集合,并分析导致上述行为的条件,提出该模型的推广和修改。此外,我们建议放宽连接概率中的硬阈值,这开辟了获得具有任意尺度指数的稀疏无标度网络的可能性。
用相对论引力理论建模在线讨论的参与动力学
原文标题: Modeling Engagement Dynamics of Online Discussions using Relativistic Gravitational Theory
地址: http://arxiv.org/abs/1908.03770
作者: Subhabrata Dutta, Dipankar Das, Tanmoy Chakraborty
摘要: 在线讨论是研究不同主题的用户行为的宝贵资源。与先前以静态方式对讨论进行建模的研究不同,在本研究中,我们将其建模为时变过程并解决两个相互关联的问题 - 预测哪些用户群将参与正在进行的讨论,并预测讨论的增长率就评论数量而言。我们提出了RGNet(相对论引力神经网络),这是一种新算法,它使用爱因斯坦场重力方程模拟在线讨论,将“尘埃云”悬停在用户时空流上,随着时间的推移以不同的速率吸引不同群体的用户。我们还提出了GUVec,一种用于在线讨论的全球用户嵌入方法,RGNet使用该方法来预测用户的临时参与度。 RGNet利用不同的基于文本和网络的功能来学习粉尘分布以供讨论。我们使用了四个基线 - 前两个使用LSTM架构,第三个使用牛顿引力模型,第四个使用从之前的参与预测工作中采用的逻辑回归。 Reddit数据集上的实验表明,RGNet分别达到0.72 Micro F1评分和6.01%平均误差,用于用户群的时间参与度预测和增长率预测,显著优于所有基线。我们进一步使用RGNet来预测非时间参与 - 用户是否会对某个帖子发表评论。 RGNet为此任务达到0.62 AUC,优于现有基线8.77%AUC。
网络的经典信息论
原文标题: Classical Information Theory of Networks
地址: http://arxiv.org/abs/1908.03811
作者: Filippo Radicchi, Dmitri Krioukov, Harrison Hartle, Ginestra Bianconi
摘要: 异质性是表征现实世界网络的最重要特征之一。支持这一事实的经验证据是不容置疑的。现有的理论框架证明网络中的异构性是增强所需系统特征的便捷方式,例如鲁棒性,可同步性和可导航性。然而,一种能够解释复杂网络中异质性自然出现的统一信息论尚不存在。在这里,我们通过为网络开发经典信息论框架来填补这一知识空白。我们表明,在所有可用于生成随机网络的度分布中,从最大熵原理出现的是幂律。我们还研究了空间嵌入式网络,发现节点之间的相互作用自然会导致空间中点的不均匀分布。拟议框架充分描述了现实世界航空运输网络的相关特征。
非正式导师在学术合作中的作用
原文标题: The Impact of Informal Mentorship in Academic Collaborations
地址: http://arxiv.org/abs/1908.03813
作者: Bedoor AlShebli, Kinga Makovi, Talal Rahwan
摘要: 受到学术界指导的诸多好处的启发,我们在科学合作中研究“非正式导师”,即一名初级科学家得到多位高级合作者的支持,而他们不一定具有任何正式的监督角色。为此,我们分析了250万个独特的导师 - 例如跨越9个学科和超过一个世纪的研究对,并且我们证明了导师素质对论文所写的论文的科学影响有因果影响。特别是如何发布导师。这种影响随着导师的数量而增加,并且随着时间的推移,跨学科和大学排名持续存在。效果也随着导师的学业年龄而增加,直到他们达到30年的经验,之后它开始减少。此外,我们研究了导师及其他人的性别如何不仅影响了职业发展指导的影响,还影响了导师在导学经验中的引用收益。他们的人,例如他们。我们发现,增加女性导师的比例会降低女性导师的影响,同时也会影响女性导师的收益。虽然目前鼓励初级女性接受高级女性辅导的政策有助于保留女性科学,但我们的研究结果表明,留在学术界的女性的影响可能会通过鼓励反对性别的指导而增加。
用顶点替换语法进行图建模
原文标题: Modeling Graphs with Vertex Replacement Grammars
地址: http://arxiv.org/abs/1908.03837
作者: Satyaki Sikdar, Justus Hibshman, Tim Weninger
摘要: 图建模的主要目标之一是捕获网络数据的构建块,以研究各种物理和自然现象。最近在形式语言理论和图论的交叉工作中探索了使用图语法进行图建模。但是,现有的图语法形式,如Hyperedge Replacement Grammars,只能在小树状图上运行。目前的工作通过修改称为Vertex Replacement Grammars(VRG)的不同图语法形式来放宽这一限制。我们证明可以从图的许多层次聚类中有效地提取VRG。我们展示了VRG编码图的简洁模型,但忠实地保留了原始图的结构。在大型真实世界数据集的实验中,我们展示了从VRG模型生成的图表展示了与原始网络中发现的类似的各种属性。
多层网络中的边相关性
原文标题: Edge Correlations in Multilayer Networks
地址: http://arxiv.org/abs/1908.03875
作者: A. Roxana Pamfil, Sam D. Howison, Mason A. Porter
摘要: 网络分析的许多最新发展都集中在多层网络上,人们可以使用它来编码时间相关的交互,多种类型的交互以及复杂系统中出现的其他复杂情况。与其单层对应物一样,应用中的多层网络通常具有中尺度特征,例如社区结构。推断这种结构的一种主要方法是使用多层随机块模型(SBM)。这些模型的一个常见(但不充分)假设是独立地对不同层中的边进行采样,以节点的社区标签为条件。在本文中,我们通过将边相关性结合到类似SBM的模型中来放松这种独立性假设。我们推导出模型关键参数的最大似然估计,并且我们提出了一种层相关度量,它反映了不同层中连通模式之间的相似性。最后,我们解释了如何在多层网络中使用相关模型进行边预测。通过考虑边相关性,预测准确度在合成网络和与先前购买的杂货产品连接的购物者的时间网络中都得到改善。
用于假新闻检测的带标签信息的张量分解
原文标题: Tensor Factorization with Label Information for Fake News Detection
地址: http://arxiv.org/abs/1908.03957
作者: Frosso Papanastasiou, Georgios Katsimpras, Georgios Paliouras
摘要: 对所谓的“假新闻”的嗡嗡声引起了对退化的媒体环境的担忧,并导致对技术解决方案的需求。随着对新闻的检测越来越被认为是一个技术问题,它已经引起了相当多的研究。大多数这些研究主要集中在利用从文本新闻内容中提取的信息。相比之下,我们专注于仅根据社会网络的结构信息来检测虚假新闻。我们建议共享虚假新闻的用户的基础网络连接具有足够的辨别力,以支持虚假新闻的检测。于是,我们将每个帖子建模为友谊互动网络,并将帖子集合表示为多维张量。考虑到可用的标记数据,我们提出了一种张量分解方法,它将数据样本的类标签与它们的潜在表示相关联。具体而言,我们将分类错误术语与统一优化过程中的标准因子分解相结合。现实世界数据集的结果表明,我们提出的方法通过实施一种可以说是更简单的方法,可以与最先进的方法竞争。
RWR-GAE:图自动编码器的随机游走正则化
原文标题: RWR-GAE: Random Walk Regularization for Graph Auto Encoders
地址: http://arxiv.org/abs/1908.04003
作者: Vaibhav, Po-Yao Huang, Robert Frederking
摘要: 节点嵌入已成为用于在低维空间中表示图数据的普遍存在的技术。已经提出图自动编码器作为广泛适应的深度模型之一,通过最小化图数据的重建误差以无监督的方式学习图嵌入。然而,它的重建损失忽略了潜在表示的分布,从而导致较差的嵌入。为了缓解这个问题,我们提出了一种基于随机游走的方法来规范编码器学习的表示。我们证明了所提出的新颖增强功能在节点聚类任务中以较大的幅度(高达7.5%)击败了现有的最先进模型,并在三个链路预测任务上实现了最先进的精度。标准数据集,cora,citeseer和pubmed。代码可在https://github.com/MysteryVaibhav/DW-GAE获得。
用于网络嵌入的深度内核监督哈希
原文标题: Deep Kernel Supervised Hashing for Network Embedding
地址: http://arxiv.org/abs/1908.04007
作者: Jia-Nan Guo, Xian-Ling Mao, Xiao-Jian Jiang, Ying-Xiang Sun, He-Yan Huang
摘要: 网络嵌入是一种很有前途的网络表示方式,可以促进许多签名的社会网络处理和分析任务,如链路预测和节点分类。最近,在几种现有的嵌入算法中采用了特征散列来提高效率,取得了很大的成功。但是,现有的基于特征哈希的嵌入算法仅考虑签名社会网络中的正链接。直观地,负链接也可以帮助提高性能。因此,在本文中,我们通过同时考虑正负链接,提出了一种新的用于签名社会网络嵌入的深度哈希方法。大量实验表明,通过两个真实世界签名的社会网络上的链路预测任务,所提出的方法比几个最先进的基线表现更好。
从社交媒体中自动提取时尚知识
原文标题: Automatic Fashion Knowledge Extraction from Social Media
地址: http://arxiv.org/abs/1908.04045
作者: Yunshan Ma, Lizi Liao, Tat-Seng Chua
摘要: 时尚知识在帮助人们穿衣方面起着举足轻重的作用。在本文中,我们提出了一种新的系统,以自动从社交媒体中收集时尚知识。它从多种形式的图像,文本和元数据中统一了三个场合,人物和衣物发现的任务。应用情境化时尚概念学习模型来利用丰富的上下文信息来改善时尚概念学习表现。同时,为了对抗训练数据中的标签噪声,我们采用弱标签建模方法来进一步提高性能。我们建立了一个网站,以展示我们系统提取的时尚知识的质量。
众包实时病毒性疾病和有害生物信息:一个发展中国家的全国性木薯病监测案例
原文标题: Crowdsourcing real-time viral disease and pest information. A case of nation-wide cassava disease surveillance in a developing country
地址: http://arxiv.org/abs/1908.04237
作者: Daniel Mutembesa, Christopher Omongo, Ernest Mwebaze
摘要: 在大多数发展中国家,大部分国家食品篮都由小型自给农业系统提供支持。对这些系统的一个主要挑战是疾病和虫害攻击,这对依赖这些系统维持生计的小农造成破坏性影响。任何提议的解决方案的关键组成部分是良好的疾病监测网络。然而,由于人力和财力资源有限,目前的监督工作无法提供足够的数据来有效和高效地监测广大地理区域的此类现象。与拥有移动电话的农民群体一起进行众包提供了一个可行的选择,可以提供有关病毒性疾病和病虫害发生率和严重程度的全年实时监测数据。这项工作提出了一个移动临时监测系统,用于监测木薯中的病毒病和害虫。我们展示了乌干达一个试验结果,该系统已部署76周。我们讨论了人群与移动智能手机的参与行为以及应用的几种激励措施的效果。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。