- VeRNAl:用于挖掘RNA中模糊网络模体的工具;
- 在网络中查找信息源:带预算的查询;
- 异构图神经网络推荐;
- 社会等级促进合作主导;
- 将属性网络嵌入扩展至大型图;
- 感性的LIAR:伪造索赔分类的扩展语料库和深度学习模型;
- 社会接触和传染病的传播;
- k社区高斯混合模型中社区检测的精确恢复;
- 关于Twitter上关于羟氯喹治疗COVID-19功效的极化对话立场数据集;
- 在线游戏中技能的识别:范特西足球经理的案例;
- COVID-19大流行的最佳控制:葡萄牙的卫生控制措施;
VeRNAl:用于挖掘RNA中模糊网络模体的工具
原文标题: VeRNAl: A Tool for Mining Fuzzy Network Motifs in RNA
地址: http://arxiv.org/abs/2009.00664
作者: Carlos Oliver, Vincent Mallet, Pericles Philippopoulos, William L. Hamilton, Jerome Waldispuhl
摘要: 动机:RNA是参与许多调节和催化过程的普遍存在的分子。它们形成复杂结构的能力通常是支持这些功能的关键。值得注意的是,RNA 3D结构铰接在较小的3D子单元周围,这些较小的3D子单元可在无关分子中找到,称为RNA 3D模体。因此,这些3D模体的分类对于表征RNA结构至关重要,但是目前的方法只能检索具有相同碱基相互作用模式的模体。结果:在这里,我们通过将模体发现问题作为图表示学习和聚类任务来解决这个约束。这种取景利用了图表示的连续性质来对RNA模体的灵活性进行建模,同时保留了将RNA方便地编码为图的功能。我们提出了一套节点相似性函数,聚类方法和基元构建算法来恢复灵活的RNA基元。我们证明了我们的方法能够检索和扩展已知类别的模体,而且还能识别新的模体。用户可以轻松定制我们的工具VeRNAl,以达到所需的模体灵活性,丰度和大小水平。可用性和实施:可从vernal.cs.mcgill.ca获得源代码,数据和Web服务器。
在网络中查找信息源:带预算的查询
原文标题: Information Source Finding in Networks: Querying with Budgets
地址: http://arxiv.org/abs/2009.00795
作者: Jaeyoung Choi, Sangwoo Moon, Jiin Woo, Kyunghwan Son, Jinwoo Shin, Yung Yi
摘要: 在本文中,我们研究了在给定信息扩散图的样本快照的情况下,通过查询个人来检测扩散信息源的问题,其中询问了两个查询: em(i)响应者是否是源,以及 em(ii)(如果不是),哪个邻居将信息传播给受访者。我们考虑的情况是,受访者可能并不总是真实的,并且每次查询都会花费一些费用。我们的目标是针对给定的 0 < delta <1。量化必要和足够的预算,以实现检测概率 1- delta 。为此,我们研究了两种算法:自适应算法和非自适应算法,每种其中对应于我们是否根据先前受访者的答案自适应地选择下一个受访者。我们首先提供两种算法类型中必要预算的信息论下限。对于足够的预算,我们提出了两种实用的估计算法,分别为非自适应和自适应类型,并且针对每种算法,我们对预算进行了定量分析,以确保 1- delta 检测精度。这种理论分析不仅可以量化实用的估计算法所需的预算,这些算法可以在找到扩散源时实现给定的目标检测精度,而且还可以定量地描述非自适应类型的估计所需的额外预算,这些预算称为 em适应性差距。我们验证关于合成和现实世界社会网络拓扑的理论发现。
异构图神经网络推荐
原文标题: Heterogeneous Graph Neural Network for Recommendation
地址: http://arxiv.org/abs/2009.00799
作者: Jinghan Shi, Houye Ji, Chuan Shi, Xiao Wang, Zhiqiang Zhang, Jun Zhou
摘要: 电子商务的蓬勃发展催生了各种各样的推荐系统。实际上,在现实世界推荐系统中,各种类型的节点之间存在丰富而复杂的交互,可以将其构造为异构图。如何学习代表节点的嵌入是个性化推荐系统的基础和核心。元路径是一种广泛使用的结构,用于刻画此类交互作用下的语义并显示出改进节点嵌入的潜在能力。在本文中,我们提出了用于建议的异构图神经网络(HGRec),该网络通过聚集基于多跳元路径的邻居将高阶语义注入节点嵌入,并基于注意力机制通过多个元路径融合丰富的语义以获得全面的信息。节点嵌入。实验结果证明了丰富的高阶语义的重要性,并且还显示了HGRec潜在的良好解释性。
社会等级促进合作主导
原文标题: Social hierarchy promotes the cooperation prevalence
地址: http://arxiv.org/abs/2009.01018
作者: Rizhou Liang, Jiqiang Zhang, Guozhong Zheng, Li Chen
摘要: 社会等级制度很重要,在人类的社会经济活动和动物世界中不容忽视。在这里,我们将这个因素纳入演化博弈中,以了解它可能对合作成果产生什么影响。然后,两个参与者之间的概率策略采用不仅取决于他们的收益,还取决于他们的等级差异-高级别的参与者比低级别的伙伴更有可能重现其策略。通过模拟具有统一,指数和幂律三种不同等级分布的囚徒困境博弈的演化,我们发现在所有情况下合作水平都得到了提高,而在统一情况下合作水平是最佳的。增强归因于以下事实:等级制度的存在促进了以高级参与者为核心的合作集群的形成。我们还研究了两个层次的模型,其中揭示了类似的合作促进,并提供了一些理论分析。我们的发现表明,社会等级制度可能不会比以前认为的那样有害于合作。
将属性网络嵌入扩展至大型图
原文标题: Scaling Attributed Network Embedding to Massive Graphs
地址: http://arxiv.org/abs/2009.00826
作者: Renchi Yang, Jieming Shi, Xiaokui Xiao, Yin Yang, Juncheng Liu, Sourav S. Bhowmick
摘要: 给定一个图G,其中每个节点与一组属性关联,属性网络嵌入(ANE)将每个节点vin G映射到一个紧凑向量Xv,该向量可以用于下游机器学习任务。理想情况下,Xv应该刻画节点v对每个属性的亲和力,这不仅要考虑v自身的属性关联,而且还要考虑其沿G边沿的连接节点的关联。将有效的ANE计算扩展到具有数百万个节点的大规模图,将问题的难度推向全新的高度。现有的解决方案在此类图表上大都失败,从而导致成本过高,嵌入质量低下或两者兼而有之。本文提出了PANE,这是一种用于大规模图的ANE计算的有效且可扩展的方法,该方法可在多个基准数据集上达到最先进的结果质量,该质量通过以下三个常见预测任务的准确性来衡量:属性推断,链路预测和节点分类。 PANE通过三种主要算法设计获得了高可扩展性和有效性。首先,它基于属性网络的新型随机游走模型,制定了学习目标。在大型图上,最终的优化任务仍然具有挑战性。其次,PANE包括一个针对上述优化问题的高效求解器,其关键模块是精心设计的嵌入初始化,从而大大减少了收敛所需的迭代次数。最后,PANE通过上述求解器的非平凡并行化利用多核CPU,从而在保持所生成嵌入的高质量的同时,实现了可伸缩性。大量的实验在8个真实的数据集上比较了10种现有方法,结果表明PANE在结果质量方面始终优于所有现有方法,而速度要快几个数量级。
感性的LIAR:伪造索赔分类的扩展语料库和深度学习模型
原文标题: Sentimental LIAR: Extended Corpus and Deep Learning Models for Fake Claim Classification
地址: http://arxiv.org/abs/2009.01047
作者: Bibek Upadhayay, Vahid Behzadan
摘要: 社交媒体在我们日常生活和文化中的广泛融合,使人类比以往任何时候都可以更快,更轻松地访问信息流。但是,社交媒体平台固有的无监督性质也使传播虚假信息和虚假新闻变得更加容易。此外,在这样的平台中大量的信息流和高速度使得手动监视和控制信息传播是不可行的。本文旨在通过提出一种新颖的深度学习方法来自动检测社交媒体上的虚假短文本声明来解决此问题。我们首先介绍感性LIAR,它通过添加基于权利主张的情绪和情感分析的功能来扩展短期索赔的LIAR数据集。此外,我们提出了一种基于DistilBERT语言模型的新颖的深度学习架构,用于将索赔分类为真假。我们的结果表明,在Sentimental LIAR上训练的拟议体系结构可以达到70%的准确度,比以前报告的LIAR基准测试结果提高了约30%。
社会接触和传染病的传播
原文标题: Social contacts and the spread of infectious diseases
地址: http://arxiv.org/abs/2009.01140
作者: G. Dimarco, B. Perthame, G. Toscani, M. Zanella
摘要: 受COVID-19大流行的影响,我们通过将流行病学动态与基于人口的接触者的动力学模型相结合,介绍了社会性对传染病传播的影响的数学描述。动力学描述导致研究玻尔兹曼类型方程随时间的演变,该方程描述了易感,感染和康复个体的社会接触数量密度,其比例由流行病学中的经典隔室模型驱动。明确的计算表明,疾病的传播与接触者的平均人数密切相关,因此证明了政府为防止接触而采取的封锁策略是合理的。此外,动力学模型可以阐明如何通过仅减少经历大量日常接触的人员来实现选择性锁定策略的假设。反过来,这可以使最多只能维持全面封闭政策的经济活动得以维持。数值模拟证实了该模型描述流行病迅速传播的不同现象特征的能力。最后一部分致力于用来自不同欧洲国家的实验数据拟合拟议模型的数值解。
k社区高斯混合模型中社区检测的精确恢复
原文标题: Exact Recovery of Community Detection in k-Community Gaussian Mixture Model
地址: http://arxiv.org/abs/2009.01185
作者: Zhongyang Li
摘要: 我们在高斯混合模型上研究了社区检测问题,该模型将顶点划分为 k geq 2 个不同的社区。我们模型的主要区别在于,观测矩阵中不同条目的高斯扰动强度是不同的,并且我们不假定每个社区都有相同数量的顶点。我们明确找到最大似然估计精确恢复的阈值。应用包括超图上的社区检测。
关于Twitter上关于羟氯喹治疗COVID-19功效的极化对话立场数据集
原文标题: A Stance Data Set on Polarized Conversations on Twitter about the Efficacy of Hydroxychloroquine as a Treatment for COVID-19
地址: http://arxiv.org/abs/2009.01188
作者: Ece Çiğdem Mutlu, Toktam A. Oghaz, Jasser Jasser, Ege Tütüncüler, Amirarsalan Rajabi, Aida Tayebi, Ozlem Ozmen, Ivan Garibay
摘要: 在进行本研究时,导致COVID-19大流行的SARS-CoV-2病毒已在世界范围内广泛传播。考虑到政策,健康风险,财务困难等方面的不确定性,在线媒体(特别是Twitter平台)正在经历与这种大流行相关的大量活动。在热门话题中,有关未经证实的药物用于治疗和预防该疾病的两极化辩论引起了在线媒体用户的极大关注。在这项工作中,我们在COVID-19的背景下在Twitter上提供了用户生成内容的姿态数据集COVID-CQ。我们调查了14000多条推文,并手动注释了推文发起者有关使用“氯喹”和“羟氯喹”治疗或预防COVID-19的意见。据我们所知,在COVID-19大流行的背景下,COVID-CQ是Twitter用户立场的第一个数据集,并且是任何领域中关于用户对索赔的立场的最大Twitter数据集。我们已通过GitHub将这些数据集提供给研究社区。我们希望该数据集可用于许多研究目的,包括立场检测,关于此暴发的观点的演变和动态以及因应政策制定和事件等外来冲击而引起的观点变化。
在线游戏中技能的识别:范特西足球经理的案例
原文标题: Identification of skill in an online game: The case of Fantasy Premier League
地址: http://arxiv.org/abs/2009.01206
作者: Joseph D. O'Brien, James P. Gleeson, David J.P. O'Sullivan
摘要: 在所有结果都取决于个人表现的比赛中,都会出现结果是技巧还是运气的问题。我们通过分析大约100万名参加幻想英超联赛的参赛者的大型数据集来探讨这个问题,幻想英超联赛是一种在线幻想体育,管理人员从英式足球(足球)联赛中选择球员。我们证明了经理在多个季节中的排名是相关的,并且我们分析了经理为提高成功可能性而采取的行动。在这场比赛所基于的嘈杂比赛中,确定经理成功的主要因素是长期规划和始终如一的良好决策。随着时间的流逝,经理决策之间的相似性导致了“模板”团队的出现,这表明博弈中发生了某种形式的羊群效应。综上所述,这些发现表明,成功的管理人员在较长时期内对关键决策点具有共同的战略考虑和共识。
COVID-19大流行的最佳控制:葡萄牙的卫生控制措施
原文标题: Optimal control of the COVID-19 pandemic: controlled sanitary deconfinement in Portugal
地址: http://arxiv.org/abs/2009.00660
作者: Cristiana J. Silva, Carla Cruz, Delfim F. M. Torres, Alberto P. Munuzuri, Alejandro Carballosa, Ivan Area, Juan J. Nieto, Rui Fonseca-Pinto, Rui Passadouro da Fonseca, Estevao Soares dos Santos, Wilson Abreu, Jorge Mira
摘要: COVID-19大流行迫使决策者下达紧急禁闭令,以制止迅速大规模的蔓延。然而,在此阶段之后,社会被迫在降低传染病率和重新开放经济之间寻求平衡。迄今为止的经验为流行病的演变提供了数据,特别是由于制定了公共卫生措施而导致的人口动态。这允许制定预测数学模型来预测政治决策的后果。在这里,我们提出了一个这样做的模型,并将其应用于葡萄牙的案例。利用常微分方程组描述的数学确定性模型,我们适合了该国COVID-19的实际演变。它是对葡萄牙社会网络的分析的补充,该分析允许检测民意的变化并提供反馈以更新模型参数。通过这种方式,我们运用控制理论以使返回“正常生活”的人数最大化,并以最小的经济成本来最小化活动感染者的数量,同时保证较低的住院率。这项工作可以测试大流行管理的各种情况(关闭经济部门,公民部分/全部遵守保护措施,重症监护病房的床位数等),确保卫生系统的响应能力,因此公共卫生决策支持工具。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。