- 多问题意见模型中的意识形态动机偏见;
- 桁架分解的流和批处理算法;
- 近似单源个性化PageRank查询的有效算法;
- 贝叶斯嵌入(BEM):通过集成知识图谱和行为特定网络来细化表示;
- 大学排名的纵向分析;
- 基于中心性的复杂网络重要边的识别;
- 复杂网络稳定性增强的带宽分配与资源调整;
- 在广义的年龄结构空间博弈中的合作;
- 五十年的美国、英国、德国和荷兰音乐排行榜显示文化进程正在加速发展;
- 通过图分区实现有效高效的网络嵌入初始化;
- 数学模拟有中间宿主的新兴人畜共患病的溢出动态;
- 注释的兴起与衰落:2000-2018年ACM CSCW变化的论文长度;
- 社交媒体虚假新闻检测;
多问题意见模型中的意识形态动机偏见
原文标题: Ideologically Motivated Biases in a Multiple Issues Opinion Model
地址: http://arxiv.org/abs/1908.10450
作者: Marcelo V. Maciel, André C. R. Martins
摘要: 据观察,人们倾向于拥有比预期更合理的内部意见。在这里,我们研究如何通过改变主体人如何在具有多个问题的意见动态模型中信任他们的同伴的意见而出现这种观察。以前的贝叶斯启发的持续意见的意见模型扩展到包括多个问题。在原始模型中,主体商往往更少信任与自己太不同的意见。我们以自然形式研究扩展模型的属性。我们还介绍了主体商的信任可能不仅取决于具体问题而且取决于对许多问题的平均意见的可能性。通过采用这种意识形态的观点,我们观察到个人意见的传播显著减少。
桁架分解的流和批处理算法
原文标题: Streaming and Batch Algorithms for Truss Decomposition
地址: http://arxiv.org/abs/1908.10550
作者: Venkata Rohit Jakkula, George Karypis
摘要: 桁架分解是一种用于分析大型稀疏图的方法,以便连续识别更好的连通子图。由于在许多领域中底层图表随时间而变化,因此其相关的桁架分解也需要更新。这项工作侧重于逐步更新现有桁架分解的问题,并做出以下三个重要贡献。首先,它提出了一种理论,可以确定桁架分解如何随着新边的增加而改变。其次,它开发了一种有效的增量算法,该算法结合了各种优化,以在每次边添加后更新桁架分解。这些优化旨在减少算法探索的边数。第三,它将该算法扩展到批量更新(即,在添加一组边之后需要更新桁架分解),这减少了需要执行的整体计算。我们评估了算法在实际数据集上的性能。我们的增量算法实现了超过250000倍的平均加速,用于在具有相对于非增量算法的1000万条边的图中插入边。此外,我们对批量更新的实验表明,我们的批处理算法始终比增量算法表现更好。
近似单源个性化PageRank查询的有效算法
原文标题: Efficient Algorithms for Approximate Single-Source Personalized PageRank Queries
地址: http://arxiv.org/abs/1908.10583
作者: Sibo Wang, Renchi Yang, Runhui Wang, Xiaokui Xiao, Zhewei Wei, Wenqing Lin, Yin Yang, Nan Tang
摘要: 给定图 G ,源节点 s 和目标节点 t , s 的个性化PageRank(PPR)相对于 s 是从 s 开始的随机游走终止的概率在 t 。 PPR查询的一个重要变体是单源PPR(SSPPR),它枚举 G 中的所有节点,并返回相对于给定源 s 具有最高PPR值的top- k 节点。一般而言,PPR和SSPPR尤其在网络搜索和社会网络中具有重要的应用,例如在Twitter的Who-To-Follow推荐服务中。然而,已知PPR计算在大图上是昂贵的,并且抵抗索引。因此,先前的解决方案要么使用启发式算法,要么不能保证结果质量,要么依赖于现代数据中心的强大计算能力,这是昂贵的。受此启发,我们提出了有效的无索引和基于索引的近似PPR处理算法,严格保证了结果质量。我们首先介绍FORA,这是一种近似的SSPPR解决方案,结合了两种现有方法Forward Push(快速但不保证质量)和Monte Carlo Random Walk(准确但缓慢)以简单但非平凡的方式,导致两者都很高准确性和效率。此外,FORA包括一个简单有效的索引方案,以及一个具有高修剪能力的顶级 k 选择模块。大量实验表明,所提出的解决方案比其各自的竞争对手更有效。值得注意的是,在数十亿边的Twitter数据集中,FORA使用单个商品服务器在1秒内回答了前500个近似的SSPPR查询。
贝叶斯嵌入(BEM):通过集成知识图谱和行为特定网络来细化表示
原文标题: Bayes EMbedding (BEM): Refining Representation by Integrating Knowledge Graphs and Behavior-specific Networks
地址: http://arxiv.org/abs/1908.10611
作者: Yuting Ye, Xuwu Wang, Jiangchao Yao, Kunyang Jia, Jingren Zhou, Yanghua Xiao, Hongxia Yang
摘要: 知识图和行为图的低维嵌入已被证明在各种任务中非常强大,从预测实体之间的未观察到的边到内容推荐。两种类型的图可以包含相同实体/节点的不同且互补的信息。然而,之前的工作集中于知识图嵌入或行为图嵌入,而很少有工作以统一的方式考虑。在这里,我们介绍BEM,一个贝叶斯框架,其中包含来自知识图和行为图的信息。更具体地说,BEM从知识图中获取预先训练的嵌入,并通过贝叶斯生成模型将它们与来自行为图的预训练嵌入集成。 BEM能够从两侧相互细化嵌入,同时保留自己的拓扑结构。为了显示我们方法的优越性,我们对三个基准数据集进行了一系列实验:节点分类,链路预测,与Freebase相关的两个小数据集的三元组分类,以及大规模电子商务数据集的项目推荐。
大学排名的纵向分析
原文标题: A Longitudinal Analysis of University Rankings
地址: http://arxiv.org/abs/1908.10632
作者: Friso Selten, Cameron Neylon, Chun-Kai Huang, Paul Groth
摘要: 在本文中,ARWU,THE和QS全球大学排名进行了研究。在对排名方法进行描述之后,显示大学排名随着时间的推移是稳定的,但三个排名之间存在差异。此外,使用主成分分析和探索性因子分析,我们表明用于构建排名的变量主要衡量两个潜在因素:大学声誉和研究产出。通过关联这些因素并绘制大学的区域总量与他们的对比,可以看出排名之间的差异。最后,我们详细说明如何根据对排名过程经常发表的批评来看待这些分析的结果。这表明排名使用的变量可能无法捕获他们声称要衡量的概念。这项研究证明了大学排名量化大学表现的模糊性。
基于中心性的复杂网络重要边的识别
原文标题: Centrality-based identification of important edges in complex networks
地址: http://arxiv.org/abs/1908.10667
作者: Timo Bröhl, Klaus Lehnertz
摘要: 中心性是网络科学中最基本的指标之一。尽管存在大量用于测量各个顶点的中心性的方法,但是现在只有少数度量来测量各个边的中心性。我们将顶点的各种广泛使用的中心概念修改为边的概念,以便找到网络中哪些边在其他顶点对之间是重要的。着眼于边的重要性,我们提出了一种基于边中心性的网络分解技术来识别边集合的层次结构,其中每个集合与不同的重要性级别相关联。我们使用各种范式网络模型评估我们的方法的效率,并应用新颖的概念来识别社会网络分析中常用基准模型以及不断发展的癫痫大脑网络中的重要边和重要边集。
复杂网络稳定性增强的带宽分配与资源调整
原文标题: Bandwidth Allocation and Resource Adjustment for Stability Enhancement in Complex Networks
地址: http://arxiv.org/abs/1908.10671
作者: K. Y. Henry Tsang, K. Y. Michael Wong
摘要: 我们引入了消息传递算法和离散格林函数来阐明资源波动如何确定网络中的流量波动,从而优化全局成本函数。为了增强网络对波动的鲁棒性,我们开发了链路中最优带宽分配和节点优化资源调整的方案。在网络的总带宽是固定的情况下,最佳带宽分配的方法是增加链路中的带宽,使得可以最小化在波动下的网络中的过载链路的数量或过量流量。类似地,最佳资源调整的方法是在波动中最小化网络中的过载链路的数量,其中网络中的总资源变化是固定的。与传统的比例带宽分配或资源减少方法相比,发现优化的带宽分配或资源调整可以高度增强网络对波动的稳定性。最优带宽分配和资源调整方案规定的负载和电流的变化彼此相关,除了一些表现出中继效应的节点。
在广义的年龄结构空间博弈中的合作
原文标题: Cooperation in a generalized age-structured spatial game
地址: http://arxiv.org/abs/1908.10687
作者: Paulo Victor Santos Souza, Rafael Silva, Chris T. Bauch, Daniel Girardi
摘要: 一群自私的个体中合作行为的出现和盛行仍然是(演化博弈论)的难题,正是因为它直接与自然选择的中心思想相冲突。因此,近年来,即使与个人利益冲突,寻求理解如何促进合作的理解也在加强。我们研究了在年龄结构的演化空间博弈中合作的出现。其中,玩家随着时间的推移而逐渐衰老,并且在每一轮文本取决于他们的年龄后获得的回报。我们发现,博弈的结果受到用于根据每个玩家的年龄修改支付的分配类型的强烈影响。结果表明,在某些情况下,合作者不仅可以生存,而且可以控制人口。
五十年的美国、英国、德国和荷兰音乐排行榜显示文化进程正在加速发展
原文标题: Five decades of US, UK, German and Dutch music charts show that cultural processes are accelerating
地址: http://arxiv.org/abs/1908.10694
作者: Lukas Schneider, Claudius Gros
摘要: 通过分析美国,英国,德国和荷兰音乐排行榜的时间表,我们发现专辑生命周期的演变和每周等级变化的大小为文化过程的加速提供了证据。在过去五十年的大部分时间里,排名第一的专辑需要超过一个月的时间才能登顶,如今专辑的排名从一开始就是排名最高,或者根本不排名。在过去的三十年中,顶级专辑的数量从每年大约十几张增加到大约40张。专辑有效期的分布在过去几十年中从对数正态分布发展到一个权力法,一个深刻的变化。我们提出了人类活动的信息论方法,我们认为个人时间范围的衰落相关性可能导致这种现象。此外,我们发现销售和基于播放的图表在统计上有所不同,并且流式传输的包含会对图表多样性产生不利影响。我们还指出,意见动态不仅可以在文化领域加速,也可以在其他环境中加速,特别是在政治方面,它可能会产生深远的影响。
通过图分区实现有效高效的网络嵌入初始化
原文标题: Effective and Efficient Network Embedding Initialization via Graph Partitioning
地址: http://arxiv.org/abs/1908.10697
作者: Wenqing Lin, Feng He, Faqiang Zhang, Xu Cheng, Hongyun Cai
摘要: 网络嵌入已在文献中进行了深入研究,并广泛用于各种应用,例如链路预测和节点分类。虽然以前的工作侧重于新算法的设计或针对各种问题设置而定制,但是经常会错过对学习过程中的初始化策略的讨论。在这项工作中,我们解决了网络嵌入初始化的这一重要问题,该问题可以显著提高算法在有效性和效率方面的性能。具体来说,我们首先利用图分区技术将图分成几个不相交的子集,然后根据分区构造一个抽象图。我们通过计算抽象图上的网络嵌入来获得图中每个节点的嵌入初始化,该网络嵌入比输入图小得多,然后在输入图中的节点之间传播嵌入。通过对各种数据集的大量实验,我们证明了我们的初始化技术显著提高了最先进算法在链路预测和节点分类评估方面的性能,分别高达7.76%和8.74%。此外,我们表明初始化技术将现有技术的运行时间减少了至少20%。
数学模拟有中间宿主的新兴人畜共患病的溢出动态
原文标题: Mathematically Modeling Spillover Dynamics of Emerging Zoonoses with Intermediate Hosts
地址: http://arxiv.org/abs/1908.10791
作者: Katherine P. Royce, Feng Fu
摘要: 世界卫生组织将人畜共患疾病描述为一种主要的大流行威胁,对这些疾病的行为进行建模是其控制的关键组成部分。许多新出现的人畜共患病,例如SARS,Nipah和Hendra,在他们的野生型中突变,同时在中间宿主群体(通常是国内物种)中传播,在人类中变得更容易传播,而且,这种传播途径只会变得更有可能世界各地的农业和贸易都在加剧。通过中间宿主的通过使许多其他罕见的疾病能够更好地适应人类,因此用数学流行病学模型理解这一过程对于预防新出现的人畜共患病的流行,指导公共卫生的政策干预以及预测流行病的行为是必要的。在本文中,我们通过模拟三种宿主物种(即野生水库,中间家畜和人类)内部和之间的传播动态来解释在中间宿主中突变的人畜共患病的溢出效应。我们计算了病原体的基本生殖数,为人畜共患病的出现动态提供了临界条件,并对可容许的疾病平衡进行了稳定性分析。我们的分析结果与系统的长期模拟非常吻合。我们发现,在存在生物学现实的种间传播参数的情况下,人畜共患疾病即使不能在其水库和中间宿主物种中持续存在,也可在人类中建立自身。我们的模型和结果可用于了解任何人畜共患病与中间宿主的动态行为,并协助保护公众健康的努力。
注释的兴起与衰落:2000-2018年ACM CSCW变化的论文长度
原文标题: The Rise and Fall of the Note: Changing Paper Lengths in ACM CSCW, 2000-2018
地址: http://arxiv.org/abs/1908.10808
作者: R. Stuart Geiger
摘要: 在本文中,我定量研究了2000 - 2018年ACM CSCW发表论文篇幅的各种趋势,重点关注编辑和评审政策的几个主要转变。重点是4页笔记的上升和下降,该笔记2004年作为单页提交类型引入10页双栏“全文”格式。从2004年到2012年,4页的2,500到4,000个单词的注释一直占所有出版物的20-30%。 2013年,正式删除了最小和最大页面长度,完整论文和说明之间没有正式区分。这张纸条很快就完全消失了,这种流派与纸张长度不断上升的趋势共同发生。我讨论了这些发现,因为它们直接关联CSCW中的当地问题,以及围绕类型理论的长期理论讨论以及社会技术结构和可供性如何影响参与分布式计算机中介组织和用户生成内容平台的情况。对于纸币的下降以及更长和更长的纸张的出现有很多可能的解释,我将其确定用于未来的工作。最后,我总结了这些调查结果对CSCW社区的影响,特别是考虑到类型规范如何影响CSCW中哪些奖学金和学者的兴趣,以及是否应围绕论文制定新的自上而下的规则或自下而上的指导方针长度和不同种类的贡献。
社交媒体虚假新闻检测
原文标题: False News Detection on Social Media
地址: http://arxiv.org/abs/1908.10818
作者: Juan Cao, Qiang Sheng, Peng Qi, Lei Zhong, Yanyan Wang, Xueyao Zhang
摘要: 社交媒体已成为人们消费和分享新闻的主要信息平台。然而,它也使广泛传播虚假新闻,即在社交媒体上发布的新闻帖子,这些新闻可以证实是虚假的,对社会造成了严重的负面影响。为了帮助防止在社交媒体上进一步传播虚假新闻,我们设立了此次竞赛,以推动自动化实时虚假新闻检测方法的发展。具体来说,本次比赛包括三个子任务:虚假新闻文本检测,虚假新闻图像检测和虚假新闻多模式检测,旨在激励参与者进一步探索多种方式检测虚假新闻和合理融合的效率多模态内容的方法。为了更好地支持这一竞争,我们还在微博社交平台(MCG-FNeWS)上构建和宣传关于虚假新闻的多模式数据存储库,以帮助评估参与者不同方法的表现。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。