- COVID-19扩散的尺度特征;
- 利用异步更新的演化博弈进行网络重构;
- 通过不可观测链接的随机抽样进行链路预测的快速评估;
- 社交媒体资料策展;
- 基于资产交换模型的区域不平等模拟;
- 复杂网络舆论动态的迟滞和无序诱发的连续动力学类型有序;
- 基于局部流的超图聚类;
- 参数化目标和算法聚类二部图和超图;
- 聚类用于临床领域的分类多关系数据知识表示嵌入评价;
COVID-19扩散的尺度特征
原文标题: Scaling features in the spreading of COVID-19
地址: http://arxiv.org/abs/2002.09199
作者: Ming Li, Jie Chen, Youjin Deng
摘要: 自COVID-19爆发以来已有众多数据分析工作。有的研究基于假设指数增长的经典流行病学方法,另有少量研究指出幂律尺度对当前可得数据拟合更优。本文我们研究了中国(2020年1月20日至2020年2月19日)的数据,确实发现显著长的时间病例生长极为遵循幂律动力学。确诊病例、死亡和治愈案例数的幂指数分别为2.42(20),2.21(8)和4.14(20),表明大规模流行传播下可能有小世界网络结构。尽管死亡和治愈病例数仍未明显偏离幂律增长,但感染人数已出现了明显的负偏差,特别是湖北以外的区域。这表明病毒传播在大量控制措施下开始变慢。我们同时发现,尽管量级存在显著差异,湖北省和湖北以外的区域感染人数的增长动力学有很多相似之处。在此基础上,我们在双对数坐标下重新调整了湖北之外地区的感染人数尺度,使其尽可能多地与中国总感染人数重叠,从中大致外推得到病毒达峰时间约为2020年3月3日,届时感染人数约83000名。此外通过分析双对数尺度下的死亡率的动力学,我们粗略估计3月3日前后湖北省COVID-19死亡率约为4.0%~4.5%,湖北以外区域约为0.8%-1.2%。我们强调,我们的预测可能数量上并不可靠,因为数据分析只基于纯粹经验数据并使用了各种假设。
利用异步更新的演化博弈进行网络重构
原文标题: Network reconstruction from asynchronously updated evolutionary game
地址: http://arxiv.org/abs/2002.09105
作者: Hong-Li Zeng, Shu-Xuan Wang, Yan-Dong Guo, Shao-Meng Qin
摘要: 囚徒困境(PD)博弈玩家间的相互关系与重建演化的博弈数据。所有参加每一轮的比赛中发挥与他们的同行和增益相应的奖励博弈。然而,他们的策略是演化PD比赛中异步更新。玩家之间的交互的两种推理方法得出与天真的平均场(NMF)近似和最大相似度分别估计(MLE)。这两种方法被测试数值也为完全连接不对称谢林顿-帕特里克(SK)的模型,不同的数据长度,非对称度,收益和系统噪声(耦合强度)。我们发现,MLE方法的重建均方误差(MSE)成正比,数据长度的倒数,通常一半NMF的是(受益的更新次数的额外信息)。这两种方法都是稳健的不对称程度,但适用于大回报更好。与MLE相比,NMF是对接头强度,其倾向于弱耦合更加敏感。
通过不可观测链接的随机抽样进行链路预测的快速评估
原文标题: Fast Evaluation of Link Prediction by Random Sampling of Unobserved Links
地址: http://arxiv.org/abs/2002.09165
作者: Jingwei Wang, Yunlong Ma, Zeyu Chen, Xuheng Wang, Yuan Yun, Weiming Shen, Min Liu
摘要: 链路预测算法的评估需要估计网络中的所有未观测到的链接的存在的可能性。然而,未观察到的链路的数量与节点的数量的增加,这限制了链路预测在大型网络中呈指数增长。在本文中,我们提出了链路预测算法,即链路预测随机抽样一种新的评价方案。我们用这种方法来评估在不同环境和规模十个真实世界的网络链接12个预测性能。结果表明,业绩排名这些算法不会受到来自未观测到的链接随机抽样的很小一部分进行实验,无论是使用AUC或精密计量。此外,该采样方法可以降低计算复杂度的链路预测算法选自O在大型网络中的评价(N ^ 2)至O(N)。我们的研究结果表明,该方案是一个快速和有效的评价方法。
社交媒体资料策展
原文标题: Curating Social Media Data
地址: http://arxiv.org/abs/2002.09202
作者: Kushal Vaghani
摘要: 社会化媒体平台已经授权的人在当今时代脉搏的民主化。由于其巨大的知名度和极高的使用率,在社交媒体网站(例如,Twitter的,Facebook和Tumblr)公布的数据是信息的丰富的海洋。因此,社会印记的数据驱动的分析已经成为组织和政府的重要资产,以进一步提高其产品和服务。然而,由于动态和社交媒体数据的嘈杂本质,进行原始数据准确的分析是一项具有挑战性的任务。一个关键的要求是,收录的原始数据之前馈送到分析管线。这个策展过程将原始数据转化为背景化数据和知识。我们提出了一个数据管道策,即CrowdCorrect,使分析师洁面策划社会数据,并准备好应对可靠的分析。我们的管道提供了从使用现有的内部工具的社交媒体数据的语料库自动特征提取。此外,我们还提供采用自动和人群来源的办法是双纠错机制。这条管线的实现还包括自动创建微任务,以促进策划的原始数据人群用户贡献的一组工具。对于这项研究的目的,我们使用Twitter作为我们的激励社交媒体数据平台由于其受欢迎程度。
基于资产交换模型的区域不平等模拟
原文标题: Regional inequality simulations based on asset exchange models
地址: http://arxiv.org/abs/2002.09272
作者: Takeshi Kato, Yasuyuki Kudo, Hiroyuki Mizuno, Yoshinori Hiroi
摘要: 为了深入了解地区差别问题,我们提出了基于通过设置空间交换范围和等价交换增加偏置资产比例的概率存在于经济动能物理学收入交换模型新的地区性资产交换模型。资产分布和基尼系数的模拟表明,抑制地区差距需要,第一,提高了区域内经济循环率,第二,缩小的交换范围(区域间经济区)。避免资产的过度集中,由于反复的交流,但是,需要第三,增加本地支持偏差(分布标准)。包含这三种措施的综合解决方案使换档从过度集中的资产分布指数分布,最终接近正态分布,并进一步降低了基尼系数。展望未来,我们将进一步根据的视差设定在二维空间基于资产的产能,路径依赖和偏置拓展模型,并验证措施,以减少实际的社区区域不平等。
复杂网络舆论动态的迟滞和无序诱发的连续动力学类型有序
原文标题: Hysteresis and disorder-induced order in continuous kinetic-like opinion dynamics in complex networks
地址: http://arxiv.org/abs/2002.09366
作者: A. L. Oestereich, M. A. Pires, S. M. Duarte Queirós, N. Crokidakis
摘要: 在这项工作中,我们解决一个动力类与多个淬火和极化赋联网的人口动态意见模型。此外,我们认为是限制性的,这是仿照具有光滑的有界信心两两相互作用。我们的研究结果表明非平衡的滞后性和异质性辅助排序的有趣出现。这种有悖常理的现象是稳健的,以不同类型的网络架构,如随机,小世界和无标度。
基于局部流的超图聚类
原文标题: Localized Flow-Based Clustering in Hypergraphs
地址: http://arxiv.org/abs/2002.09441
作者: Nate Veldt, Austin R. Benson, Jon Kleinberg
摘要: 当地图聚类算法被设计为高效地检测被偏置到一个大的图的局部区域节点的小簇。虽然很多技术已经在当地图表集群发展,很少算法已被设计用来检测超图本地集群,包括数据对象之间的关系,多路这更好的模型复杂的系统。在本文中,我们提出了本地集群的框架的基础上削减最低和最高流量超图。我们的方法扩展上基于流的局部图聚类以往的研究,但在一些关键方面已一概而论。首先,我们将演示如何把广义超图 S 的最新结果 - T 切的问题。这使我们能够适应宽范围的不同的超图切的功能,其可以分配基于每个超边是如何跨越不同的簇分割不同的惩罚。此外,我们的算法附带了一些吸引人的理论性与低超图电导和超图规范化切痕的恢复节点套的条款。最后,也是最重要的是,我们的方法是强的地方,这意味着它的运行时间只取决于输入集的大小。在实践中,这让我们的方法来快速找到本地化集群没有探索的整个输入超图。我们证明了我们在本地群集检测实验在Amazon产品超图和一个堆栈溢出问题的超图法的力量。虽然这两个数据集涉及到几百万个节点,数以百万计的边,而大超边的平均尺寸,我们能够探测到本地集群在几秒钟或几分钟的事情,这取决于簇的大小。
参数化目标和算法聚类二部图和超图
原文标题: Parameterized Objectives and Algorithms for Clustering Bipartite Graphs and Hypergraphs
地址: http://arxiv.org/abs/2002.09460
作者: Nate Veldt, Anthony Wirth, David F. Gleich
摘要: 图聚类目标函数具有可调谐的解析参数使得能够检测不同类型的在同一图表中聚类结构。这些目标也提供其他非参数目标,这经常可以被捕获作为特殊情况的统一视图。以前的研究主要集中在标准曲线的参数目标,其中所有节点都是同一类型的,和模型边的成对关系。在我们的工作中,我们介绍了参数化的目标函数和近似算法专为集群二部图和超图的基础上,相关的聚类。这使我们能够与不同的节点类型(二部图)或多路的关系(超图)聚类数据集开发原则的方法。我们的目标超图涉及模块化和标准化切的高阶概念,并且是经由超图扩展技术适合于近似算法。我们的二分客观标准一般化二分相关聚类,并在一定的参数政权相当于bicluster缺失,即,除去边的最小数量的二部图分离成不相交bicliques。一般的问题是NP难的,但我们表明,在一定的参数制度就相当于一个双边匹配问题,这意味着它在这一制度多项式时间内可解。对于其他的制度,我们提供了基于LP-四舍五入近似保证。我们的研究结果包括bicluster删除第一个常数因子近似算法。我们说明了几次实验我们的框架的灵活性。这包括汇聚食物网和基于高阶序结构的电子邮件网络,检测零售产品在产品审核超图集群,并在几个真实世界的二部图评估我们在一系列的参数设置算法。
聚类用于临床领域的分类多关系数据知识表示嵌入评价
原文标题: Clustering as an Evaluation Protocol for Knowledge Embedding Representation of Categorised Multi-relational Data in the Clinical Domain
地址: http://arxiv.org/abs/2002.09473
作者: Jianyu Liu, Hegler Tissot
摘要: 学习知识表示是适用于许多特定领域的机器学习问题的一个日益重要的技术。嵌入知识表示在临床领域分类的多关系数据时,我们讨论传统的链路预测或知识图完成评估协议的效力。链路预测使用到的数据分割为训练和评估子集,导致沿培训信息的丢失和损害知识表示模型的准确性。我们提出了一个聚类评价协议作为替代替代传统使用的评估任务。我们使用嵌入的已评估的临床数据集知识嵌入方法训练的模型。与Pearson和Spearman相关实验结果表明了强有力的证据,所述新型提议的评价协议是pottentially能够替换链路预测。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。