- 数据压缩以选择适当的动态网络表示;
- 分形结构的合作组织;
- 众包音乐知识管理中的专业知识和动态:以Genius平台为例;
- 交通干预重塑纽约通勤:评估共享出行和曼哈顿拥堵附加费影响的概率模拟框架;
- 语言网络:一种实用的方法;
- TriNE:三元异构网络的网络表示学习;
- 细化相似性矩阵以准确聚类属性网络;
- 迈向交通运输互联网:概念,架构和要求;
- 请不要造谣!COVID伪推文检测的多指标语言方法;
- 城市社区规模分布;
- 印度贫困转变的长期动态;
- Covid-19在发展中国家的城市社区和贫民窟中的传播;
- NwQM:维基百科的神经网络质量评估框架;
- 理解基于点击率的Twitter参与度;
- InstantEmbedding:高效的本地节点表示;
- SIR流行病模型的分析参数估计在COVID-19大流行中的应用;
- STP-UDGAT:下一个POI推荐的时空偏好用户维图注意网络;
- 基于知识图谱中动态个人感知的影响力最大化;
- K隔离模式下的Covid-19流行:网络方法;
- 对抗他人!在社交媒体网络中检测道德暴行;
- 解耦的动态图深度生成;
数据压缩以选择适当的动态网络表示
原文标题: Data compression to choose a proper dynamic network representation
地址: http://arxiv.org/abs/2010.06885
作者: Remy Cazabet
摘要: 现在,动态网络数据可在各种上下文和域中使用。存在几种表示形式主义来表示动态网络,但是对于给定的数据集,没有一种众所周知的方法来选择一种表示形式。在本文中,我们提出了一种基于数据压缩的方法,可以在三个最重要的表示形式之间进行选择:快照,链接流和间隔图。我们将该方法应用于合成数据集和真实数据集,以显示该方法及其可能的应用的相关性,例如在面对新数据集时选择适当的表示形式,并以有效的方式存储动态网络。
分形结构的合作组织
原文标题: Organization of cooperation in fractal structures
地址: http://arxiv.org/abs/2010.06800
作者: Dan Peng, Ming Li
摘要: 众所周知,小世界结构构成了维持合作并因此加强合作的充分条件。相反,分形/大世界结构(节点之间的平均距离以幂律方式随系统大小尺度)被认为抑制了合作的出现。在本文中,我们表明分形结构并不总是在合作组织中发挥消极作用。与常规网络相比,分形结构甚至可以促进合作的出现。这主要取决于局部紧凑型集群的存在。这些集群之间的稀疏连接构成了一个不对称的障碍,叛逃策略几乎是不可能跨越的,但是合作策略的机会却不太小。实际上,只要存在这样的结构,网络就不必是标准的分形。反过来,当不存在这种典型结构时,分形结构也将抑制协作的出现,例如通过稀释随机树状网络而获得的分形配置。我们的发现还澄清了先前研究中的一些矛盾,并建议从常规网络中删除链接或将链接插入常规网络都可以增强合作。
众包音乐知识管理中的专业知识和动态:以Genius平台为例
原文标题: Expertise and Dynamics within Crowdsourced Musical Knowledge Curation: A Case Study of the Genius Platform
地址: http://arxiv.org/abs/2006.08108
作者: Derek Lim, Austin R. Benson
摘要: 许多平台主要从志愿者那里收集众包信息。随着这种类型的知识管理变得越来越普遍,贡献形式也发生了很大变化,并且受到跨不同平台的各种过程的驱动。因此,一个平台的模型不一定适用于其他平台。在这里,我们研究Genius的时间动态,Genius是一个主要为用户提供的歌曲歌词注释设计的平台。 Genius的一个独特方面是注解是非常本地化的-带注解的歌词可能只是一首歌的几行-但也与歌曲,专辑,艺术家或流派密切相关。我们分析了与歌词注解及其编辑相关的几个动态过程,这些过程与其他平台的模型大不相同。例如,关于歌曲注释的专业知识呈“ U形”,其中专家是早期和晚期贡献者,非专家是中间贡献者;我们开发了一种刻画此类行为的用户实用程序模型。我们还发现,在用户的生命周期的早期出现了一些贡献特征,这些特征将(最终)专家与非专家区分开。结合我们的发现,我们开发了一种用于用户专业知识的早期预测的模型。
交通干预重塑纽约通勤:评估共享出行和曼哈顿拥堵附加费影响的概率模拟框架
原文标题: Transportation Interventions Reshaping NYC Commute: the Probabilistic Simulation Framework Assessing the Impacts of Ridesharing and Manhattan Congestion Surcharge
地址: http://arxiv.org/abs/2010.06588
作者: Devashish Khulbe, Chaogui Kang, Stanislav Sobolevsky
摘要: 了解计划中的交通运输解决方案和干预措施对城市系统的整体影响是一项复杂的挑战,但对决策至关重要。这种影响评估的基础是估算干预措施导致的运输方式变化。尽管运输计划中已经建立了完善的模式选择评估模型,例如嵌套多项式logit模型,但个人选择模拟可能更适合解决模式转变,从而始终如一地考虑个人偏好。此外,没有任何模型可以完美地代表现实,而推断模型所需的关于实际交通选择的可用地面真实数据通常不完整或不一致。本文通过提供一个单独的模式选择和模式转换仿真模型以及贝叶斯推理框架来应对这些挑战。它考虑了数据以及模型估计中的不确定性,并将其转化为结果模式偏移和影响的不确定性。该框架是针对以下两种干预案例进行评估的:在纽约市引入乘车共享,以及最近引入的曼哈顿拥堵附加费。通过成功地对上述案例进行评估,该框架可用于评估模式转变以及由此对决策者或运输公司正在考虑的任何未来城市交通解决方案和政策带来的经济,社会和环境影响。
语言网络:一种实用的方法
原文标题: Language Networks: a Practical Approach
地址: http://arxiv.org/abs/2010.06710
作者: Jorge A. V. Tohalino, Diego R. Amancio
摘要: 该手稿对语言网络主题进行了简短而实用的介绍。本文旨在帮助没有文本和/或网络分析实践经验的研究人员。我们提供了有关如何使用基于网络的功能对文本进行建模和特征化的实用教程。在本教程中,我们还包括预处理和网络表示的示例。还简要介绍了结合网络科学和文本分析的主要任务。本文的进一步发展将包括通过机器学习方法对网络分类的实际描述。
TriNE:三元异构网络的网络表示学习
原文标题: TriNE: Network Representation Learning for Tripartite Heterogeneous Networks
地址: http://arxiv.org/abs/2010.06816
作者: Zhabiz Gharibshah, Xingquan Zhu
摘要: 在本文中,我们研究了三方异构网络的网络表示学习,它学习了具有三种类型节点实体的网络的节点表示特征。我们认为三方网络在现实世界的应用中很常见,表示学习的基本挑战是网络中各种节点类型和链接之间的异构关系。为了应对这一挑战,我们开发了称为TriNE的三方异构网络嵌入。该方法考虑了唯一的用户-项目-标签三方关系,以构建目标函数来建模节点之间的显式关系(观察到的链接),并刻画三方节点之间的隐式关系(跨三方节点集的未观察到的链接)。该方法组织由元路径指导的随机游走,以为网络中的所有节点类型创建异构邻域。然后,基于联合优化,利用此信息来训练异构跳跃图模型。现实世界中的三方网络上的实验使用嵌入节点功能验证了TriNE在在线用户响应预测方面的性能。
细化相似性矩阵以准确聚类属性网络
原文标题: Refining Similarity Matrices to Cluster Attributed Networks Accurately
地址: http://arxiv.org/abs/2010.06854
作者: Yuta Yajima, Akihiro Inokuchi
摘要: 由于社会网络的近来流行以及在所有领域中发表的研究论文数量的增加,由具有属性的对象(例如人和论文)之间的关系组成的归属网络正在变得越来越大。因此,正在积极地进行各种关于将属性网络聚类为子网络的研究。当使用谱聚类对属性网络进行聚类时,聚类的准确性会受到相似度矩阵的质量的强烈影响,这些相似度矩阵会输入到谱聚类中,并代表对象对之间的相似度。在本文中,我们旨在通过在对它们应用谱聚类之前改进矩阵来提高准确性。通过将谱聚类与相似矩阵在精炼前后的准确性进行比较,我们验证了我们提出的方法的实用性。
迈向交通运输互联网:概念,架构和要求
原文标题: Towards the Transportation Internet: Concepts, Architectures and Requirements
地址: http://arxiv.org/abs/2010.06880
作者: Hui Li, Yongquan Chen, Bokui Chen, Chong Wang
摘要: 互联网已经成为一般的网络设计范例。能源互联网是在能源领域应用的成功案例。云计算,5G,人工智能,自动驾驶和移动服务等技术的发展推动了颠覆性交通变革。我们通过将范式引入交通领域来提出交通互联网。运输互联网为运输带来了动力,效率,智能,可扩展性和开放性。它还为将来的运输自动化提供了有价值的参考系统。通过与互联网的比较,本文提出了概念,提出了架构并提出了交通互联网的要求。进行了小规模验证。
请不要造谣!COVID伪推文检测的多指标语言方法
原文标题: No Rumours Please! A Multi-Indic-Lingual Approach for COVID Fake-Tweet Detection
地址: http://arxiv.org/abs/2010.06906
作者: Debanjana Kar, Mohit Bhardwaj, Suranjana Samanta, Amar Prakash Azad
摘要: 当前全球大流行的COVID-19造成的突然广泛威胁已对我们的生活产生了前所未有的影响。人类正在经历前所未有的巨大恐惧和对社交媒体的依赖。恐惧不可避免地导致恐慌,猜测和错误信息的传播。许多政府已采取措施制止此类错误信息的传播,以维护公共利益。除了采取有效的外联措施外,人口统计学上的当地语言系统在这项工作中也可以发挥重要作用。为此,我们提出了一种方法,可以从社交媒体(如推文)中尽早检测到除英语以外的多种印度语言的有关COVID-19的虚假新闻。此外,我们还创建了带注释的Hindi和孟加拉语推文数据集,用于伪造新闻检测。我们提出了一个基于BERT的模型,该模型增加了从Twitter提取的其他相关功能,以识别假推文。为了将我们的方法扩展到多种印度语言,我们诉诸于基于mBERT的模型,该模型在北印度语和孟加拉语中创建的数据集上进行了微调。我们还提出了一种零击学习方法,以减轻此类低资源语言的数据稀缺性问题。通过严格的实验,我们证明了我们的方法在假推文检测中达到了大约89%的F分数,这取代了最新技术(SOTA)的结果。此外,我们为印地语和孟加拉语这两种印度语建立了第一个基准。使用我们的注释数据,我们的模型在北印度语中实现了约79%的F分数,在孟加拉语推文中实现了81%的F分数。我们的零射模型在没有任何注释数据的情况下在印地语中达到约81%的F得分,在孟加拉语推文中达到78%的F得分,这清楚地表明了我们方法的有效性。
城市社区规模分布
原文标题: Distribution of neighborhood size in cities
地址: http://arxiv.org/abs/2010.06946
作者: Anand Sahasranaman, Henrik Jeldtoft Jensen
摘要: 我们研究了12个全球城市中的社区分布,发现在考虑中的所有城市中,社区规模的分布遵循指数衰减。我们能够分析地表明,邻域规模的这种指数分布与观察到的城市规模的齐普夫定律是一致的。我们试图用一种邻里动力学模型来解释邻里规模指数衰减的出现,在这种模型中,迁入和迁徙是由财富来调节的。我们发现,正如经验观察到的那样,该模型针对一系列参数规范在邻域大小分布中生成指数衰减。发现使用基于财富的比较性指标来评估社区的相对吸引力,并结合严格的负担能力阈值来协调城市内部的移动,这是出现指数分布的必要条件。虽然由于全局耦合动力学而导致分析处理很困难,但我们使用一个简单的两个邻域系统来说明产生平衡的非相等邻域大小分布的精确动力学。
印度贫困转变的长期动态
原文标题: Long term dynamics of poverty transitions in India
地址: http://arxiv.org/abs/2010.06954
作者: Anand Sahasranaman
摘要: 我们使用带有重新分配(RGBM)的几何布朗运动随机模型对贫困的动力学进行建模,并探讨了1952-2006年期间的暂时性贫困和持续性贫困。我们发现,每年从贫困中脱贫的情况很普遍,并且呈上升趋势,而增长的主要原因是脱贫的情况。尽管出现了这种令人鼓舞的趋势,甚至到时限即将结束,仍有不平凡的个人每年仍在转变为贫困,这表明处于贫困线附近的人们的经济脆弱性。我们还发现,尽管贫困持续存在的可能性正在缓慢下降,但随着时间的推移,贫困的持续存在仍显著。在这种情况下,特别令人关注的是收入分配最底层的人的贫困状况。贫困线的选择似乎会影响动态,较高的贫困线对应于较低的过渡和较高的持久性概率。出现的瞬态和持久性动力学的独特性质表明,应对这些现象的方法必须有所不同,可能包括缺失的金融市场和国家行为。
Covid-19在发展中国家的城市社区和贫民窟中的传播
原文标题: Spread of Covid-19 in urban neighbourhoods and slums of the developing world
地址: http://arxiv.org/abs/2010.06958
作者: Anand Sahasranaman, Henrik Jeldtoft Jensen
摘要: 我们研究了Covid-19在发展中国家城市社区中的传播情况,发现少数病例占大多数病例(k-index〜0.7)。我们还发现,这些国家/地区在各州/省的全国性病例分布也显示出相似的不平等,表明各个规模之间存在自我相似性。在所有正在考虑的城市中,发现带有贫民窟的社区的病例密度最高,这表明贫民窟构成了该流行病中最危险的城市地区。我们提出了一种随机网络模型,用于研究通过在城市中物理上接近和偶然的日常人类接触传播呼吸道疾病的传播,并模拟具有贫民窟和非贫民窟两种邻里的城市的结果。该模型再现了一组广泛的参数值的观察到的经验结果-反映了这些发现总体上对流行病传播的潜在效度,尤其是在发展中国家的城市中。我们还发现,随着流行病的发展,病例的分布变得越来越不平等,在流行病结束时,贫民区的高峰和累积病例数都比非贫民窟差。因此,发展中世界的大贫民窟爆发了最脆弱的人群,从公共卫生和社会经济平等的角度来看,亚洲和非洲大都市的持续增长给未来的呼吸道爆发带来了巨大挑战。
NwQM:维基百科的神经网络质量评估框架
原文标题: NwQM: A neural quality assessment framework for Wikipedia
地址: http://arxiv.org/abs/2010.06969
作者: Bhanu Prakash Reddy, Sasi Bhusan, Soumya Sarkar, Animesh Mukherjee
摘要: 数以百万计的人,不论其社会经济和人口背景如何,每天都在依赖Wikipedia文章,以使自己了解流行和晦涩的话题。编辑已将文章分为几类质量,这表明它们作为百科全书内容具有可靠性。这种手动指定是一项繁重的任务,因为它需要对百科全书语言有深入的了解,并且需要导航circuit回的Wiki指南集。在本文中,我们提出了神经维基百科QualityMonitor(NwQM),这是一种新颖的深度学习模型,该模型可累积来自多个关键信息源(例如文章文本,元数据和图像)的信号,以获得改进的维基百科文章表示形式。我们介绍了我们的方法与大量可用解决方案的比较,并通过详细的消融研究显示出比最新方法提高了8%。
理解基于点击率的Twitter参与度
原文标题: Understanding Twitter Engagement with a Click-Through Rate-based Method
地址: http://arxiv.org/abs/2010.06985
作者: Andrea Fiandro, Jeanpierre Francois, Isabeau Oliveri, Simone Leonardi, Matteo A. Senese, Giorgio Crepaldi, Alberto Benincasa, Giuseppe Rizzo
摘要: 本文介绍了针对RecSys Challenge 2020的POLINKS解决方案,该解决方案在最终排行榜中排名第六。我们分析利用点击率值解决挑战任务的解决方案的性能,将其与梯度提升模型进行比较,并报告用于计算最终排行榜的质量指标。
InstantEmbedding:高效的本地节点表示
原文标题: InstantEmbedding: Efficient Local Node Representations
地址: http://arxiv.org/abs/2010.06992
作者: Ştefan Postăvaru, Anton Tsitsulin, Filipe Miguel Gonçalves de Almeida, Yingtao Tian, Silvio Lattanzi, Bryan Perozzi
摘要: 在本文中,我们介绍了InstantEmbedding,这是一种使用本地PageRank计算生成单节点表示的有效方法。我们从理论上证明了我们的方法在亚线性时间内产生了全局一致的表示。我们通过对超过10亿条边的真实数据集进行广泛的实验,以经验证明这一点。我们的实验证实,与传统方法(包括DeepWalk,node2vec,VERSE和FastRP)相比,InstantEmbedding需要更少的计算时间(快9,000倍)和更少的内存(超过8,000倍)来生成单个节点的嵌入。我们还表明,我们的方法可以产生高质量的表示,证明在诸如节点分类和链路预测之类的任务上,无监督表示学习的结果达到或超过了最新技术水平。
SIR流行病模型的分析参数估计在COVID-19大流行中的应用
原文标题: Analytical parameter estimation of the SIR epidemic model. Applications to the COVID-19 pandemic
地址: http://arxiv.org/abs/2010.07000
作者: Dimiter Prodanov
摘要: 2019年冠状病毒病(COVID-19)大流行的剧烈爆发及其持续发展激发了科学界对流行病建模和预测的兴趣。 SIR(易感感染清除)模型是流行病暴发的简单数学模型,但数十年来,它一直在逃避社区的努力以得出明确的解决方案。目前的工作证明这是一项艰巨的任务。值得注意的是,事实证明,该模型的显式解决方案需要引入与Wright的Omega函数有关的新的先验特殊函数。本手稿报告了适用于SIR模型参数估计的新分析结果和数值程序。该手稿介绍了一种近似发生率变量的迭代算法,该算法可根据观察到的病例数估算模型参数。数值方法以2020年1月至2020年6月期间几个欧洲国家的欧洲疾病预防控制中心(ECDC)的数据为例。
STP-UDGAT:下一个POI推荐的时空偏好用户维图注意网络
原文标题: STP-UDGAT: Spatial-Temporal-Preference User Dimensional Graph Attention Network for Next POI Recommendation
地址: http://arxiv.org/abs/2010.07024
作者: Nicholas Lim, Bryan Hooi, See-Kiong Ng, Xueou Wang, Yong Liang Goh, Renrong Weng, Jagannadan Varadarajan
摘要: 下一兴趣点(POI)的建议是跨基于位置的社会网络(LBSN)和交通运输领域的长期存在的问题。基于最近的递归神经网络(RNN)的方法基于独立的用户访问序列在本地视图中学习POI-POI关系。这限制了模型在全局视图中直接连接和跨用户学习以推荐经过语义训练的POI的能力。在这项工作中,我们提出了一个时空偏好用户维图注意力网络(STP-UDGAT),这是一种新颖的探索-利用模型,可以同时利用个性化的用户偏好并在全球时空-偏好(STP)邻域中探索新的POI。 ,同时允许用户有选择地向其他用户学习。此外,我们提出随机游走作为掩蔽的自我注意选项,以利用STP图的结构并在探索过程中找到新的高阶POI邻居。在六个实际数据集上的实验结果表明,我们的模型明显优于基线和最新方法。
基于知识图谱中动态个人感知的影响力最大化
原文标题: Influence Maximization Based on Dynamic Personal Perception in Knowledge Graph
地址: http://arxiv.org/abs/2010.07125
作者: Ya-Wen Teng, Yishuo Shi, Chih-Hua Tai, De-Nian Yang, Wang-Chien Lee, Ming-Syan Chen
摘要: 社会网络上的病毒式营销,也称为影响力最大化(IM),旨在通过最大化其影响力的总传播来选择k个用户来推广目标项目。但是,大多数有关IM的先前工作并未探索过程中用户对促销商品的动态感知。在本文中,通过利用知识图(KG)来刻画动态用户感知,我们制定了具有动态个人感知力(IMDPP)的影响最大化问题,该问题考虑了用户偏好和反映相关项目采用影响的社会影响。我们通过探索动态可及性,目标市场以及对一系列相关项目的选择和推广具有重大影响的概念,证明了IMDPP的难度,并设计了一种近似算法,称为“目标市场中的种子动态感知”。我们将Dysim的性能与使用具有真实KG的真实社会网络的最新方法进行比较。实验结果表明,在最先进的方法中,Dysim在大型数据集中有效地实现了多达6.7倍的影响力扩散。
K隔离模式下的Covid-19流行:网络方法
原文标题: Covid-19 epidemic under the K-quarantine model: Network approach
地址: http://arxiv.org/abs/2010.07157
作者: K. Choi, Hoyun Choi, B. Kahng
摘要: Covid-19大流行病正在全球范围内蔓延,造成的破坏是前所未有的。为了预防,韩国采取了本地检疫策略,而不是全球封锁。这种方法不仅使经济损失最小化,而且还有效地防止了疾病的传播。在这项工作中,COVID-19在本地隔离措施下的传播是使用复杂网络上的易感暴露-感染-恢复模型进行建模的。在这种网络方法中,断开与孤立的人连接的链接,然后在释放链接时将其恢复。该链接动态导致时间依赖的再现数量。在网络上进行数值模拟,并根据经验数据估算反应速率。然后再现已确认病例的累积数量的时间模式。结果显示,与他们一起被隔离的大量无症状感染患者被检出。此外,还考虑了当地检疫措施失效和社会隔离的可能后果。
对抗他人!在社交媒体网络中检测道德暴行
原文标题: Against the Others! Detecting Moral Outrage inSocial Media Networks
地址: http://arxiv.org/abs/2010.07237
作者: Wienke Strathern, Mirco Schoenfeld, Raji Ghawi, Juergen Pfeffer
摘要: Twitter上的在线大火似乎是对人,公司,媒体活动和政客的任意愤怒。道德上的不满会导致对一个论点,一个单词或一个人的举动产生过分的集体攻击性,从而导致仇恨言论。随着集体对他人的反对,消极动力常常开始。利用Twitter的数据,我们探索了几场大火暴发的起点。作为一个社交媒体平台,Twitter在全球范围内与主题和事件实时互动,Twitter充当在线讨论的社交传感器,并以快速且经常发生的情感纠纷而闻名。我们在本文中提出的主要问题是,是否可以检测到暴风雪的爆发。鉴于Twitter上有21场在线风暴,有关异常检测的关键问题是:1)我们如何检测变化点? 2)我们如何区分引起道德愤怒的特征?在本文中,我们研究了这些挑战,并开发了一种方法来系统地检测推文的语言提示上的变化点。仅通过应用语言提示,我们就能及早发现风暴的爆发。我们工作的结果可以帮助发现负面动态,并可能使个人,公司和政府减轻社交媒体网络中的仇恨。
解耦的动态图深度生成
原文标题: Disentangled Dynamic Graph Deep Generation
地址: http://arxiv.org/abs/2010.07276
作者: Wenbin Zhang, Liming Zhang, Dieter Pfoser, Liang Zhao
摘要: 图的深层生成模型在不断增长的领域中表现出令人鼓舞的性能,例如分子的设计(即原子图)和蛋白质的结构预测(即氨基酸图)。现有的工作通常集中在静态图上,而不是动态图上,这实际上在诸如蛋白质折叠,分子反应和人类迁移等应用中非常重要。将现有的深度生成模型从静态图扩展到动态图是一项艰巨的任务,它需要处理静态和动态特征的分解,以及节点和边模式之间的相互作用。在此,本文提出了一种新颖的分解深度生成模型框架,以实现可解释的动态图生成。提出了各种生成模型来描述节点,边,静态和动态因素之间的条件独立性。然后,基于新设计的因子分解变分自动编码器和递归图反卷积,提出了变分优化策略以及动态图解码器。在多个数据集上的大量实验证明了所提出模型的有效性。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。