- 加权有向网络的PageRank中心性和算法及其在全球投入产出表中的应用;
- 使用稀疏偏最小二乘进行粗噪声图对齐;
- 为城市规模的主动交通仿真模型构建路网;
- 量化激励的(不)兼容性:体育方面的案例研究;
- HumAID:来自Twitter的人类注释灾难事件数据;
- 为电力系统的故障后定位、动态状态估计和最佳测量放置选择哪种神经网络?;
- 联合嵌入模型分析Twitter用户的生活方式选择;
- 瑜伽会让你快乐吗?使用文本和时间信息分析Twitter用户的幸福感;
- 你做瑜伽吗?使用社交和文本信息理解Twitter用户的类型和动机;
加权有向网络的PageRank中心性和算法及其在全球投入产出表中的应用
原文标题: PageRank centrality and algorithms for weighted, directed networks with applications to World Input-Output Tables
地址: http://arxiv.org/abs/2104.02764
作者: Panpan Zhang, Tiandong Wang, Jun Yan
摘要: PageRank(PR)是评估网络中节点相对重要性的基本工具。在本文中,我们提出了一种加权PageRank(WPR),它是从经典PR扩展而来的,它针对的是加权有向网络,其中可能存在依赖于网络结构或独立于网络结构的特定于节点的信息。介绍了利用节点度和强度的调整参数。已经开发了一种基于R程序的高效算法,用于大规模网络中的WPR计算。我们已经在广泛使用的模拟网络模型上测试了建议的WPR,并发现它优于文献中的其他竞争措施。通过将拟议的WPR应用于从“世界投入产出表”生成的真实网络数据,我们看到了与全球经济趋势一致的结果,这使其成为分析中的首选措施。
使用稀疏偏最小二乘进行粗噪声图对齐
原文标题: Sparse Partial Least Squares for Coarse Noisy Graph Alignment
地址: http://arxiv.org/abs/2104.02810
作者: Michael Weylandt, George Michailidis, T. Mitchell Roddenberry
摘要: 图信号处理(GSP)提供了一个强大的框架,可以分析在各种域中出现的信号。在GSP的许多应用程序中,可以使用多种网络结构,每个网络结构都刻画同一潜在现象的不同方面。为了集成这些不同的数据源,图对齐技术试图找到两个图的顶点之间的最佳对应关系。我们考虑这个问题的一般化,其中顶点之间没有自然的一对一映射,但是每个图的社区结构之间存在对应关系。因为我们寻求在这个较高的社区级别上学习结构,所以我们将这个问题称为“粗略”图对齐。为此,我们提出了一种新颖的正规化偏最小二乘方法,该方法既结合了观察到的图结构又施加了稀疏性,以反映基础的块群落结构。我们为我们的方法提供了有效的算法,并证明了其在仿真中的有效性。
为城市规模的主动交通仿真模型构建路网
原文标题: Building the road network for city-scale active transport simulation models
地址: http://arxiv.org/abs/2104.03063
作者: Afshin Jafari, Alan Both, Dhirendra Singh, Lucy Gunn, Billie Giles-Corti
摘要: 在本文中,我们介绍并测试了用于为城市规模的主动交通模拟模型创建路网表示的算法。该算法依靠开放和通用的数据来确保适用于世界各地的不同城市。除了主要道路,其几何形状和通常在运输模型中使用的道路属性(例如,速度限制,车道数量,允许的出行方式)之外,该算法还刻画了通常由行人和骑自行车者偏爱的次要道路,以及道路属性例如自行车专用的基础设施,交通信号和道路坡度。此外,它简化了网络的复杂几何形状,并在适用的情况下合并了平行道路,使其适用于大规模仿真。为了检查该算法的实用性和性能,我们使用它为澳大利亚大墨尔本地区创建了一个网络表示形式,并将输出结果与使用现有交通运输模拟工具包以及现有城市规模交通运输模型中的另一个网络创建的网络进行了比较维多利亚时代的政府。通过这些网络的仿真实验,我们说明了我们的算法在仿真精度和运行时间之间实现了很好的平衡。对于我们网络上的步行和骑自行车路线旅行,就最短路径的行进距离而言,其精度与普通网络转换工具相当,而在模拟不同样本量时,其速度要快两倍以上。因此,我们的算法提供了灵活的解决方案,可为世界各地不同城市的城市规模的主动交通模型构建准确而高效的道路网络。
量化激励的(不)兼容性:体育方面的案例研究
原文标题: Quantifying incentive (in)compatibility: a case study from sports
地址: http://arxiv.org/abs/2104.03067
作者: László Csató
摘要: 激励相容性通常被认为是学术文献中的二元概念。我们的论文旨在提出一种量化体育比赛中违反策略证明的方法,尤其是以2022年FIFA世界杯欧洲资格赛为例。尽管由于某些团队可能对其他团队的成功感兴趣而使比赛容易受到操纵,但问题的严重程度至今仍未得到探讨。根据计算机模拟,发现选手的战略行为具有不可忽略的体育效果。如果不从根本上改变比赛的设计就不能保证策略性,但是我们可以通过添加精心选择的一组抽签限制来充分缓解这种威胁,这提供了合理,透明的解决方案来提高公平性。鼓励体育管理机构考虑到我们的发现。
HumAID:来自Twitter的人类注释灾难事件数据
原文标题: HumAID: Human-Annotated Disaster Incidents Data from Twitter
地址: http://arxiv.org/abs/2104.03090
作者: Firoj Alam, Umair Qazi, Muhammad Imran, Ferda Ofli
摘要: 社会网络被广泛用于信息的消费和传播,尤其是在诸如自然灾害之类的时间紧迫事件中。尽管社交媒体的内容量巨大,但其噪声通常太大,无法在任何应用程序中直接使用。因此,对可用内容进行过滤,分类和简明扼要,以促进有效的消费和决策很重要。为理解决这些问题,由于早期在创建标记数据集方面的努力,已经使用监督建模方法开发了自动分类系统。但是,现有的数据集在各个方面都有局限性(例如大小,包含重复项),并且不适合支持更高级且需要大量数据的深度学习模型。在本文中,我们提出了一个新的大规模数据集,其中包含约77K条带有人类标签的推文,并从2016年至2019年发生的19次灾难事件中的约2,400万条推文中进行了采样。此外,我们提出了数据收集和采样管道,这对于人工标注的社交媒体数据采样非常重要。我们使用基于经典和深度学习(fastText和Transformer)的模型报告多类分类结果,为将来的研究奠定基础。数据集和相关资源是公开可用的。 url https://crisisnlp.qcri.org/humaid_dataset.html
为电力系统的故障后定位、动态状态估计和最佳测量放置选择哪种神经网络?
原文标题: Which Neural Network to Choose for Post-Fault Localization, Dynamic State Estimation and Optimal Measurement Placement in Power Systems?
地址: http://arxiv.org/abs/2104.03115
作者: Andrei Afonin, Michael Chertkov
摘要: 我们考虑用相量测量单元(PMU)监视的电力传输系统,该相量测量单元放置在系统的重要节点(而非全部节点)上。假设PMU记录了足够数量的独特单线故障,特别是故障前状态和(未清除)故障后状态,并且可以进行训练,我们首先设计一个全面的神经网络序列( NNs)定位故障线。比较序列中不同NN的性能,包括线性回归,前馈NN,AlexNet,图卷积NN,神经线性ODE和基于神经图的ODE,它们根据所涉及的潮流物理类型和数量进行排序,不同级别的可观察性。其次,我们构建了一系列经过训练的高级Power-System-Dynamics信息和基于Neural-ODE的机器学习方案,这些方案在给定故障前状态的情况下可以预测故障后状态,并且还可以并行估计系统参数。最后,第三,并继续使用第一个(故障定位)设置,我们设计了一种(基于NN的)算法,该算法可发现最佳的PMU位置。
联合嵌入模型分析Twitter用户的生活方式选择
原文标题: Analysis of Twitter Users' Lifestyle Choices using Joint Embedding Model
地址: http://arxiv.org/abs/2104.03189
作者: Tunazzina Islam, Dan Goldwasser
摘要: 数据的多视图表示学习可以帮助构建社交媒体上连贯且上下文相关的用户表示。本文提出了一种联合嵌入模型,该模型结合了用户的社交和文本信息,以学习用于理解其生活方式选择的情境化用户表示形式。我们将模型应用于与两种生活方式活动(“瑜伽”和“饮食减肥”)相关的推文,并使用它来分析用户的活动类型和动机。我们将详细解释数据收集和注释过程,并根据Twitter内容对来自不同类别的用户进行深入分析。我们的实验表明,我们的模型可以在两个方面都提高性能。
瑜伽会让你快乐吗?使用文本和时间信息分析Twitter用户的幸福感
原文标题: Does Yoga Make You Happy? Analyzing Twitter User Happiness using Textual and Temporal Information
地址: http://arxiv.org/abs/2012.02939
作者: Tunazzina Islam, Dan Goldwasser
摘要: 尽管瑜伽是锻炼身体和心灵的多成分练习,并且众所周知可以减少焦虑和抑郁,但是在社交媒体上理解人们与瑜伽相关的情绪状态仍然存在差距。在这项研究中,我们通过结合使用格兰杰因果关系的用户的文本和时间信息来研究练习瑜伽与快乐之间的因果关系。为了从文本中找出因果特征,我们测量了两个变量(i)基于内容分析的瑜伽活动水平和(ii)基于情绪状态的幸福水平。为了理解用户的瑜伽活动,我们提出了一种基于神经网络与注意力机制融合的联合嵌入模型,该模型利用了用户的社交和文本信息。为了测量瑜伽使用者的情感状态(目标域),我们建议一种转移学习方法,以从在源域上训练的基于注意力的神经网络模型转移知识。我们在Twitter数据集上的实验表明,有1447个用户“瑜伽格兰杰导致幸福”。
你做瑜伽吗?使用社交和文本信息理解Twitter用户的类型和动机
原文标题: Do You Do Yoga? Understanding Twitter Users' Types and Motivations using Social and Textual Information
地址: http://arxiv.org/abs/2012.09332
作者: Tunazzina Islam, Dan Goldwasser
摘要: 利用社交媒体数据来理解人们的生活方式选择是一个令人兴奋的探索领域,但需要对数据进行多视图编制。在本文中,我们通过结合用户的社交和文本信息来理解他们的活动和动机,提出了一种基于神经网络与注意力机制融合的联合嵌入模型。我们使用来自Twitter的健康相关推文,重点关注“瑜伽”。我们在两个下游任务上演示了我们的模型:(i)查找用户类型,例如从业者或促销者(促进瑜伽馆/适应度房),其他; (ii)查找用户动机,即健康益处,灵性,热爱推/转推有关瑜伽的知识,但不要练习瑜伽。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。