- 智能手机跟踪可以检出几乎所有的SARS-CoV-2感染;
- COVID-19大流行病区室模型的结构可识别性和可观察性;
- COVID-19期间美国大城市各热点地区的移动方式和景点访问方式不同;
- 随机SIR模型的锁定/测试缓解策略研究及其与韩国、德国和纽约数据的比较;
- 关闭和重开:学校在COVID-19欧洲传播中的作用;
- 亚洲国家的风险沟通:推特上的COVID-19表述;
- 预测印度COVID-19大流行的每日和累计病例数;
- TweetsCOV19——有关COVID-19大流行的语义注释推文的知识库;
- 关于巴西巴伊亚州和圣卡塔琳娜州COVID-19(SARS-CoV-2)大流行的最佳控制关注;
- 有争议的信息在Reddit中传播得更快、更远;
- 衡量不平衡州的两党偏见;
- 树线性排列中边长度总和的变化;
- 识别在线社会网络中影响品牌传播的节点;
- 评估飓风疏散期间的道路网络可达性:以佛罗里达州的艾尔玛飓风为例;
- 估算美国邮政编码之间的大规模驾驶时间矩阵:一种差分采样方法;
- 城市尺度律中的空间相互作用;
- 使用志愿者困境博弈对紧急疏散中的帮助行为进行建模;
- 增强公司网络中知识转移的干预情景;
- 图结构主题神经网络;
- 区域限制搜索的随机游走;
- 通过带有负采样的高阶Skip-Gram进行时变图表示学习;
- 举报者被发现:泄密的困难;
- 蜘蛛:互连数据和实体关系的选择性绘图;
- 分布移位下含时图在图神经网络上的增量训练;
- 基于命中概率的有向图和马尔可夫链度量;
- 同配社区结构的统计推断;
- 稳健网络连接的渗流阈值;
- 依赖拓扑的收益可能导致摆脱囚徒困境;
智能手机跟踪可以检出几乎所有的SARS-CoV-2感染
原文标题: Mobile smartphone tracing can detect almost all SARS-CoV-2 infections
地址: http://arxiv.org/abs/2006.14285
作者: Bastian Prasse, Piet Van Mieghem
摘要: 当前,许多国家/地区正在考虑在移动智能手机上引入跟踪软件,其主要目的是通知和警告移动应用程序用户。在这里,我们证明,除了发出警报和通知外,移动跟踪还可以检测到几乎所有被SARS-CoV-2感染的个体,包括臭名昭著的无症状感染。除了自愿报告感染性健康状况外,我们的算法还需要人口绝大多数的位置信息,然后保证可以检测到该封闭人口中的几乎所有SARS-CoV-2感染。我们的算法基于隐马尔可夫流行模型和递归贝叶斯滤波。除了医疗测试和隔离之外,移动追踪应用程序还可以消除COVID-19的潜力,可能会说服公民权衡隐私权与公共卫生。
COVID-19大流行病区室模型的结构可识别性和可观察性
原文标题: Structural Identifiability and Observability of Compartmental Models of the COVID-19 Pandemic
地址: http://arxiv.org/abs/2006.14295
作者: Gemma Massonis, Julio R. Banga, Alejandro F. Villaverde
摘要: 最近的冠状病毒病(COVID-19)爆发极大地提高了公众对动态模型实用性的认识和赞赏。同时,模型预测的传播矛盾突出了它们的局限性。如果无法通过输出测量值确定模型的某些参数和/或状态变量,则其获得正确见解的能力以及控制系统的可能性可能会受到损害。通常使用隔间模型来分析流行病动态,并且已使用此类模型的许多变体来分析和预测COVID-19大流行的演变。在本文中,我们调查了文献中提出的不同模型,汇总了36种模型结构的清单并评估了它们提供可靠信息的能力。我们使用结构可识别性和可观察性的控制理论来解决这个问题。由于某些参数在流行过程中可能会发生变化,因此我们同时考虑常数和时变参数假设。考虑到所有可能的输出选择和时变参数,我们分析了所有模型的结构可识别性和可观察性,这使我们能够分析255个不同的模型版本。我们根据模型在不同假设下的结构可识别性和可观察性对模型进行分类,并讨论结果的含义。我们还以示例说明了弥补模型缺乏可观察性的几种替代方法。我们的分析提供了在考虑到可用知识和度量的基础上针对每种目的选择最有用的模型的指南。
COVID-19期间美国大城市各热点地区的移动方式和景点访问方式不同
原文标题: Disparate Patterns of Movements and Visits to Points of Interests Located in Urban Hotspots across U.S. Metropolitan Cities during COVID-19
地址: http://arxiv.org/abs/2006.14157
作者: Qingchun Li, Liam Bessell, Xin Xiao, Chao Fan, Xinyu Gao, Ali Mostafavi
摘要: 我们研究了社交距离对访问城市热点兴趣点变化的影响。诸如中央商务区之类的城市热点是重力活动中心,负责协调城市中的移动和出行方式。在大流行情况下,城市热点地区可能是潜在的超级传播地区,因为对城市热点地区的访问会增加人们之间疾病接触和传播的风险。我们在美国16个城市中,将人口普查区组的起点-目的地网络映射到了兴趣点(POI)。我们采用了一种粗粒度方法来研究2020年1月至2020年5月热点和非热点之间访问POI的移动模式。此外,我们进行了卡方检验,以确定在分析期间通量变化显著的POI。结果显示,就减少热点地区访问量而言,各城市的模式截然不同。根据对热点地区POI的访问,将16个城市分为两类。在一个类别中,包括旧金山,西雅图和芝加哥等城市,我们发现热点地区对POI的访问量显著下降,而在另一类别中,包括奥斯丁,休斯顿和圣地亚哥等地,在远离社会的时期内,对热点地区的访问量并未大幅减少。此外,尽管所有城市的POI访问量总体呈下降趋势,但其中一个类别仍保持了热点地区POI访问量的比例。在社会疏远时期,对某些POI(例如餐厅和其他就餐场所)的访问比例保持稳定,而某些POI(例如杂货店)的访问比例却有所增加。研究结果突显出,社会疏离命令确实导致了向热点POI移动的不同减少方式。
随机SIR模型的锁定/测试缓解策略研究及其与韩国、德国和纽约数据的比较
原文标题: Study of lockdown/testing mitigation strategies on stochastic SIR model and its comparison with South Korea, Germany and New York data
地址: http://arxiv.org/abs/2006.14373
作者: Priyanka, Vicky Verma
摘要: 我们目前正面临着一场全球性大流行的高度危急情况。新型冠状病毒(SARS-CoV-2,又名COVID-19)已被证明具有极强的传染性,最初从亚洲爆发的疫情现已蔓延到所有大洲。这种情况将从病毒传播方面的研究中受益匪浅,评估有效的对策以权衡所采用策略的影响。标准的易感感染恢复(SIR)模型是一种非常成功且广泛使用的数学模型,用于预测流行病的传播。我们在随机网络上采用SIR模型,并将模型扩展为包括控制策略 em锁定和 em测试-两种常用的缓解策略。通过改变实施这些策略的有效性,研究了这些策略控制大流行传播的能力。撤消缓解策略后,将详细评估第二次爆发的可能性。我们注意到,在任何情况下,此类缓解策略的突然中断都可能导致第二次爆发的再次爆发,第二次爆发的高峰将与易感个体的数量相关。实际上,我们发现,在实现牛群免疫之前,人群将仍然容易受到感染。我们还使用有关韩国,德国和纽约的流行病的真实统计信息和信息来测试我们的模型,并发现与模拟数据有明显的一致性。
关闭和重开:学校在COVID-19欧洲传播中的作用
原文标题: Shut and re-open: the role of schools in the spread of COVID-19 in Europe
地址: http://arxiv.org/abs/2006.14158
作者: Helena B. Stage, Joseph Shingleton, Sanmitra Ghosh, Francesca Scarabel, Lorenzo Pellis, Thomas Finnie
摘要: 通过考虑案例研究丹麦,挪威,瑞典和德国各州,我们调查了学校关闭和随后重新开放对传播COVID-19的影响。通过比较每天住院或在不同干预措施下确诊病例的增长率,我们提供了证据,证明停课的影响随着实施后约9天的增长率下降而可见。有限的学校出勤率,例如年龄较大的学生参加考试或较年轻的组的部分返回,似乎并未显著影响社区传播。在诸如丹麦或挪威这样的社区传播率普遍较低的国家中,在控制或制止该流行病的同时大规模开放学校似乎是可行的。但是,在社区传播率相对较高的国家(如德国),学校的重新开放可以促进增长率的显著提高。我们的发现强调需要对重新开放策略进行谨慎的评估,以确保较低的教室占用率和坚实的基础设施来快速识别和隔离新感染。
亚洲国家的风险沟通:推特上的COVID-19表述
原文标题: Risk Communication in Asian Countries: COVID-19 Discourse on Twitter
地址: http://arxiv.org/abs/2006.12218
作者: Sungkyu Park, Sungwon Han, Jeongwook Kim, Mir Majid Molaie, Hoang Dieu Vu, Karandeep Singh, Jiyoung Han, Wonjae Lee, Meeyoung Cha
摘要: COVID-19已成为社交媒体上讨论最广泛的话题之一。这项研究通过分析来自四个亚洲国家的新型冠状病毒的公开论述来表征风险沟通模式:韩国,伊朗,越南和印度遭受了不同程度的爆发。时间分析表明,政府发布的官方流行阶段与网上对COVID-19的关注程度不符。这一发现要求有必要通过诸如话题动态之类的新措施来分析公众话语。在这里,我们提出了一种自动方法来检测主题相变并比较这些国家随时间推移的主要主题的相似性。我们研究了社交媒体关注度与确诊患者数之间的时差。对于动态,我们发现推文计数与主题多样性之间存在反比关系。
预测印度COVID-19大流行的每日和累计病例数
原文标题: Forecasting the daily and cumulative number of cases for the COVID-19 pandemic in India
地址: http://arxiv.org/abs/2006.14575
作者: Subhas Khajanchi, Kankan Sarkar
摘要: 正在进行的新型冠状病毒流行已由世界卫生组织和政府于2020年3月11日宣布为大流行病。印度政府已宣布从2020年3月25日起在全国范围内进行封锁,以防止社区传播COVID-19。由于缺少特定的抗病毒药或疫苗,数学建模在更好地了解疾病动态以及设计控制快速传播的传染病的策略方面起着重要作用。在我们的研究中,我们开发了一个新的区室模型,该模型解释了COVID-19的传播动力学。我们使用印度四个省份(贾坎德邦,古吉拉特邦,安得拉邦和昌迪加尔)的每日COVID-19数据对提出的模型进行了校准。我们研究了模型的定性性质,包括可行的平衡及其相对于基本繁殖数 mathcal R _0 的稳定性。当感染个体的恢复率增加时,无病平衡变得稳定,地方病平衡变得不稳定,但是如果疾病传播率保持较高,那么地方病平衡将始终保持稳定。对于估计的模型参数,四个省份的 mathcal R _0> 1 ,这表明COVID-19的暴发。短期预测显示印度四个省份COVID-19的每日和累积病例呈上升趋势。
TweetsCOV19——有关COVID-19大流行的语义注释推文的知识库
原文标题: TweetsCOV19 -- A Knowledge Base of Semantically Annotated Tweets about the COVID-19 Pandemic
地址: http://arxiv.org/abs/2006.14492
作者: Dimitar Dimitrov (1), Erdal Baran (1), Pavlos Fafalios (2), Ran Yu (1), Xiaofei Zhu (3), Matthäus Zloch (1), Stefan Dietze (1,4,5) ((1) GESIS - Leibniz Institute for the Social Sciences, Cologne, Germany, (2) Institute of Computer Science, FORTH-ICS, Heraklion, Greece, (3) Chongqing University of Technology, Chongqing, China, (4) Heinrich-Heine-University Düsseldorf, Germany, (5) L3S Research Center, Hannover, Germany)
摘要: 公开可用的社交媒体档案库促进了社会科学的研究,并提供了用于训练和测试各种机器学习,NLP和信息检索方法的语料库。关于最近爆发的COVID-19,Twitter上的在线讨论反映了与大流行本身以及缓解措施及其社会影响有关的公众舆论和看法。了解此类话语,其演变以及与现实世界事件或(错误)信息的相互依存关系可以培养出宝贵的见解。另一方面,这种语料库是解决诸如情感分析,事件检测或实体识别之类的任务的计算方法的关键促进者。但是,获取,归档和语义注释大量推文是昂贵的。在本文中,我们描述了TweetsCOV19,这是一个公开可用的知识库,当前包含800万条推文,跨越时间为10月19日至20年4月。使用已建立的RDF / S词汇表可以公开有关推文的元数据以及提取的实体,主题标签,用户提及,情感和URL,从而为一系列知识发现任务提供了前所未有的知识库。除了对数据集及其提取和注释过程的描述之外,我们还提供了语料库的初步分析,用例和用法。
关于巴西巴伊亚州和圣卡塔琳娜州COVID-19(SARS-CoV-2)大流行的最佳控制关注
原文标题: Optimal Control Concerns Regarding the COVID-19 (SARS-CoV-2) Pandemic in Bahia and Santa Catarina, Brazil
地址: http://arxiv.org/abs/2006.14108
作者: Marcelo M. Morato, Igor M. L. Pataro, Marcus V. Americano da Costa, Julio E. Normey-Rico
摘要: COVID-19大流行是21世纪最深刻的健康危机。 SARS-CoV-2病毒于2020年3月左右到达巴西,其社会和经济影响是灾难性的。在本文中,我们研究了如何使用模型预测控制(MPC)来规划适当的社会疏远政策,以减轻巴伊亚州和圣卡塔琳娜州(两个不同地区的文化,巴西人口状况)的大流行影响。此外,使用优化程序确定了这两种状态的易感感染-已恢复-已死亡(SIRD)模型的参数。过程的控制输入是传递给人群的社会隔离准则。设计了两种MPC策略:a)集中式MPC,它为两个状态协调单个控制策略; b)分散策略,针对每个状态求解一个优化。仿真结果显示了说明和比较两种控制策略。该框架作为应对此类大流行现象的指导原则。
有争议的信息在Reddit中传播得更快、更远
原文标题: Controversial information spreads faster and further in Reddit
地址: http://arxiv.org/abs/2006.13991
作者: Jasser Jasser, Ivan Garibay, Steve Scheinert, Alexander V. Mantzaris
摘要: 在线用户讨论和交谈社会网络上的各种主题。 Facebook,Twitter,Reddit等众多其他网络使用户可以自由共享信息。通过这些网络共享的大量信息使它们成为研究人类在信息传播方面的所有方面的诱人领域。在许多有趣的行为中,社会级联中的争议性引起了我们的极大兴趣。众所周知,在线讨论中必然会发生争议。在线社会网络平台Reddit具有将评论标记为有争议的功能,如果用户对此评论有不同意见。这项研究与以前尝试理解社会网络上的争议之间的区别在于,我们不调查已知有争议的主题。相反,我们研究了典型的级联,并附有读者认为与所讨论事项有争议的评论。这项工作询问有争议的信息级联是否具有与Reddit中无争议的信息相比具有鲜明的特征。我们使用从Reddit收集的数据(约1,700万个帖子)及其与网络安全问题相关的相应评论来回答这些新出现的问题。从进行的比较分析来看,有争议的内容传播的速度更快,距离其来源也越来越远。了解此现象将有助于用户或组织如何使用它来帮助控制和传播特定的受益人信息。
衡量不平衡州的两党偏见
原文标题: On measuring two-party partisan bias in unbalanced states
地址: http://arxiv.org/abs/2006.14067
作者: John F. Nagle, Alec Ramsay
摘要: 假设党派的公平性和响应性是重新划分的重要方面,则对其进行衡量很重要。对于两个主要政党的选民比例大致相等的州来说,党派偏见的许多衡量标准是令人满意的。当投票比例失衡的比例只有60%到40%时,还不清楚哪个指标可以有效地衡量公平性。我们通过分析四个具有民主偏好的州(CA,IL,MA和MD),三个具有共和党偏好(SC,TN和TX)的州的过去选举结果,并将这些结果与四个几乎平衡的州的结果进行了比较( CO,NC,OH和PA)。我们使用了每个州过去的全州范围内的多次选举来建立统计上精确的席位,并对票数图表进行排名,并在其中应用了许多党派偏见度量。除了提供响应性的值之外,我们发现偏差的五个度量在所有状态下提供了相互一致的值,从而为不平衡状态提供了可用度量的核心。尽管所有这五个量度都集中在党派偏见的不同方面,但是对十一个州的值进行归一化提供了一种比较它们的合适方法,我们建议将它们的平均值提供一个更好的量度,我们称之为复合偏见。关于其他措施,我们发现最看似合理的对称性措施对于不平衡状态无效。我们还考虑了偏离比例理想的情况,但是使用它很困难,因为国家的政治地理环境可能使响应能力与党派的整体偏见纠缠不清。我们不试图将故意的党派偏见与因国家的地图绘制规则与其政治地理环境的相互作用而产生的隐性偏见分开,其理由是,重新划分应该试图使总的党派偏见最小化,无论其出处如何。
树线性排列中边长度总和的变化
原文标题: The variation of the sum of edge lengths in linear arrangements of trees
地址: http://arxiv.org/abs/2006.14069
作者: Ramon Ferrer-i-Cancho, Carlos Gómez-Rodríguez, Juan Luis Esteban
摘要: 网络科学中的一个基本问题是顶点之间的拓扑或物理距离的归一化,这需要了解未归一化的距离的变化范围。在这里,我们研究了树木顶点线性排列中物理距离变化的极限。特别是,我们研究了固定大小树的边长之和的各种问题:特定树的总和的最小值和最大值,树木类别(双星树和毛毛虫树)的最小值和最大值,以及最后是任何树的最小值和最大值。我们为一维空间网络的最优得分研究奠定了基础。
识别在线社会网络中影响品牌传播的节点
原文标题: Identify Influential Nodes in Online Social Network for Brand Communication
地址: http://arxiv.org/abs/2006.14104
作者: Yuxin Mao, Lujie Zhou, Naixue Xiong
摘要: 近年来,在线社会网络变得异常流行,这促使越来越多的公司通过社交媒体推广其品牌和产品。本文提出了一种识别在线社会网络中影响品牌传播的节点的方法。我们首先为用户及其从品牌相关内容中提取的关系构建加权网络模型。我们从网络结构和品牌参与方面定量评估社区中节点的个人价值。然后提出了一种从虚拟品牌社区中识别影响节点的算法。该算法通过节点的各个值以及其周围节点的各个值来评估节点的重要性。我们从现实生活中的在线社会网络(作为数据集)提取并构建特定品牌的虚拟品牌社区,并通过经验评估所提出的方法。实验结果表明,该方法能够识别在线社会网络中的影响节点。通过该方法,可以得到具有较高验证用户比例和用户覆盖率的识别结果。
评估飓风疏散期间的道路网络可达性:以佛罗里达州的艾尔玛飓风为例
原文标题: Estimating Road Network Accessibility during a Hurricane Evacuation: A Case Study of Hurricane Irma in Florida
地址: http://arxiv.org/abs/2006.14137
作者: Yi-Jie Zhu, Yujie Hu, Jennifer M. Collins
摘要: 了解飓风疏散过程中时空路网的可及性,了解该地区居民通过公路网到达疏散目的地地点的难易程度,是应急管理的重要组成部分。尽管许多研究试图衡量道路的可及性(无论是在疏散范围内还是在疏散范围内),但很少有人考虑动态疏散需求和飓风的特征。这项研究提出了实现这一目标的方法框架。在每六个小时的间隔中,该方法首先通过考虑飓风的风半径和风道,根据每个县分区中每户家庭的车辆数量来估算疏散需求。然后,采用最接近的设施分析方法来模拟疏散人员前往预定疏散目的地的路线选择。然后,通过将估计的疏散需求和路线选择结合起来,计算潜在拥挤指数(PCI),该指标可捕获每个路段的拥挤程度。最后,通过计算从子县到指定目的地的连接疏散人员的相应道路的PCI值之和的倒数,来测量每个子县的道路通行性。该方法适用于2017年9月飓风“艾尔玛”(Irma)期间的整个佛罗里达州。结果显示,I-75和I-95北行拥堵程度很高,I-95北行的子县遭受最恶劣的道路辅助功能。此外,这项研究进行了敏感性分析,以检查行为响应曲线的不同选择对可访问性结果的影响。
估算美国邮政编码之间的大规模驾驶时间矩阵:一种差分采样方法
原文标题: Estimating a Large Drive Time Matrix between Zip Codes in the United States: A Differential Sampling Approach
地址: http://arxiv.org/abs/2006.14138
作者: Yujie Hu, Changzhen Wang, Ruiyang Li, Fahui Wang
摘要: 估计位置之间的巨大行驶时间矩阵是一项实际但具有挑战性的任务。挑战包括可靠的道路网络(包括交通)数据的可用性,编程专业知识以及对高性能计算资源的访问。这项研究提出了一种估算美国邮政编码区域之间全国行驶时间矩阵的方法-美国是一个地理单位,许多国家数据集(例如健康信息)都在该地理单位上进行汇编和分发。方法(1)在数据准备或访问高级计算资源时无需花费大量精力,(2)使用复杂度和计算时间各不相同的算法来估算不同行程长度的行驶时间,并且(3)考虑区域间和区域内驱动时间。核心设计根据行程长度对具有不同强度的邮政编码对进行采样,并通过Google Maps API得出行驶时间,然后使用Google时间以较低的计算成本来调整和改进一些原始的行驶时间估计。结果为研究人员提供了宝贵的资源。
城市尺度律中的空间相互作用
原文标题: Spatial interactions in urban scaling laws
地址: http://arxiv.org/abs/2006.14140
作者: Eduardo G. Altmann
摘要: 对城市规模定律的分析假设不同城市中的观测结果与附近城市的存在无关。在这里,我们介绍了生成模型和数据分析方法,它们通过明确地建模不同位置的个体之间的交互作用来克服此限制。同时从数据中推断出描述比例定律和空间相互作用的参数,从而可以进行严格的(贝叶斯)模型比较,并克服了定义城市区域边界的问题。五个不同数据集中的结果表明,包括空间相互作用通常可以导致更好的模型和尺度定律的指数变化。参考中提供了数据和代码。 [1]。
使用志愿者困境博弈对紧急疏散中的帮助行为进行建模
原文标题: Modeling Helping Behavior in Emergency Evacuations Using Volunteer's Dilemma Game
地址: http://arxiv.org/abs/2006.14207
作者: Jaeyoung Kwak, Michael H Lees, Wentong Cai, Marcus EH Ong
摘要: 人们通常会帮助遇到麻烦的其他人,尤其是在紧急疏散情况下。例如,在2005年伦敦爆炸案中,据报道,撤离人员帮助受伤人员逃离了危险的地方。从博弈论的角度,可以理解,这种帮助行为提供了集体利益,而这却是一种昂贵的行为,因为在紧急疏散的情况下,志愿者花费额外的时间来帮助受伤的人。为了研究紧急疏散中帮助行为的集体效应,我们在房间疏散情况下对被疏散人员的帮助行为进行了数值模拟。我们的模拟模型基于反映志愿者成本的志愿者困境博弈。博弈论模型与社会力量模型相结合,以了解疏散场景的空间和社会动态之间的关系。通过系统地更改帮助行为的成本参数,我们观察到了集体帮助行为的不同模式,并用相图总结了这些集体模式。
增强公司网络中知识转移的干预情景
原文标题: Intervention scenarios to enhance knowledge transfer in a network of firm
地址: http://arxiv.org/abs/2006.14249
作者: Frank Schweitzer, Yan Zhang, Giona Casiraghi
摘要: 我们研究了研发网络中企业的多主体模型。每家公司都以其知识存量 x_ i(t)为特征,该知识存量遵循非线性动力学。它可以随着其他公司的投入而增长,即通过知识转移而增长,反之则衰减。保持交互是昂贵的。如果没有实现预期的知识增长,企业可以离开网络,这可能导致其他企业也离开网络。本文讨论了两种自下而上的干预方案,以防止,减少或延迟公司离职的级联。第一个基于网络可控制性的形式主义,其中通过降低驱动程序节点的成本来确定驱动节点并随后对其进行激励。第二个结合了节点干预和网络干预。它提出了对单个公司的有控制的撤离和对离开公司的随机替代的建议。这允许生成小的级联,从而防止大级联的发生。我们发现这两种方法都能成功地缓解级联,从而提高R && D网络的弹性。
图结构主题神经网络
原文标题: Graph Structural-topic Neural Network
地址: http://arxiv.org/abs/2006.14278
作者: Qingqing Long, Yilun Jin, Guojie Song, Yi Li, Wei Lin
摘要: 图卷积网络(GCN)通过有效地收集节点的局部特征而获得了巨大的成功。但是,GCN通常更多地关注节点特征,而较少关注邻域内的图结构,尤其是高阶结构模式。然而,这种局部结构模式显示为指示了许多领域中的节点特性。此外,这不仅是单个模式,而且所有这些模式的分布都很重要,因为网络很复杂,每个节点的邻域由各种节点和结构模式的混合组成。相应地,在本文中,我们提出了图结构主题神经网络(简称GraphSTONE),它是一种利用图的主题模型的GCN模型,因此结构性主题从概率方面广泛地捕获了指示图结构,而不仅仅是少数结构。具体来说,我们使用匿名游走和Graph Anchor LDA(一种先选择重要结构模式的LDA变体)在图上建立主题模型,以减轻复杂性并有效生成结构主题。此外,我们设计了多视图GCN,以统一节点特征和结构主题特征,并利用结构主题指导聚合。我们通过定量和定性实验来评估我们的模型,其中我们的模型表现出令人鼓舞的性能,高效率和清晰的可解释性。
区域限制搜索的随机游走
原文标题: A random walk on Area Restricted Search
地址: http://arxiv.org/abs/2006.14318
作者: Simone Santini
摘要: 这些来自马德里自治大学研究生班的笔记分析了一种被称为区域限制搜索(ARS)的搜索行为,该行为在动物界广泛存在,并且当一个人所追求的资源“斑驳”时是最佳的。在第一部分中,我们研究了动物行为的重要性及其对多巴胺的依赖,以此作为奖励的指标。在第二部分中,我们提出了一种遗传算法来确定ARS的最优性及其特征。最后,我们将ARS与一种称为“征税步行”的随机游走相关,其中,距当前位置d处跳跃的概率遵循幂律分布。
通过带有负采样的高阶Skip-Gram进行时变图表示学习
原文标题: Time-varying Graph Representation Learning via Higher-Order Skip-Gram with Negative Sampling
地址: http://arxiv.org/abs/2006.14330
作者: Simone Piaggesi, André Panisson
摘要: 图的表示学习模型是一种成功的技术系列,可以将节点投影到可以被其他机器学习算法利用的特征空间中。由于许多现实世界的网络本质上是动态的,节点之间的交互随时间而变化,因此可以为静态图和时变图定义这些技术。在此,我们基于一个事实,即跳过gram嵌入方法隐式地执行矩阵分解,然后将其扩展为对时变图的不同张量表示进行隐式张量分解。我们展示了带有负采样的高阶跳跃图(HOSGNS)能够解开节点和时间的作用,而其他方法所需的参数数量却很小。我们使用时间解析的面对面接近数据对我们的方法进行了经验评估,结果表明,当用于解决下游任务(如网络重建)并预测网络时,所学习的时变图表示优于最新方法。疾病传播等动态过程的结果。源代码和数据可在https://github.com/simonepiaggesi/hosgns上公开获得。
举报者被发现:泄密的困难
原文标题: Snitches Get Stitches: On The Difficulty of Whistleblowing
地址: http://arxiv.org/abs/2006.14407
作者: Mansoor Ahmed-Rengers, Ross Anderson, Darija Halatova, Ilia Shumailov
摘要: 对于人类来说,最关键的安全协议问题之一就是当您出于某种更高的目的出卖信任时,如果您被抓到,世界就会对您不利。在这篇简短的论文中,我们报告了使举报者更安全地向记者泄露敏感文件的工作。在对由于操作或技术问题而发现举报者的情况进行了调查之后,我们提出了一种博弈论模型,该模型捕获了举报涉及的动力动态。我们发现举报人通常受他人的动机和能力的支配。我们确定了可以使用技术减轻举报人风险的特定领域。但是,我们警告您不要采用技术解决主义:主要的限制因素通常是体制性的。
蜘蛛:互连数据和实体关系的选择性绘图
原文标题: SPIDER: Selective Plotting of Interconnected Data and Entity Relations
地址: http://arxiv.org/abs/2006.14416
作者: Pranav Addepalli, Eric Wu, Douglas Bossart, Christina Lin, Allistar Smith
摘要: 情报分析师长期以来一直在努力应对每天必须调查的大量数据。在美国陆军中,此活动涉及协调各种来源的信息,该过程已在一定程度上实现了自动化,但仍需高度手动。为了促进自动化,设计了语义分析原型来辅助智能分析过程。此工具称为互连数据和实体关系的选择性绘图(SPIDER),可从文本中提取实体及其关系,以简化调查。 SPIDER是一个Web应用程序,可以通过Web浏览器进行远程访问,它具有三个主要组件:(1)Java API,用于读取文档,使用Stanford CoreNLP提取实体和关系;(2)一个存储实体的Neo4j图数据库,关系和属性; (3)基于JavaScript的SigmaJS可视化工具,用于在浏览器上显示图。 SPIDER可以将文档分析扩展到成千上万个文件,以进行快速可视化,使情报分析过程更加高效,并使军事领导层可以更快地洞察大量潜在的知识。
分布移位下含时图在图神经网络上的增量训练
原文标题: Incremental Training of Graph Neural Networks on Temporal Graphs under Distribution Shift
地址: http://arxiv.org/abs/2006.14422
作者: Lukas Galke, Iacopo Vagliano, Ansgar Scherp
摘要: 当前的图神经网络(GNN)很有前途,特别是当已知整个图都需要训练时。但是,尚不清楚如何有效地在含时图上训练GNN,新的顶点,边甚至是类随时间出现。我们面临两个挑战:首先,标签分布的变化(包括新标签的外观),这需要调整模型。其次,图的增长使得在某些时候无法在所有顶点和边上进行训练。我们通过应用滑动窗口技术来解决这些问题,即我们在有限的窗口大小上逐步训练GNN并分析其性能。对于我们的实验,我们基于科学出版物编制了三个新的含时图数据集,并评估了各向同性和各向异性GNN体系结构。我们的结果表明,即使对于仅1个时间步长的窗口大小,这两种GNN类型都可以提供良好的结果。窗口大小为3到4个时间步长,与使用图表的整个时间轴相比,GNN的准确性至少达到95%。窗口大小为6或8时,可以保留至少99%的精度。这些发现对通过含时图训练GNN具有直接的影响。我们提供了代码(https://github.com/Incremental-GNNs)和新编译的数据集(https://zenodo.org/record/3764770),以实现可重复性和重用性。
基于命中概率的有向图和马尔可夫链度量
原文标题: A metric on directed graphs and Markov chains based on hitting probabilities
地址: http://arxiv.org/abs/2006.14482
作者: Zachary M. Boyd, Nicolas Fraiman, Jeremy L. Marzuola, Peter J. Mucha, Braxton Osting, Jonathan Weare
摘要: 无向图上的最短路径,通勤时间和扩散距离已广泛用于降维,链路预测和行程计划等应用中。人们越来越关注使用从马尔可夫链和有向图得出的数据的不对称结构,但是很少有度量标准专门适合此任务。我们在所有遍历,有限状态,时间均匀的马尔可夫链的状态空间上引入度量,尤其是在从有向图派生的任何马尔可夫链上引入度量。我们的构建基于命中概率,度量空间中的接近性与平稳步行者从一个节点到另一个节点的转移有关。值得注意的是,我们的度量标准对最短和平均路径距离不敏感,因此与现有度量标准相比,可以提供新的信息。我们使用度量中可能的简并性来发展有趣的有向图结构理论,并探索相关的商定程序。我们的指标可以用 O(n ^ 3)的时间来计算,其中 n 是状态数,在示例中,我们可以扩展到 n = 10,000 个节点和台式机上大约 38M 个边。在几个示例中,我们探索了指标的性质,将其与替代方法进行了比较,并展示了其在密集图中弱化社区结构恢复,可视化,结构恢复,动力学探索和多尺度聚类检测的效用。
同配社区结构的统计推断
原文标题: Statistical inference of assortative community structures
地址: http://arxiv.org/abs/2006.14493
作者: Lizhi Zhang, Tiago P. Peixoto
摘要: 我们开发了一种原则上的方法来推断基于种植分区模型的非参数贝叶斯公式的网络中的分类社区。我们表明,这种方法成功地在网络中找到了具有统计意义的分类模块,这与诸如模块化最大化等替代方案不同,后者在人工和经验示例中均过分地过拟合。此外,我们证明了我们的方法不受分辨率限制,并且可以发现任意数量的社区,只要有针对它们的统计证据即可。我们的公式适合模型选择程序,这使我们可以将其与基于随机块模型的更通用方法进行比较,并以此方式揭示分类是否实际上是主要的大规模混合模式。我们使用几个经验网络进行比较,并确定了许多情况,其中传统的社区检测方法夸大了网络的可分类性,并且我们展示了如何可以更忠实地确定可分类性。
稳健网络连接的渗流阈值
原文标题: Percolation Thresholds for Robust Network Connectivity
地址: http://arxiv.org/abs/2006.14496
作者: Arman Mohseni-Kabir, Mihir Pant, Don Towsley, Saikat Guha, Ananthram Swami
摘要: 通信网络,电网和运输网络都是网络的示例,其性能取决于其基础网络组件的可靠连接性,即使在由于移动性,节点或边故障以及变化的通信量负载而存在常规网络动态的情况下。渗流理论对局部控制参数的阈值进行量化,例如在存在巨大连接组件(GCC)的情况下(高于,低于,低于)节点占有(重设,删除)概率或边激活(重设,移除)概率。 ),一个连接的组件,由多个占用的节点和活动边组成,活动边的大小与网络本身的大小成比例。 GCC中的任何一对占用节点都通过至少一条由活动边和占用节点组成的路径连接。 GCC本身的存在本身并不能保证远程连接的鲁棒性,例如,对于由于网络动态而导致的随机链路或节点故障。在本文中,我们探索了新的渗透阈值,这些阈值不仅可以保证跨越网络连接性,而且还可以保证鲁棒性。我们定义和分析了鲁棒网络连通性的四种度量,探讨了它们之间的相互关系,并在数值上评估了2D方格的相应鲁棒渗透阈值。
依赖拓扑的收益可能导致摆脱囚徒困境
原文标题: Topology dependent payoffs can lead to escape from prisoner's dilemma
地址: http://arxiv.org/abs/2006.14593
作者: Saptarshi Sinha, Deep Nath, Soumen Roy
摘要: 演化博弈论试图理解空间受限人群中合作的稳定性。维持合作非常困难,尤其是在没有空间限制的情况下。关于图表博弈的研究很多。众所周知,基础图拓扑会显著影响此类博弈的结果。一个自然而未探讨的问题是,在确定收益时,玩博弈的基础结构的拓扑是否不起作用。在这里,我们介绍一种形式的博弈收益,它很少依赖于基础拓扑。我们的方法是受到众所周知的群体感应微生物现象的启发。我们证明,即使依赖程度很弱,基本的博弈动力学以及博弈的本质也可能会发生变化。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。