- 不完善私有信号结构的非贝叶斯社会学习;
- 具有可重新激励节点的关键网络级联:为什么树状近似通常有效,何时崩溃,以及如何纠正它们;
- 用于边流的基于图的半监督和主动学习;
- 复杂网络中的嵌套性:观察、涌现和启示;
- 无人驾驶巴士:同步提高效率;
- 可扩展的Gromov-Wasserstein学习图分割和匹配;
- 对夏洛茨维尔2017年“团结右翼”集会的在线反应:利用媒体追随者衡量Twitter网络的两极分化;
- 结合基于内容和图的特征检测在线对话中的滥用语言;
- 基于共轭力模型的行人疏散模拟探索最优旁路策略;
- 使用自愿汇报的地理信息诊断小空间尺度的人体移动模型的性能;
- 考虑关系结构的异构信息网络嵌入;
- 少数人的力量:分析有影响力的用户在协同推荐系统中的影响;
- 多Agent市场的信誉系统;
- T-EDGE:用于以太坊交易网络分析的时间加权多元有向图嵌入;
- 用于确定实体关系的图距离:欺诈检测的拓扑方法;
- 理解激进思维:识别信号检测Twitter上的极端主义内容;
- 当图挖掘遇到众包:为答案聚合选择专家;
- Barabasi-Albert网络的配置模型;
- 神经图协同过滤;
不完善私有信号结构的非贝叶斯社会学习
原文标题: Non-Bayesian Social Learning with Imperfect Private Signal Structure
地址: http://arxiv.org/abs/1904.02385
作者: Sannyuya Liu, Zhonghua Yan, Xiufeng Cheng, Liang Zhao
摘要: 作为描述社会网络信念动态的经典模型之一,非贝叶斯社会学习模型假设网络中的成员通过贝叶斯推理过程拥有准确的信号知识。为了使非贝叶斯社会学习模型更适用于人类和动物社会,本文通过假设存在私人信号结构偏差来扩展该模型。每个时间步骤中的每个社会成员使用不完美的信号知识来形成其贝叶斯部分信念,然后将其邻居的信念结合到该贝叶斯部分信念中以形成新的信念报告。首先,我们研究了孤立因子的内在学习能力,并推导出信号结构需要满足这种孤立因子的条件才能做出最终的正确决策。根据这些条件,代理人的信号结构进一步分为三种不同的类型,“保守”,“激进”和“消极”。然后,我们将上下文从隔离的代理切换到连接的网络;我们的命题和模拟表明,保守主体是社会网络学习真实状态的主导力量,而其他两种类型可能阻止网络成功学习。虽然非贝叶斯社会学习机制确实存在脆弱性,但“更加保守”和“避免过度自信”可能是真实社会网络中每个代理人共同改善社会学习过程和结果的有效策略。
具有可重新激励节点的关键网络级联:为什么树状近似通常有效,何时崩溃,以及如何纠正它们
原文标题: Critical Network Cascades with Re-excitable nodes: Why tree-like approximations usually work, when they breakdown, and how to correct them
地址: http://arxiv.org/abs/1905.07433
作者: Sarthak Chandra, Edward Ott, Michelle Girvan
摘要: 我们考虑网络上的级联过程问题。网络级联理论的先前工作通常仅限于本地树状网络或窄类拓扑结构。我们研究了能够对每个节点进行多次重新激发的级联模型,并讨论了树状近似给出良好结果的条件,这些结果到目前为止还没有得到很好的理解。我们还讨论了根据网络中存在的主题计算网络关键性的这种近似值的细分原因。我们在这里得到的结果适用于明确不满足局部树状近似的一般网络。特别地,我们关注双平行基序,这是与基于树的理论在有向网络上的离散时间过程的失败相关的最小基序,并且我们得出由于这些基于关键性条件的图的修正。我们验证了我们对计算机生成的网络的主张,这些网络旨在拥有大量的这些模体,并且我们证明了我们的理论很好地预测了观察到的临界偏差。数值模拟表明,与基于树的理论的偏差通常很小,并且,使用我们的理论,我们证明了为什么会出现这种情况。此外,我们表明,对于具有较大平均度的网络,这些偏差可以忽略不计,这证明了为什么基于树的理论似乎适用于大多数现实世界的网络。
用于边流的基于图的半监督和主动学习
原文标题: Graph-based Semi-Supervised & Active Learning for Edge Flows
地址: http://arxiv.org/abs/1905.07451
作者: Junteng Jia, Michael T. Schaub, Santiago Segarra, Austin R. Benson
摘要: 我们提出了一种基于图的半监督学习(SSL)方法,用于学习在图上定义的边流。具体而言,给定边子集的流量测量值,我们希望预测剩余边上的流量。为此,我们开发了一个计算框架,对整体流量施加了某些约束,例如(近似)流量守恒。这些约束使我们的方法与顶点标签的经典基于图的SSL不同,这假设紧密连接的节点共享相似的标签并相应地利用图结构从一些顶点标签外推到未标记的顶点。我们得出了方法重建误差的界限,并证明了它在运输,物理基础设施和Web上的合成和真实流网络上的强大性能。此外,我们提供了两种主动学习算法,用于选择测量流量的信息边,这些算法具有最佳传感器部署的应用。第一种策略选择边以最小化重建误差界限,并且对于近似无散度的流动很有效。第二种方法是对图表进行聚类,并选择跨越聚类边界的瓶颈边,这对于具有全局趋势的流程非常有效。
复杂网络中的嵌套性:观察、涌现和启示
原文标题: Nestedness in complex networks: Observation, emergence, and implications
地址: http://arxiv.org/abs/1905.07593
作者: Manuel Sebastian Mariani, Zhuo-Ming Ren, Jordi Bascompte, Claudio Juan Tessone
摘要: 观察到的生态和社会经济网络架构与随机网络的架构有很大不同。从网络科学的角度来看,在真实网络中观察到的非随机结构模式需要解释它们的出现以及对它们潜在的系统性后果的理解。本文重点介绍其中一种模式:嵌套。给定交互节点的网络,嵌套可以被描述为节点与更好连接的节点的交互伙伴的子集交互的趋势。生物地理学80年以来已知,在生态共生组织,世界贸易,组织间关系等众多系统中已经发现了嵌套性。本综述文章重点介绍三个主要支柱:现有的观察网络嵌套的方法;旨在解释生态和社会经济网络中嵌套性出现的主要理论机制;嵌套的交互拓扑对给定交互系统的稳定性和可行性的影响。我们调查了多样化学科的结果,包括统计物理学,图论,生态学和理论经济学。发现嵌套性在二分网络中出现,并且最近在单向网络中出现;这篇综述是第一次统一两种研究流程的综合尝试,通常是相互脱节的。我们相信真正的跨学科努力 - 虽然植根于复杂的系统视角 - 可能激发新的模型和算法,其应用领域无疑将超越学科界限。
无人驾驶巴士:同步提高效率
原文标题: No-boarding buses: Synchronisation for efficiency
地址: http://arxiv.org/abs/1905.07613
作者: Vee-Liem Saw, Lock Yue Chew
摘要: 我们在一个 N 公共汽车系统中调查了一项无人值守政策,该系统在一个循环中提供M 巴士站,这是一种夹带机制,可以使公交车在一个合理交错的配置中保持同步。公共汽车总是允许下车,但如果满足某些标准则不允许登机。我们让公共汽车以相同的自然速度移动(适用于可编程自驾车)并分析计算乘客在公交车站等候公交车的平均等待时间。我们的分析结果表明,与没有登机政策的情况相比,禁止入境政策可以大大减少平均等待时间。随后,我们进行模拟以验证这些理论分析,并将模拟扩展到基于实际数据的具有不同自然速度的典型人力驱动总线。最后,我们描述了一种简单的通用自适应算法,用于动态确定何时实现无人值守。
可扩展的Gromov-Wasserstein学习图分割和匹配
原文标题: Scalable Gromov-Wasserstein Learning for Graph Partitioning and Matching
地址: http://arxiv.org/abs/1905.07645
作者: Hongteng Xu, Dixin Luo, Lawrence Carin
摘要: 我们提出了一种可扩展的Gromov-Wasserstein学习(S-GWL)方法,并为大规模图分析建立了一种新颖且理论上支持的范例。所提出的方法基于Gromov-Wasserstein差异是图上的伪测量的事实。给定两个图,与其Gromov-Wasserstein差异相关联的最佳传输提供了它们的节点之间的对应关系并实现了图匹配。当其中一个图具有隔离但自连接的节点( ie,即断开连接的图)时,最佳传输指示另一个图的聚类结构并实现图分区。使用这个概念,我们通过学习多个观察图的Gromov-Wasserstein重心图,将我们的方法扩展到多图分区和匹配;重心图起到断开图的作用,因为它是学习的,所以聚类也是如此。我们的方法结合了一个递归的 K -partition机制和一个正则化的近端梯度算法,其时间复杂度为 mathcal O(K(E + V) log_K V),用于 V 节点和 E的图 edge。据我们所知,我们的方法是第一次尝试使Gromov-Wasserstein差异适用于大规模图分析,并将图分区和匹配统一到同一框架中。它优于最先进的图分区和匹配方法,实现了准确性和效率之间的权衡。
对夏洛茨维尔2017年“团结右翼”集会的在线反应:利用媒体追随者衡量Twitter网络的两极分化
原文标题: Online reactions to the 2017 'Unite the Right' rally in Charlottesville: measuring polarization in Twitter networks using media followership
地址: http://arxiv.org/abs/1905.07755
作者: Joseph H. Tien, Marisa C. Eisenberg, Sarah T. Cherng, Mason A. Porter
摘要: 我们使用网络分析和数据科学的工具,研究了2017年8月在弗吉尼亚州夏洛茨维尔举办的“Unite the Right”集会后的Twitter对话。我们在Twitter和主成分分析(PCA)上使用媒体关注来计算一维轴上的“左”/“右”媒体分数以表征节点。然后,我们与转推关系一起使用这些分数来检查与#Charlottesville主题标签进行通信的大约300,000个帐户的转发网络的结构。转发网络是极端分化的,相对于媒体PCA得分的符号,其协调系数为0.8。使用两种方法(Louvain方法和InfoMap)进行社区检测,在左/右节点组成方面产生大部分同质社区。在比较推文内容时,我们发现关于“特朗普”的推文在左翼和右翼都很普遍,尽管伴随的语言并不令人惊讶。左派社区中具有大学位的节点包括与不同领域相关的帐户,包括激进主义,商业,艺术和娱乐,媒体和政治。支持唐纳德特朗普是权利社区中的共同点,将社区与引用白人至上主义仇恨符号的帐户,具有影响力的人物的社区连接在一起,以及最大的权利社区(包括Twitter帐户FoxNews)。
结合基于内容和图的特征检测在线对话中的滥用语言
原文标题: Abusive Language Detection in Online Conversations by Combining Content-and Graph-based Features
地址: http://arxiv.org/abs/1905.07894
作者: Noé Cecillon (LIA), Vincent Labatut (LIA), Richard Dufour (LIA), Georges Linarès (LIA)
摘要: 近年来,在线社会网络已经允许全球用户会面和讨论。作为这些社区的担保人,这些平台的管理员必须阻止用户采取不当行为。由于要检查的消息量不断增加,这种主要由人类完成的验证任务越来越困难。已经提出了使该调节过程自动化的方法,主要是通过提供基于交换消息的文本内容的方法。最近的工作还表明,以会话图的形式从会话结构中得出的特征可以帮助检测这些滥用的消息。在本文中,我们建议通过提出集成基于内容和图的特征的融合方法来利用这两种信息来源。我们对原始聊天记录的实验表明,消息的内容以及它们在对话中的动态包含部分补充信息,允许在滥用消息分类任务上进行性能改进,最终F-度量为93.26%。
基于共轭力模型的行人疏散模拟探索最优旁路策略
原文标题: Simulation of Pedestrian Evacuation Using Conjugated Forces Model to Explore the Optimal Bypassing Strategy
地址: http://arxiv.org/abs/1905.07949
作者: Xiaolu Jia, Hao Yue, Dongliang He
摘要: 提出并采用能够再现旁路行为的共轭力模型(CFM)来模拟行人疏散。首先,冲突和规避以及超越行为的概念被特别定义为描述所提出的CFM。行人可以通过CFM描述的行人将在遇到碰撞时改变他想要的方向,并选择主动绕过其他人。其次,模拟通道中的行人运动以证明CFM再现微观绕行行为的能力,然后引入旁路参数来描述不同的运动策略。最后,模拟一个出口房间的疏散,以找到最佳的旁路策略。可以得出结论,最佳旁路策略随着出口宽度和初始行人数的不同而变化。
使用自愿汇报的地理信息诊断小空间尺度的人体移动模型的性能
原文标题: Diagnosing the performance of human mobility models at small spatial scales using volunteered geographic information
地址: http://arxiv.org/abs/1905.07964
作者: Chico Q. Camargo, Jonathan Bright, Scott A. Hale
摘要: 对当地人口流动模式进行准确建模是当前城市决策者关注的核心问题,既影响公共交通资源的短期部署,也影响交通基础设施的长期规划。然而,虽然宏观层面的人口流动模型(如重力和辐射模型)得到了很好的发展,但微观层面的替代品供应却要短得多,大多数宏观模型已知在较小的地理范围内表现不佳。在本文中,我们采取了第一步来弥补这一不足,通过利用两个新的数据集来分析人类流动的宏观模型在何种程度上以及为何在小范围内崩溃。特别是,我们使用来自主要移动应用程序的匿名聚合数据集,并将其与来自OpenStreetMap的免费可用数据相结合,该数据涉及英国牛津郡周围不同地区的土地利用组成。我们展示了不同模型失败的地方,并为新的建模策略提供了理由,该策略超越了诸如距离和人口规模等粗略启发式,以及对城市不同区域所呈现的机会的详细,细致的理解。
考虑关系结构的异构信息网络嵌入
原文标题: Relation Structure-Aware Heterogeneous Information Network Embedding
地址: http://arxiv.org/abs/1905.08027
作者: Yuanfu Lu, Chuan Shi, Linmei Hu, Zhiyuan Liu
摘要: 异构信息网络(HIN)嵌入旨在将多种类型的节点嵌入到低维空间中。尽管大多数现有的HIN嵌入方法都考虑了HIN中的异构关系,但它们通常对所有关系采用单一模型而没有区别,这不可避免地限制了网络嵌入的能力。在本文中,我们考虑了异构关系的结构特征,提出了一种新的关系结构感知异构信息网络嵌入模型(RHINE)。通过全面的数学分析探索现实世界网络,我们提出了两种与结构相关的测量方法,可以将异构关系一致地分为两类:关联关系(AR)和交互关系(IR)。为了尊重关系的独特特征,我们在RHINE中提出了专门用于处理AR和IR的不同模型,这些模型可以更好地捕获网络的结构和语义。最后,我们以统一和优雅的方式组合和优化这些模型。对三个真实数据集的大量实验表明,我们的模型在各种任务中明显优于最先进的方法,包括节点聚类,链路预测和节点分类。
少数人的力量:分析有影响力的用户在协同推荐系统中的影响
原文标题: Power of the Few: Analyzing the Impact of Influential Users in Collaborative Recommender Systems
地址: http://arxiv.org/abs/1905.08031
作者: Farzad Eskandanian, Nasim Sonboli, Bamshad Mobasher
摘要: 与其他社交系统一样,在协同过滤中,少数“有影响力”的用户可能对其他用户的推荐产生很大影响,从而影响系统的整体行为。识别有影响力的用户并研究他们对其他用户的影响是一个重要问题,因为它提供了对小团体如何无意或有意地影响整个系统行为的深入了解。对这些影响进行建模还可以揭示难以辨别的模式和关系,希望能够提高系统生成个性化内容的透明度。在这项工作中,我们首先使用影响歧视模型将协作过滤中的“影响”概念形式化。然后,我们根据经验识别和表征有影响力的用户,并分析他们在不同的基础推荐算法和三个不同的推荐域中对系统的影响:工作,电影和书籍推荐。这些实验的见解有助于设计不仅针对准确性进行优化的系统,而且还可以调整以减轻有影响力的用户在可能导致系统结果的潜在不平衡或不公平时的影响。
多Agent市场的信誉系统
原文标题: A Reputation System for Multi-Agent Marketplaces
地址: http://arxiv.org/abs/1905.08036
作者: Anton Kolonin, Ben Goertzel, Cassio Pennachin, Deborah Duong, Matt Ikle, Nejc Znidar, Marco Argentieri
摘要: 我们基于对相应金融交易的价值加权的显性评级,从其向市场参与者授予“安全性”的能力的角度,通过保护他们免受欺诈和“公平”的真实品质来展示信誉系统的探索。参与者正确评估。我们提出了一种基于所选信誉系统的仿真建模方法,并讨论了仿真结果。
T-EDGE:用于以太坊交易网络分析的时间加权多元有向图嵌入
原文标题: T-EDGE: Temporal WEighted MultiDiGraph Embedding for Ethereum Transaction Network Analysis
地址: http://arxiv.org/abs/1905.08038
作者: Jiajing Wu, Dan Lin, Zibin Zheng, Qi Yuan
摘要: 最近,图嵌入技术已广泛用于各种网络的分析,但是大多数现有的嵌入方法省略了可能在金融交易网络中起作用的边的时间和加权信息。基于区块链的平台以太坊的开放性为我们提供了前所未有的数据挖掘机会。通过考虑交易网络的现实规则和特征,我们建议将以太坊交易网络建模为时间加权多重图(TWMDG),其中每个节点都是一个唯一的以太坊账户,每个边代表一个按金额加权并分配时间戳的交易。 。在TWMDG中,我们通过结合边的时间和加权信息来定义时间加权多重图嵌入(T-EDGE)的问题,目的是捕获动态交易网络的更全面的属性。为了评估所提出的嵌入方法的有效性,我们对从以太坊收集的真实世界交易数据进行预测任务的实验,包括时间链路预测和节点分类。实验结果表明,T-EDGE优于基线嵌入方法,表明时间相关的行走和边的多重性特征对于时间敏感的交易网络而言是必要的和必不可少的。
用于确定实体关系的图距离:欺诈检测的拓扑方法
原文标题: Graph distances for determining entities relationships: a topological approach to fraud detection
地址: http://arxiv.org/abs/1905.08040
作者: J.M. Calabuig, H. Falciani, A. Ferrer-Sapena, L.M. García-Raffi, E.A. Sánchez-Pérez
摘要: 给定 Omega 和接近函数 phi: Omega times Omega to mathbb R ^ + ,我们通过考虑 Omega 中的路径距离来定义 Omega 的新指标,这被视为一个完整的图表。我们分析了这种距离的属性,以及定义初始邻近矩阵的几个过程( phi(a,b))_ (a,b) in Omega times Omega。我们的动机有它的根据当前的兴趣,找到有效的算法来检测和分类社会网络的元素之间的关系。例如,分析为特定公共管理部门工作的一组公司或需要自动欺诈检测系统的其他数字。使用这种形式主义,我们陈述了关于欺诈检测的主要观点,其基础是可以检测到欺诈,因为它在以这种方式定义的度量空间中产生有意义的局部密度变化。
理解激进思维:识别信号检测Twitter上的极端主义内容
原文标题: Understanding the Radical Mind: Identifying Signals to Detect Extremist Content on Twitter
地址: http://arxiv.org/abs/1905.08067
作者: Mariam Nouh, Jason R. C. Nurse, Michael Goldsmith
摘要: 互联网,特别是在线社会网络改变了恐怖主义和极端主义团体影响和激进个人的方式。最近的报告显示,这些群体的运作模式首先是将广泛的受众暴露在极端主义在线资料中,然后再迁移到较不开放的在线平台以进一步激演化。因此,在线识别激进内容对于限制极端主义叙事的范围和传播至关重要。在本文中,我们的目标是确定自动检测社交媒体中激进内容的措施。我们确定了几个信号,包括文本,心理和行为,它们共同允许对激进信息进行分类。我们的贡献是三方面的:(1)我们分析极端主义团体发布的宣传材料,并创建基于文本的基本内容模型,(2)我们建立了从这些材料推断的心理属性模型,(3)我们在Twitter上评估这些模型,以确定自动识别在线激进推文的程度。我们的研究结果表明,激进的用户确实展现出可区分的文本,心理和行为属性。我们发现心理属性是最显著的特征之一。此外,我们的结果表明,使用矢量嵌入功能的文本模型显著改善了对TF-IDF特征的检测。我们验证了两种实现高精度的实验方法。我们的研究结果可用作检测在线激演化活动的信号。
当图挖掘遇到众包:为答案聚合选择专家
原文标题: Graph Mining Meets Crowdsourcing: Extracting Experts for Answer Aggregation
地址: http://arxiv.org/abs/1905.08088
作者: Yasushi Kawase, Yuko Kuroki, Atsushi Miyauchi
摘要: 汇总群众工作者的反应是众包过程中的一项基本任务。如果少数专家被大量非专家淹没,大多数答案聚合算法(如多数投票)都无法确定正确的答案。因此,从人群中提取可靠的专家至关重要。在这项研究中,我们引入了“专家核心”的概念,这是一组不太可能包含非专家的工人。我们设计了一种基于图挖掘的高效算法,可精确计算专家核心。为了回答聚合任务,我们提出了两种算法。第一个将专家核心结合到现有的答案聚合算法中,例如多数表决,而第二个利用专家核心提取算法提供的与工作人员可靠性有关的信息。然后,我们为第一种算法提供理论依据。使用合成和真实数据集的计算实验表明,我们提出的答案聚合算法优于最先进的算法。
Barabasi-Albert网络的配置模型
原文标题: The configuration model for Barabasi-Albert networks
地址: http://arxiv.org/abs/1905.08093
作者: M.L. Bertotti, G. Modanese
摘要: 我们开发并测试了一种重连方法(最初由Newman提出),该方法允许构建具有预先指定的度分布和两点相关性的随机网络。对于无标度学位分布的情况,我们根据Dorogovtsev和Mendes的一般处方对分布的尾部进行离散化。由于最近对其相关性的分析结果,该方法应用于Barabasi-Albert(BA)网络是可能的,并且允许将配置模型中生成的随机网络的集合与从优先附着获得的“真实”网络的集合进行比较。对于 beta ge 2 ( beta 是优先连接方案中的父节点数),使用配置模型获得的网络完全连接(巨大组件等于100%)。在两种生成方案中,通过函数 k_ nn 的计算证明了小程度节点的明显不协调性。我们还开发了一种有效的重连方法,它可以产生可调系数变化系数 r ,我们用它来获得具有相同度数分布的BA网络的最大不匹配网络给定 beta 。该方法的可能应用涉及各种社会网络。
神经图协同过滤
原文标题: Neural Graph Collaborative Filtering
地址: http://arxiv.org/abs/1905.08108
作者: Xiang Wang, Xiangnan He, Meng Wang, Fuli Feng, Tat-Seng Chua
摘要: 学习用户和项目的向量表示(即嵌入)是现代推荐系统的核心。从早期矩阵分解到最近出现的基于深度学习的方法,现有的努力通常通过映射来自描述用户(或项目)的预先存在的特征(例如ID和属性)来获得用户(或项目)的嵌入。我们认为这种方法的固有缺点是,在用户项交互中潜伏的协作信号不在嵌入过程中编码。因此,所得到的嵌入可能不足以捕获协同过滤效果。在这项工作中,我们建议将用户 - 项目交互 - 更具体地说是二部图结构 - 集成到嵌入过程中。我们开发了一个新的推荐框架Neural Graph Collaborative Filtering(NGCF),它通过在其上传播嵌入来利用用户项目图结构。这导致用户项图中的高阶连通性的表达建模,有效地将协作信号以明确的方式注入到嵌入过程中。我们对三个公共基准进行了广泛的实验,证明了对HOP-Rec和协同记忆网络等几个最先进模型的重大改进。进一步分析验证了嵌入传播对于学习更好的用户和项目表示的重要性,证明了NGCF的合理性和有效性。可从https://github.com/xiangwang1223/neural_graph_collaborative_filtering获取代码。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。