- WhatsApp,Doc?对WhatsApp公共群数据的简要分析;
- 使用贝叶斯网络更新条件/事件网络的概率知识;
- 动态航空网络中的子图和模体;
- 医疗记录中的文本到主题:无监督的图分割方法;
- Core2Vec:网络的核心保留特征学习框架;
- 社会网络中的随机优惠券探测;
- 虚拟物品赌博行为分析;
- 社会网络辅助抄袭检测;
- 沮丧的出现标志着系统性风险;
- 计算网络中优化社区的统计显著性;
- 城市节奏的时空变化:犯罪的行波;
- 随机块模型上的合作演化;
- 稀疏网络Beta中性到左模型的抽样和推理;
- 表征时间序列网络图的复杂性:一种简单的方法;
- 时间网络中的相关突发减缓了传播;
- 在反对者的影响下嘈杂的选民模型;
WhatsApp,Doc?对WhatsApp公共群数据的简要分析
原文标题: WhatsApp, Doc? A First Look at WhatsApp Public Group Data
地址: http://arxiv.org/abs/1804.01473
作者: Kiran Garimella, Gareth Tyson
摘要: 在此数据集文章中,我们描述了我们关于公共WhatsApp组数据的收集和分析的工作。我们的主要目标是探索收集和使用WhatsApp数据进行社会科学研究的可行性。因此,我们提出了一种通用的数据收集方法,以及供其他研究人员使用的公开数据集。为了提供上下文,我们进行统计探索,以便研究人员了解可以收集哪些公共WhatsApp组数据以及如何使用这些数据。鉴于WhatsApp的广泛使用,我们获取公共数据和潜在应用的技术对社区非常重要。
使用贝叶斯网络更新条件/事件网络的概率知识
原文标题: Updating Probabilistic Knowledge on Condition/Event Nets using Bayesian Networks
地址: http://arxiv.org/abs/1807.02566
作者: Benjamin Cabrera, Tobias Heindel, Reiko Heckel, Barbara König
摘要: 本文通过一种机制来扩展贝叶斯网络(BN),以动态改变由BN表示的概率分布。一种应用场景是与系统交互的观察者的知识获取过程。特别是,本文考虑了条件/事件网络,观察者对当前标记的了解是标记上的概率分布。观察者可以通过请求某些过渡以及观察他们的成功或失败来与网进行交互以推断出关于标记的信息。为了有效实现BN概率分布的动态变化,我们考虑一种模块化形式的网络,形成具有交换共生结构的自由PROP的箭头,也称为术语图。这些PROP的代数结构为我们提供了一个组合语义,它将BNs功能映射到它们的基本概率分布,特别是,它提供了描述网络结构更新的便捷方法。
动态航空网络中的子图和模体
原文标题: Subgraphs and motifs in a dynamic airline network
地址: http://arxiv.org/abs/1807.02585
作者: Marius Agasse-Duval, Steve Lawford
摘要: 航空网络的小规模拓扑结构如何随着网络的发展而变化?为了解决这个问题,我们使用15年的西南航空公司国内航线服务数据,研究了小型无向子图的动态和空间特性。我们发现这个真实世界的网络与随机图有许多共同之处,并描述了子图计数与网络中边数量之间可能的幂律尺度,这似乎对网络密度和大小的变化非常稳健。我们使用分析公式来识别统计上过多和欠代表的子图,称为图案和反图案,并发现实质拓扑过渡的存在。我们提出了一个简单的基于子图的节点排序度量,它并不总是与标准节点中心性高度相关,并且可以识别相对于特定拓扑的重要节点,并使用图工具研究三角形子图的空间“分布”。我们的结果对子图可用于分析现实世界网络的方式有影响。
医疗记录中的文本到主题:无监督的图分割方法
原文标题: From Text to Topics in Healthcare Records: An Unsupervised Graph Partitioning Methodology
地址: http://arxiv.org/abs/1807.02599
作者: M. Tarik Altuncu, Erik Mayer, Sophia N. Yaliraki, Mauricio Barahona
摘要: 电子医疗记录包含大量非结构化数据,包括大量自由文本。然而,由于缺乏及时提取可解释内容的方法,这种详细信息来源往往仍未得到充分利用。在这里,我们应用网络理论工具来分析来自国家健康服务的医院病人事件报告中的自由文本,以无人监督的方式在不同的分辨率级别找到具有相似内容的文档集群。我们将深度神经网络段落矢量文本嵌入与多尺度马尔可夫稳定性社区检测结合应用于文档向量的稀疏相似图,并展示伦敦帝国理工学院医疗保健NHS信托事件报告的方法。多尺度社区结构揭示了数据集主题中不同的含义级别,如从记录簇中提取的描述性术语所示。我们还将后验与医务人员分配的手工编码类别进行比较,并表明我们的方法优于基于LDA的模型。我们的内容集群与两个级别的手工编码类别表现出良好的对应关系,但它们还在某些领域提供了进一步的医学细节,并揭示了超出外部分类分类的事件的补充描述。
Core2Vec:网络的核心保留特征学习框架
原文标题: Core2Vec: A core-preserving feature learning framework for networks
地址: http://arxiv.org/abs/1807.02623
作者: Soumya Sarkar, Aditya Bhagwat, Animesh Mukherjee
摘要: 网络表示学习领域的最新进展主要归因于在图的上下文中应用skip-gram模型。图中的跳过 - 克模型的最新类似物定义了邻域的概念,并且旨在找到节点的向量表示,这最大化了保留该邻域的可能性。在本文中,我们通过利用核心思想,大大偏离了现有节点邻域的概念。更具体地说,我们利用已经确立的观点,即具有相似核心数的节点在网络中扮演相同的角色,从而引发邻域的新颖和有机概念。基于这个想法,我们提出了core2vec,一个用于学习节点低维连续特征映射的新算法框架。因此,具有相似核心数的节点在我们学习的向量空间中相对更近。我们通过比较通过我们的方法获得的单词相似性得分来进一步证明core2vec的有效性,其中节点表示从标准单词关联图中绘制,而得分由其他最先进的网络表示技术(如node2vec,DeepWalk和LINE)计算得出。我们的结果总是优于现有的方法
社会网络中的随机优惠券探测
原文标题: Stochastic Coupon Probing in Social Networks
地址: http://arxiv.org/abs/1807.02688
作者: Shaojie Tang
摘要: 在本文中,我们研究了社会网络中的随机优惠券探测问题。假设有一个社会网络和一组优惠券。我们可以自适应地向一些用户提供优惠券,并且接受该优惠的用户将充当种子并影响他们在社会网络中的朋友。有两个约束分别称为内部约束和外部约束。用户兑换的优惠券集合必须满足内部约束,并且所有被探测用户的集合必须满足外部约束。人们寻求制定一种优惠券探测政策,在满足内在和外在约束的同时实现最大影响。我们的主要结果是对于任何单调子模块效用函数的随机优惠券探测问题的恒定近似策略。
虚拟物品赌博行为分析
原文标题: Behavior analysis of virtual item gambling
地址: http://arxiv.org/abs/1807.02803
作者: Xiangwen Wang, Michel Pleimling
摘要: 根据在线彩票博弈的赌博日志,我们提取各种数量的概率分布(例如,下注值,总池大小,连续赌博之间的等待时间)以及相关的相关系数。我们将每个玩家的净收入变化视为随机游走。这些净收入随机游走的均方位移表现出超扩散和正常扩散机制之间的过渡。我们讨论了具有截断幂律步长分布的不同随机游走模型,其允许再现从赌博日志中提取的一些属性。通过分析这些模型的均方位移和首次通过时间分布,可以确定观察从超扩散到正常扩散的交叉所需的关键特征。
社会网络辅助抄袭检测
原文标题: Social network aided plagiarism detection: Social network aided plagiarism detection
地址: http://arxiv.org/abs/1807.02830
作者: Aljaž Zrnec, Dejan Lavbič
摘要: 不同类型的电子设备的普及和网络上的内容量增加了抄袭的数量,这被认为是一种不道德的行为。如果我们想要有效地发现和预防这些行为,我们必须改进今天发现抄袭的方法。本文提出了一项研究性研究,其中提出了一种改进的抄袭检测框架。该框架侧重于社会网络信息的集成,来自Web的信息,以及关于作者和文档的信息的高级语义丰富可视化,这些信息通过寻找先进的抄袭模式来探索获得的数据。为了支持拟议的框架,还开发了一种特殊的软件工具。统计评估证实,社会网络分析和先进的可视化技术的使用导致了抄袭检测过程的确认和调查阶段的改进,从而提高了抄袭检测过程的整体效率。
沮丧的出现标志着系统性风险
原文标题: Emergence of frustration signals systemic risk
地址: http://arxiv.org/abs/1807.02923
作者: Chandrashekar Kuyyamudi, Anindya S. Chakrabarti, Sitabhra Sinha
摘要: 我们表明复杂系统中系统性风险的出现可以从功能网络的演化中理解,这些功能网络表示从宏观可观察量之间的波动相关性推断的相互作用。具体来说,我们分析了1926年至2016年间纽约证券交易所的长期集体动态,显示出系统性危机的时期,即1929年至1933年的大萧条和2007 - 09年的大衰退,与交互网络中结构平衡的丧失所表明的沮丧的出现相关联。在这些时期期间,表征集体行为的主要本征模式表现出离域化,导致动力学中的一致性增加。网络的拓扑结构呈现出一种缓慢发展的趋势,其特点是围绕两个危机时期出现了一个突出的核心 - 边组织。
计算网络中优化社区的统计显著性
原文标题: Computing the statistical significance of optimized communities in networks
地址: http://arxiv.org/abs/1807.02930
作者: John Palowitch
摘要: 通常有兴趣将网络数据中的社区作为无监督学习的一种形式,用于特征发现或科学研究。绝大多数社区检测方法都是通过质量功能的优化来实现的,即使在没有社区的随机网络上也是如此。因此,通常没有一种简单的方法来判断优化的社区是否重要,在这种情况下意味着内部联系比没有真实社区的随机图模型所预期的更多。本文介绍了FOCS(快速优化社区意义),这是一种计算个体社区显著性分数的新方法。
城市节奏的时空变化:犯罪的行波
原文标题: Spatio-temporal variations in the urban rhythm: the travelling waves of crime
地址: http://arxiv.org/abs/1807.02989
作者: Marcos Oliveira, Eraldo Ribeiro, Carmelo Bastos-Filho, Ronaldo Menezes
摘要: 在过去的几十年中,城市处于与中央集权组织处于均衡状态的观念已经让位于不平衡的城市观点,并从下到上组织起来。从这个角度来看,城市是不断发展的系统,展示了由当地决策构建的紧急现象。虽然城市演变促进了积极的社会现象的出现,例如创新中心的形成和文化多样性的增加,但它也产生了负面现象,例如犯罪活动的增加。然而,我们还远未了解这些现象的驱动机制。特别是,通过忽略时间非平稳性和空间异质性,分析城市现象的方法在范围上是有限的。在犯罪活动的情况下,我们知道一个多世纪以来犯罪在一年中的特定时期达到顶峰,但文献仍然无法描述犯罪的流动性。在这里,我们开发了一种方法来描述城市数量的空间,时间和周期性变化。通过来自12个城市的犯罪数据,我们可以确定犯罪的周期性随着时间的推移在整个城市的空间变化。我们确认了一年的犯罪周期,并表明整个城市的这种周期性不均匀。这些“犯罪浪潮”继续穿越城市:虽然城市拥有稳定数量的周期性地区,但这些地区呈现出非平稳的系列。我们的研究结果支持城市不断变化的概念,影响城市现象 - 与不平衡的城市概念一致。
随机块模型上的合作演化
原文标题: Evolution of Cooperation on Stochastic Block Models
地址: http://arxiv.org/abs/1807.03093
作者: Babak Fotouhi, Naghmeh Momeni, Benjamin Allen, Martin A. Nowak
摘要: 合作是人类社会发展的一个主要因素。影响合作动态和其他人际现象的人类社会网络结构具有共同的结构特征。其中一个签名是组织团体的倾向。网络理论家用来模拟这一特征的生成模型是随机块模型(SBM)。在本文中,我们研究了SBM网络上的演化博弈动态。利用最近发现的演化博弈和合并随机游走之间的二元性,我们获得了分析条件,使得自然选择有利于合作而不是背叛。我们计算每个社区的转换点以促进合作。我们发现,对于给定的群体密度,存在关键的群落间链接创建概率,使得整个网络即使个体社区抑制它也支持合作。作为副产品,我们提出了关键利益 - 成本比的平均场解决方案,其对于不同的生成网络模型(包括具有社区结构和重尾度分布的模型)具有显著的准确性。我们还展示了结果对任意双人博弈的普遍性。
稀疏网络Beta中性到左模型的抽样和推理
原文标题: Sampling and Inference for Beta Neutral-to-the-Left Models of Sparse Networks
地址: http://arxiv.org/abs/1807.03113
作者: Benjamin Bloem-Reddy, Adam Foster, Emile Mathieu, Yee Whye Teh
摘要: 经验证据表明,在许多真实网络中发生的重尾度分布很好地接近幂指数,其中指数\ eta可能取值小于或大于2。基于各种形式的可交换性的模型能够以\ eta <2捕获幂律,并且允许易处理的推理算法;我们利用以前的结果来证明\ eta> 2不能通过现有随机图模型中使用的可交换形式生成。优先附着模型产生大于2的幂律指数,但由于在非可交换模型中执行推理的固有困难,因此作为统计模型的用途有限。受此差距的影响,我们为最近提出的一类模型设计和实现推理算法,这些模型生成所有可能值的\ eta。我们表明,尽管它们不可交换,但这些模型具有适合推理的概率结构。我们的方法使得大量先前难以处理的模型对统计推断很有用。
表征时间序列网络图的复杂性:一种简单的方法
原文标题: Characterizing the complexity of time series network graphs: A simplicial approach
地址: http://arxiv.org/abs/1807.03154
作者: N. Nirmal Thyagu, Nithyanand Rao, Malayaja Chutani, Neelima Gupte
摘要: 我们使用可见性算法通过构建它们的等效时间序列(TS)网络来分析从逻辑映射的不同动态方案获得的时间序列。分析的制度包括周期性和混乱态度,以及间歇性制度和混沌边的Feigenbaum吸引子。我们使用代数拓扑的方法来定义单纯特征,它可以分析全局和局部层次网络的单纯结构。简单的表征者在各种拓扑层面上提出了复杂性的等级层次。这些复杂的层次级别找到了嵌入在网络中的局部动态的骨架,其影响系统的全局动态特性,并且还允许识别主导图案。我们还使用常规网络特征分析相同的网络,例如平均路径长度和聚类系数。我们看到,单纯的特征能够区分不同的动力学方式,并且能够在动力学行为中找到微妙的差异,而通常的特征提供者可以提供更粗略的特征。但是,两者结合起来,可以提供有关时间序列的动态行为的信息,以及演化系统中的相关性。因此,我们的方法可以为动力系统的分析提供强大的工具。
时间网络中的相关突发减缓了传播
原文标题: Correlated bursts in temporal networks slow down spreading
地址: http://arxiv.org/abs/1807.03169
作者: Takayuki Hiraoka, Hang-Hyun Jo
摘要: 传播动力学被认为发生在时间网络中,其中节点之间的时间交互模式显示非Poissonian突发性质。近年来,不均匀的间隔时间(IET)对扩散的影响已得到广泛研究,但对于IET之间的相关性对扩散的影响知之甚少。为了研究这些影响,当交互模式由非均匀和相关的IET(即相关突发)建模时,我们研究了两步确定性易感染(SI)和概率SI动态。通过分析单链路设置中的传输时间统计量并通过模拟Bethe格子和随机图中的扩展,我们得出结论,IET之间的正相关减慢了扩展。我们还认为,从一个受感染节点到其易感邻居的最短传输时间可以成功解释我们的数值结果。
在反对者的影响下嘈杂的选民模型
原文标题: The noisy voter model under the influence of contrarians
地址: http://arxiv.org/abs/1807.03176
作者: Nagi Khalil, Raul Toral
摘要: 在平均场水平上研究了反对者对嘈杂选民模型的影响。嘈杂的选民模型是选民模型的变体,其中代理人可以采用两种观点,乐观或悲观,并且可以通过模仿(放牧)和内在(噪声)机制来改变它们。一群嘈杂的选民经历了有限大小的相变,在增加噪声对放牧的相对重要性时形成双峰阶段,其中大多数代理人将相同的观点剪切到单峰阶段,其中几乎相同的一部分代理人是处于相反的状态。通过包含反向投资者,我们允许一些选民采纳其他代理人的反对意见(反牧民)。我们首先考虑只有逆向运动的情况,并表明唯一可能的稳态是单峰的。更一般地说,当选民和反对者存在时,我们表明只有当系统中的反向数量小于4时,嘈杂的选民模型的双峰 - 单峰转换才会占优势,并且它们的特征速率足够小。对于大于或等于4的反向投资者的数量,选民和反向投资者只能在单峰阶段看到。此外,如果选民和反对者的数量以及噪声和放牧率具有相同的顺序,那么稳态的概率函数非常接近于高斯分布。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。