- 在Pinterest上使用OWL和语义Web技术;
- 相关网络上流行病的谱特性和平均场方法的准确性;
- 计算链路流中的距离和延迟;
- 多轮鹰-鸽博弈的优势、分享和评估;
- 使用非时间戳数据跟踪图的时间演化;
- 寻找社团发现的社团;
- 在线社交平台中检测与网络相关的讨论;
- 有效网络:预测网络结构和数据集关键转换的模型;
- 新闻和城市:通过移动数据了解在线新闻消费模式;
在Pinterest上使用OWL和语义Web技术
原文标题: Use of OWL and Semantic Web Technologies at Pinterest
地址: http://arxiv.org/abs/1907.02106
作者: Rafael S. Gonçalves, Matthew Horridge, Rui Li, Yu Liu, Mark A. Musen, Csongor I. Nyulas, Evelyn Obamos, Dhananjay Shrouty, David Temple
摘要: Pinterest是一个流行的Web应用程序,拥有超过2.5亿活跃用户。它是一个视觉发现引擎,用于寻找食谱,时尚,婚礼,家居装饰等方面的创意。在过去的一年中,该公司采用语义Web技术创建了一个知识图,旨在表示Pinterest上的大量内容和用户,以帮助内容推荐和广告定位。在本文中,我们介绍了OWL本体的工程--Pinterest分类法 - 它构成了Pinterest知识图的核心,即Pinterest Taste Graph。我们描述了WebProt的建模选择和增强,例如,我们用于创建本体。在两个月内,八名Pinterest工程师在没有OWL和WebProt之前的经验的情况下,将现有的嘈杂术语分类修改为OWL本体。我们分享我们的经验,并介绍我们认为对在该领域工作的其他人有用的工作的关键方面。
相关网络上流行病的谱特性和平均场方法的准确性
原文标题: Spectral properties and the accuracy of mean-field approaches for epidemics on correlated networks
地址: http://arxiv.org/abs/1907.02144
作者: Diogo H. Silva (1), Silvio C. Ferreira (1 and 2), Wesley Cota (1), Romualdo Pastor-Satorras (3), Claudio Castellano (4) ((1) Departamento de Física, Universidade Federal de Viçosa, Viçosa-MG, Brazil, (2) National Institute of Science and Technology for Complex System Brazil, (3) Departament de Física, Universitat Politècnica de Catalunya, Campus Nord B4, Barcelona, Spain, (4) Istituto dei Sistemi Complessi ISC-CNR, Via dei Taurini, Roma, Italy)
摘要: 我们提出了随机模拟和平均场理论之间的比较,敏感感染易感(SIS)模型的流行阈值在相关网络(分类和不协调)上与幂律度分布 P(k) sim k ^ - 伽玛 。无论相关模式和度数指数 gamma 如何,我们都确认阈值消失。将数值确定的阈值与淬火平均场(QMF)和对淬火平均场(PQMF)理论进行比较。相关性不会改变整体情况:QMF和PQMF为 gamma <5/2 提供大尺寸渐近正确的估计值,而它们仅捕获 gamma> 5/2 的阈值消失,失败定量地重现这是如何发生的。对于给定的大小,PQMF更准确。我们将QMF和PQMF预测的准确度变化与标准和修改的邻接矩阵的谱特性(谱间隙和定位)的变化联系起来,它们根据理论框架来规定转变点附近的流行病流行。我们还表明,对于 gamma <5/2 ,而QMF提供了渐近精确的流行阈值的估计,它无法再现转变周围流行的奇异性。
计算链路流中的距离和延迟
原文标题: On computing distances and latencies in Link Streams
地址: http://arxiv.org/abs/1907.02146
作者: Frédéric Simard
摘要: 链路流几年前被提出作为时间网络的模型。我们通过有效地计算最短最快路径的距离,延迟和长度来寻求理解这些对象的拓扑和时间特性。我们开发了不同的算法来有效地计算这些值。提供了这些方法的正确性证明以及作为链路流参数的函数的时间复杂性的界限。本研究的一个目的是帮助开发算法来计算链路流上的中心功能,例如中介中心性和亲密度中心性。
多轮鹰-鸽博弈的优势、分享和评估
原文标题: Dominance, Sharing, and Assessment in an Iterated Hawk--Dove Game
地址: http://arxiv.org/abs/1907.02160
作者: Cameron L. Hall, Mason A. Porter, Marian S. Dawkins
摘要: 动物使用各种各样的策略来减少或避免资源冲突中的攻击行为。这些战略包括从没有外部冲突迹象的资源共享到支配等级制度的发展,其中最初的战斗之后是下属的提交。尽管已经开发了模型来分析解决资源冲突的具体策略,但很少有工作集中于试图理解为什么在某些情况下更有可能出现特定策略。在本文中,我们使用基于迭代的Hawk-Dove博弈的模型来分析资源保持潜力(RHP)和其他因素如何影响共享,支配关系或其他行为是否在演化上稳定。我们通过广泛的数值模拟发现,只有当战斗成本低且竞赛中的动物具有相似的RHP时,共享才是稳定的,而在大多数其他情况下,优势关系是稳定的。我们还探讨了当动物无法在没有战斗的情况下评估彼此的RHP时会发生什么,并且我们使用模拟来比较这个问题的一系列策略。我们发现,最成功的策略包括有限的评估期,然后是避免战斗的稳定关系,评估的持续时间取决于战斗的成本和动物的RHP之间的差异。除了我们在建模和模拟方面的直接工作外,我们还开发了广泛的软件以促进进一步测试;我们将其公开发布在 url https://bitbucket.org/CameronLHall/dominancesharingassessmentmatlab/。
使用非时间戳数据跟踪图的时间演化
原文标题: Tracking Temporal Evolution of Graphs using Non-Timestamped Data
地址: http://arxiv.org/abs/1907.02222
作者: Sujit Rokka Chhetri, Palash Goyal, Arquimedes Canedo
摘要: 用于研究图的时间演变的数据集很少。为了鼓励研究新的动态图学习算法,我们引入了YoutubeGraph-Dyn(可从https://github.com/palash1992/YoutubeGraph-Dyn获得),这是一个从YouTube真实世界交互中生成的不断发展的图数据集。 YoutubeGraph-Dyn提供日内时间粒度(每隔6小时拍摄416张快照,持续104天),捕获数据不同方面的多模式关系,多个属性,包括带时间戳,非时间戳,字嵌入和整数。我们的数据收集方法强调从非时间戳数据创建时间演变图。在本文中,我们提供了YoutubeGraph-Dyn的各种图统计和测试最先进的图聚类算法来检测社区迁移,以及时间序列分析和循环神经网络算法来预测非时间戳数据。
寻找社团发现的社团
原文标题: Discovering Communities of Community Discovery
地址: http://arxiv.org/abs/1907.02277
作者: Michele Coscia
摘要: 在复杂网络中发现社区意味着将节点分组相似,以发现有关它们的潜在信息。有数百种不同的算法来解决社区检测任务,每个算法都有自己对“社区”的理解和定义。许多评论工作试图订购这样一个多样化的景观 - 通过他们用来检测社区的过程,通过他们明确规定的社区定义,或者他们在标准化任务上的表现来对社区发现算法进行分类。在本文中,我们根据第四个标准对社区发现算法进行分类:结果的相似性。我们创建了一个算法相似性网络(ASN),其节点是社区检测方法,如果它们返回相似的分组则连接起来。然后,我们在该网络上执行社区检测,对在一千多个合成网络和现实世界网络的范围内始终返回相同分区或重叠覆盖的算法进行分组。本文试图基于经验数据创建基于相似度的社区检测算法分类。它通过比较七十多种方法改进了现有技术,发现ASN包含分离良好的组,使其成为从业者的合理工具,帮助他们选择适合其分析需求的算法。
在线社交平台中检测与网络相关的讨论
原文标题: Detecting Cyber-Related Discussions in Online Social Platforms
地址: http://arxiv.org/abs/1907.02383
作者: Ruth Ikwu, Panos Louisvieris
摘要: 随着社交平台的使用不断发展,在网络安全和防御等领域,开发自适应方法来跟踪,识别和调查这些平台上与网络相关的活动已变得势在必行。本文介绍了一种使用代表网络领域的候选术语集来检测在线社交平台中与网络相关的讨论的新方法。本文的目的是创建一个网络词典,其中包含与网络相关的术语,适用于跨各种在线平台自动检测网络活动。本文介绍的方法将自然语言处理技术应用于来自多种社交平台类型的代表性数据,如Reddit,Stack overflow,twitter和cyberwar news,以提取通用网络词典的候选术语。在选择候选术语时,我们引入APMIS聚合点状互信息分数与术语频率 - 术语度比率(FDR分数)和术语频率 - 反向文档频率分数(TF-IDF分数)进行比较。这些评分机制非常强大,可以解释术语频率,术语相关性和术语之间的相互依赖性。最后,我们通过测量网络词典的性能来评估其在“网络相关”或“非网络相关”的讨论中的精确度。
有效网络:预测网络结构和数据集关键转换的模型
原文标题: Effective networks: a model to predict network structure and critical transitions from datasets
地址: http://arxiv.org/abs/1907.02416
作者: Deniz Eroglu, Matteo Tanzi, Sebastian van Strien, Tiago Pereira
摘要: 真实世界的复杂系统,如生态社区和神经网络,是我们日常生活的重要组成部分。这些系统由通过复杂网络进行交互的单元组成。从数据中预测网络行为的突然变化(称为关键转换)的能力对于避免重大中断的灾难性后果非常重要。预测此类更改是一项重大挑战,因为它需要预测参数范围的行为,而系统上没有数据可供使用。在本文中,我们针对具有弱个体相互作用和混乱局部动力学的网络解决了这个问题。我们通过建立一个称为有效网络的模型网络来实现这一目标,该网络由每个节点的基础局部动态和它们的相互作用的统计描述组成。我们通过重建猫大脑皮层的现实神经元相互作用网络的动力学和结构来说明这种方法。我们通过分析网络产生的随机波动来重建社区结构,并预测观测范围之外的耦合参数的临界转变。
新闻和城市:通过移动数据了解在线新闻消费模式
原文标题: News and the city: understanding online press consumption patterns through mobile data
地址: http://arxiv.org/abs/1907.02480
作者: Salvatore Vilella, Daniela Paolotti, Giancarlo Ruffo, Leo Ferres
摘要: 不断增加的移动连接影响着我们日常生活的方方面面,包括我们如何以及何时通知自己并咨询新闻媒体。通过研究智利主要电信公司之一提供的移动网络数据,我们调查了智利圣地亚哥的不同人群如何通过智能手机消费新闻媒体内容。我们解决了获取信息方面的不平等问题,试图了解社会人口因素在多大程度上影响用户的偏好和习惯。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。