Arxiv网络科学论文摘要12篇(2018-03-14)

  • 数学的共现单纯复形:识别知识中的孔洞;
  • 同时具有局部和全局数据视角的聚类:基于消息传递的方法;
  • 相似但不同:挖掘用户对推荐系统的一致性;
  • 基于滑动窗张量分解的路网异常检测;
  • 社区检测的谱聚类算法分析:一般二部图设置;
  • VERSE:利用相似性度量的多样性图嵌入;
  • 在时间网络中检测系统状态的序列;
  • 员工和贸易伙伴对公司销售的不对称影响及其动力来源;
  • 拓扑结构在功能复杂网络中一直被高估;
  • 选区改划的倾斜函数介绍;
  • 网络聚类对互助协作性感染的影响;
  • 基于大规模营养成分数据的半至严格素食饮食的营养推荐食物;

数学的共现单纯复形:识别知识中的孔洞

原文标题: Co-occurrence simplicial complexes in mathematics: identifying the holes of knowledge

地址: http://arxiv.org/abs/1803.04410

作者: Vsevolod Salnikov, Daniele Cassese, Renaud Lambiotte, Nick S. Jones

摘要: 在过去的几年中,复杂的网络工具通过对协作,引用和共现网络的研究,有助于提供对研究结构的深刻见解。网络方法侧重于配对关系,往往压缩多维数据结构并不可避免地丢失信息。在本文中,我们首次提出了一种简单复杂的词语共现方法,为研究科学知识空间中的高阶关系提供了一个自然的框架。使用拓扑方法,我们探索数学研究的概念景观,侧重于同调孔,单纯结构中低连通性的区域。我们发现同调孔无处不在,这表明它们捕捉到了数学研究实践的一些基本特征。当他们的概念的一个子集出现在同一篇文章中时,孔死了,因此他们的死亡可能是创造新知识的标志,正如我们用一些例子展示的。我们发现洞的尺寸与需要关闭的时间之间存在正相关关系:较大的洞可能代表该领域重要进展的潜力,因为它们在概念上将远处区域分开。我们还表明作者的概念熵与它们对同调孔的贡献呈正相关,表明polymaths倾向于处于研究的前沿。

同时具有局部和全局数据视角的聚类:基于消息传递的方法

原文标题: Clustering with Simultaneous Local and Global View of Data: A message passing based approach

地址: http://arxiv.org/abs/1803.04459

作者: Rayyan Ahmad Khan, Rana Ali Amjad, Martin Kleinsteuber

摘要: 一个好的聚类算法不仅能够发现任意形状的聚类(全局视图),而且还能提供额外的信息,这些信息可用于获取对聚类内部结构(本地视图)的更有意义的见解。在这项工作中,我们使用因子图和消息传递算法的数学框架来优化基于成对相似性的成本函数,这与在Affinity Propagation中做的相同。使用这个框架,我们开发了两种新的聚类算法EAP和SHAPE。 EAP / SHAPE不仅可以发现任意形状的集群,还可以以有意义的本地代表(示例)和这些本地示例之间的连接的形式提供丰富的本地视图。我们讨论如何使用这些本地信息来获得有关聚类的各种见解,包括聚类不同区域的不同相对聚类密度和局部强度指示。我们还讨论了这可以如何帮助分析师发现和解决结果中潜在的不一致问题。通过将EAP / SHAPE应用于各种合成和现实世界基准数据集,可以显示EAP / SHAPE的功效。

相似但不同:挖掘用户对推荐系统的一致性

原文标题: Similar but Different: Exploiting Users' Congruity for Recommendation Systems

地址: http://arxiv.org/abs/1803.04514

作者: Ghazaleh Beigi, Huan Liu

摘要: 社交媒体的普遍使用提供了关于个人在线社交活动及其社交关系的大量数据。大多数现有推荐系统的构建块是具有社交关系的用户,即朋友之间的相似度。尽管友谊可以确保一些同性恋,但是随着朋友数量的增加,用户与她的朋友的相似度可能会有所不同。社会学研究表明,朋友比陌生人更相似,但朋友可以有不同的兴趣。评论和评级等外部信息可能有助于辨别类似用户之间不同程度的一致性(即一致性)。在本文中,我们调查用户的一致性是否可以纳入推荐系统中以提高其性能。实验结果证明了将一致性相关信息嵌入推荐系统的有效性。

基于滑动窗张量分解的路网异常检测

原文标题: Anomaly Detection in Road Networks using Sliding-Window Tensor Factorization

地址: http://arxiv.org/abs/1803.04534

作者: Ming Xu, Jianping Wu, Haohan Wang, Mengxin Cao, Dongmei Hu

摘要: 道路网络异常检测可用于切断应急响应,对交通管理具有重要意义。然而,现有的方法都不能处理异常类型的多样性。在本文中,我们提出了一种新颖的框架来检测多种类型的异常。该框架将实时和历史流量合并到张量模型中,并使用张量分解获得统一模型中的空间和不同尺度时间流量模式。此外,我们提出了滑动窗口张量分解以提高计算效率。基于此,我们可以通过测量不同的空间和时间模式的偏差来识别不同的异常类型。然后,为了促进对检测到的异常情况的更深入了解,我们使用优化方法来发现路径级异常。其核心思想是通过同时考虑路径异常和流动的稀疏性,将异常路径推理表述为L1反问题。我们基于滑行轨迹的真实世界数据集进行综合实验和真实案例研究。实验证实,所提出的框架优于效率和有效性的所有基准方法,并且该框架可以提供对异常事件的更好理解。

社区检测的谱聚类算法分析:一般二部图设置

原文标题: Analysis of spectral clustering algorithms for community detection: the general bipartite setting

地址: http://arxiv.org/abs/1803.04547

作者: Zhixin Zhou, Arash A. Amini

摘要: 我们考虑在随机块模型(SBM)下对社区检测的谱聚类算法进行分析。一般的谱聚类算法由三个步骤组成:(1)正则化一个适当的邻接或拉普拉斯矩阵(2)一种形式的谱截断和(3)k-means类型的算法在还原的谱域。通过改变每一步,可以获得不同的谱算法。鉴于最近在谱聚类中提炼一致性结果的发展,我们在这三个步骤中确定了每个步骤的必要界限,然后推导和比较一些现有谱算法的一致性结果以及我们提出的新变体。本文的重点是提供更好的理解社区检测谱方法的分析,重点放在二分法设置上,而这种设置受到较少的理论考虑。我们展示了谱截断步骤中的变化如何反映一般SBM下的一致性结果。我们还详细研究了k-means步骤的必要界限,允许用任何保证必要界限的算法(k-means类型或其他)来替换这个步骤。我们讨论了一些被忽略的双方设置方面,例如,双方社区之间对谱方法性能不匹配的作用。最后,我们展示了如何将一致性结果扩展到SBM以外的问题,以聚类非均匀随机图模型,在某种意义上可以用SBM近似。

VERSE:利用相似性度量的多样性图嵌入

原文标题: VERSE: Versatile Graph Embeddings from Similarity Measures

地址: http://arxiv.org/abs/1803.04742

作者: Anton Tsitsulin, Davide Mottin, Panagiotis Karras, Emmanuel Müller

摘要: 将网络尺度信息网络嵌入低维矢量空间便于链路预测,分类和可视化等任务。过去的研究已经解决了通过采用从单词到图的方法来提取这种嵌入的问题,而没有定义清晰易懂的与图相关的目标。然而,正如我们所展示的,过去作品中使用的目标隐含地利用了图节点之间的相似性度量。在本文中,我们将以往作品的相似性定位与其逻辑结论相结合;我们提出了VERTE相似嵌入(VERSE),这是一种简单,通用且高效的内存方法,可以导出明确校准的图嵌入以保留选定顶点到顶点相似性度量的分布。 VERSE通过训练单层神经网络来学习这种嵌入。虽然其默认的可伸缩版本通过采样相似性信息来实现,但我们还使用每个顶点的全部信息开发了一个变体。我们对标准基准和实际数据集进行的实验研究表明,VERSE以各种相似性度量为例,在主要数据挖掘任务的精度和召回率方面优于最先进的方法,并取代时间和空间效率,而基于可扩展采样的变体与不可扩展的完整变体同样取得了良好的效果。

在时间网络中检测系统状态的序列

原文标题: Detecting sequences of system states in temporal networks

地址: http://arxiv.org/abs/1803.04755

作者: Naoki Masuda, Petter Holme

摘要: 自然界,社会和技术中的许多时间演变系统留下了它们之间相互作用的痕迹。这些交互形成反映系统状态的时态网络。在这项工作中,我们通过提出一种将离散状态分配给系统并根据数据推断这些状态的顺序的方法来对这些系统进行粗略描述。例如,这样的状态可以对应于精神状态(如从神经影像数据推断的)或组织的操作状态(通过人际交流推断)。我们的方法结合了图距离度量和层次聚类。使用多个社会时间网络的经验数据集,我们表明我们的方法能够推断出系统的状态,例如学校和周日状态中的不同活动,而不是周末状态。我们期望这些方法在其他环境中同样有用,如时间变化的蛋白质相互作用,生态种间相互作用,大脑中的功能连接以及自适应社会网络。

员工和贸易伙伴对公司销售的不对称影响及其动力来源

原文标题: Asymmetric Influence of Employees and Trading Partners on Company's Sales and its Dynamical Origin

地址: http://arxiv.org/abs/1803.04761

作者: Yuh Kobayashi, Hideki Takayasu, Shlomo Havlin, Misako Takayasu

摘要: 商业公司或公司的成长一直是一个世纪以来深入研究的课题。然而,它们发展的基本机制仍然存在争议。受以前在其他系统中扩展规律的研究的启发,在此我们将公司规模的概念从标量扩展到矢量,以更详细地描述公司的增长和衰减机制。根据日本企业二十多年来的大规模数据集(二十年(1994-2015)),我们编制了三个组成部分的向量数据集,即年销售额,员工人数和贸易伙伴数量。我们发现,与贸易伙伴数量相比,员工数量在确定公司销售方面更具影响力。这种不对称性通过对这些参数的销售回归和增长率相关性分析进行验证。然后,我们通过详细描述三维向量空间中平均运动的演化流程图来探索企业的多变量动态。流程图表明偏离平衡标度关系的公司倾向于回到这种关系。我们还发现,具有大幅增长机会的企业会面临高失业率的风险。这些结果可以用于企业的预测和建模,并且与理论上理解复杂系统的一般原则相关。

拓扑结构在功能复杂网络中一直被高估

原文标题: Topological structures are consistently overestimated in functional complex networks

地址: http://arxiv.org/abs/1803.04797

作者: Massimiliano Zanin, Seddik Belkoura, Javier Gomez, Cesar Alfaro, Javier Cano

摘要: 功能复杂网络意味着我们理解复杂系统的方式发生了重大变化,成为人类大脑中最杰出的一个。这些网络通常使用频率主义方法进行重构,虽然简单,但完全忽略了来自数据有限性的不确定性。我们这里提供了一个基于贝叶斯推断的替代解决方案,链路权重被视为由概率分布描述的随机变量,从中抽取网络集合。通过使用统计和拓扑考虑,我们证明了链接不确定性所起的作用等同于引入了随机重连,其遗漏导致拓扑结构的一致性过高估计。我们进一步表明,这种偏见在短时间序列中得到增强,表明存在获得可靠结构的理论时间分辨极限。我们还提出了一个简单的采样过程,用于校正频率网络中获得的拓扑值。我们最终通过合成和真实网络实例来验证这些概念,后者代表了认知任务期间一群人的脑电活动。

选区改划的倾斜函数介绍

原文标题: Introduction to the declination function for gerrymanders

地址: http://arxiv.org/abs/1803.04799

作者: Gregory S. Warrington

摘要: 倾斜函数是一种通过分析投票分布来确定可能的党派选区改划的定量方法。在这个解释性说明中,我们解释并激励了倾斜函数的定义。包括计算倾斜函数所需的最小计算机代码。我们最后计算了最近几次选举的价值。

网络聚类对互助协作性感染的影响

原文标题: Effect of network clustering on mutually cooperative coinfections

地址: http://arxiv.org/abs/1803.04878

作者: Peng-Bi Cui, Francesca Colaiori, Claudio Castellano

摘要: 先前感染其他病原体可以促进传染病的传播。这种合作效应可能导致暴力事件的爆发,反映了突然发生的流行病转变。至于其他扩散动力学,东道国人口互动模式的拓扑结构起着至关重要的作用。据推测,当接触网络中相对较少的短回路和很多长回路时会出现不连续的转换。这里我们着重讨论本地集群在确定转型性质中的作用。我们认为两种相互合作的病原体在相同的人群中扩散:已经感染一种疾病的个体被另一个感染的可能性增加。我们看看服从易感染病毒的疾病如何在具有可调聚类的接触网络上传播。使用数值模拟我们表明,对于大协作性,流行转变总是突然的,随着聚类的增加,不连续性会下降。对于大型聚类,存在强大的有限尺寸效应,并且过渡的不连续性仅在大型网络中显现。这些结果表明,尽管过渡的性质与接触网络的结构严格相关,但增加局部聚类并不足以使过渡持续下去。

基于大规模营养成分数据的半至严格素食饮食的营养推荐食物

原文标题: Nutritionally recommended food for semi- to strict vegetarian diets based on large-scale nutrient composition data

地址: http://arxiv.org/abs/1803.04915

作者: Seunghyeon Kim, Michael F. Fenech, Pan-Jun Kim

摘要: 由于素食主义者的食物限制,素食健康饮食设计具有挑战性。这种挑战可以通过定量,数据驱动的方法部分克服,利用大量营养信息收集许多不同的食物。基于食品营养成分的大规模数据,最近的营养适应概念有助于量化每种食品中营养平衡,以满足日常营养需求。营养健康提供推荐食物的优先次序,使用营养充足的食物组合中的食物。在这里,我们通过计算营养适应度,系统地确定从半到严格的素食饮食营养推荐的食物。除了通常推荐的不同饮食食物之外,我们的分析还揭示了每种饮食所特有的有利食物,例如作为氨基酸和胆碱来源的纯素饮食的不成熟利马豆,以及作为维生素D的卵 - 乳汁素食和素食饮食的蘑菇资源。此外,我们发现硒和其他必需微量营养素可能在植物性饮食中存在缺陷,并提出营养上合意的饮食模式。我们将分析扩展到高度个性化的基于植物的甲硫氨酸限制饮食的两种假设情景。我们的营养素分析方法可能为设计不同类型的个性化素食饮食提供有用的指导。

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。

你可能感兴趣的:(Arxiv网络科学论文摘要12篇(2018-03-14))