Arxiv网络科学论文摘要19篇(2017-03-14)

推断二模网络的一模投影：基于熵的方法;
解释社交媒体上回声室的出现：意识形态和极端主义的作用;
Kek，Cucks和神皇特朗普：4chan的政治上不正确的论坛的测量研究及其对网络的影响;
随机异步更新网格的合作策略的蔓延;
动力交换中的社会温度引起的非平衡相变;
什么时候网络是网络？在路径和时间网络中的多阶图模型选择;
复杂网络中的最大熵采样;
拮抗作用还通过转发流动：中外语言行为对观点的影响极化分析;
在线搜索中搜寻模式;
从网络招聘：发现Twitter用户，可以帮助打击寨卡流行病;
间接互惠的标准剔除方法揭示不可缺少的规范;
语言使用问题：对问题文本的语言结构的分析可以表征Quora中的可接受性;
重复激活在社会网络中的传导效应;
双边国际贸易网的大规模验证;
QT2S：通过微动接地监测道路交通的系统;
在大型网络中实现高效节点发现性优化;
金融时间序列的拓扑数据分析：崩溃的风景;
社会指纹：通过DNA启发的行为模型检测spambot组;
为自治和实时城市危机管理提供分散，健全和高效的服务;

推断二模网络的一模投影：基于熵的方法

地址： http://arxiv.org/abs/1607.02481

作者： Fabio Saracco, Mika J. Straka, Riccardo Di Clemente, Andrea Gabrielli, Guido Caldarelli, Tiziano Squartini

摘要：双分网络目前被认为是对许多现实世界系统的组织提供了一个主要的见解，揭示了驱动在不同节点组之间发生的交互的机制。在建模二分网络时遇到的最重要的问题之一是设计一种在感兴趣的层上获得（单分裂）投影的方法，其尽可能保留编码到原始二分结构中的信息。在本文中，我们提出了一种算法，以获得统计验证的二分网络的投影，实现一个简单的规则：为了任何两个节点链接，共享邻居的数量必须具有统计显着性。自然地，评估节点相似性的统计意义需要定义适当的统计基准：这里我们考虑一组四个空模型，在指数随机图框架内定义。我们的算法输出一个链路特定的p值矩阵，从运行多重假设检验并保留只有统计显着的链接可以直接获得一个有效的投影。最后，为了测试我们的方法，我们分析经济网络（即countries-products World Trade Web表示）和社交网络（即MovieLens数据集，收集用户对电影列表的评级）。在这两种情况下，检测到非平凡的社区。在第一种情况下，当世界贸易网在国家层上投影时，揭示了类似工业化国家的模块，将其投射到产品层允许检测到特征在于越来越复杂的社区;在第二种情况下，在电影层上投影MovieLens允许将其亲和性不能由类型相似性完全解释的电影的集群个体化。

解释社交媒体上回声室的出现：意识形态和极端主义的作用

地址： http://arxiv.org/abs/1609.05003

作者： Jonathan Bright

摘要：在线讨论网络中政治驱动的分支的出现吸引了大量的文献，但是迄今为止大部分仅限于单一国家研究。因此，虽然有很好的证据表明这些网络确实划分和分割成通常被描述为“回波室”，我们很少知道可能解释这种分裂的因素或使网络或多或少分裂，因为研究限于少数政治集团，系统比较的可能性有限。本文寻求补救这种赤字，通过提供一个系统的大规模分析在Twitter上的研究，考虑在23个不同国家的90个不同政党的讨论网络。它表明，在意识形态上相隔较远的政党集团相互影响较小，位于意识形态尺度极端的个人和政党特别容易形成回声室。事实上，坐在左右分歧的不同方面的中间派党派之间的交流比中心派和极端主义分子之间的交流更有可能，中间派和极端主义分子的名义上来自同一个意识形态翼。根据结果，讨论和增强了在线暴露于不同意识形态观点的理论。

Kek，Cucks和神皇特朗普：4chan的政治上不正确的论坛的测量研究及其对网络的影响

地址： http://arxiv.org/abs/1610.03452

作者： Gabriel Emile Hine, Jeremiah Onaolapo, Emiliano De Cristofaro, Nicolas Kourtellis, Ilias Leontiadis, Riginos Samaras, Gianluca Stringhini, Jeremy Blackburn

摘要：讨论板网站4chan自成立以来就是互联网的一部分，最近的政治事件使它越来越成为焦点。特别是/ pol /，“政治上不正确”的董事会，在2016年美国大选季节的一个核心人物，因为它常常与权利运动和憎恨和种族主义的修辞联系在一起。然而，4chan仍然相对未被科学界所清醒：对于其用户群，其生成的内容，以及它如何影响Web的其他部分了解甚少。在本文中，我们通过沿着几个轴分析/ pol /使用我们在两个半月内收集的超过800万个帖子的数据集来开始解决这个缺陷。首先，我们执行一般的表征，显示/ pol /用户分布在世界各地，4chan的独特功能鼓励新鲜的讨论。我们还分析内容，例如，发现YouTube链接和仇恨言论主要在/ pol /。总体而言，我们的分析不仅提供了/ pol /的第一次测量研究，而且还提供了对社交媒体中的在线骚扰和仇恨言论趋势的洞察。

随机异步更新网格的合作策略的蔓延

地址： http://arxiv.org/abs/1610.06237

作者： Christopher Duffy, Jeannette Janssen

摘要：在图形上的囚徒困境过程$ G $是一个迭代过程，其中每个顶点，具有固定的策略（合作或缺陷），与其每个邻居玩游戏。在轮的结束处，每个顶点可以将其策略改变为具有最高收益的相邻者的策略。这里我们研究合作和自私行为在环形网格上的传播，其中每个顶点最初是一个具有概率$ p $的合作者。当允许顶点通过随机异步更新方案改变它们的策略时，我们发现对于$ p $的某些值，合作器的极限密度可以被建模为$ p $中的多项式。通过模拟确认该密度的理论界限。

动力交换中的社会温度引起的非平衡相变

地址： http://arxiv.org/abs/1702.02061

作者： Nuno Crokidakis

摘要：在这项工作中，我们研究了三状态意见模型在存在噪声的关键行为。这种噪声代表独立的行为，起到社会温度的作用。规则D维网格上的每个代理具有作为独立的概率$ q $，即，他可以独立于他的邻居的意见来选择他的意见。此外，利用互补概率$ 1-q $，代理通过动力学交换与随机选择的最近邻相交互。我们的数值结果表明模型在取决于晶格维数的关键点$ q_ {c} $处经历非平衡相变。这些转变是有序 - 无序类型，呈现Ising模型的相同关键指数。结果还表明，对于Ising模型，模型的上临界尺寸为$ D_ {c} = 4 $。从社会角度来看，随着社会关系数量的增加，人们更容易观察到多数人的意见。

什么时候网络是网络？在路径和时间网络中的多阶图模型选择

地址： http://arxiv.org/abs/1702.05499

作者： Ingo Scholtes

摘要：我们介绍一个框架，用于在网络中观察到的不同长度的顺序数据捕获路径的建模。这样的数据是重要的，例如当研究信息网络中的点击流，交通系统中的旅行模式，社交网络中的信息级联，生物学途径或时间戳的社交互动时。虽然对这样的数据应用图分析和网络分析是常见的，但是近来的工作已经表明时间相关性可以使这种方法的结果无效。这提出了一个根本的问题：什么时候是顺序数据的网络抽象？针对这个开放的问题，我们提出一个框架，将多个更高阶的马尔科夫链组合成多层图形模型，同时捕获多个长度尺度的通路的时间相关性。我们开发模型选择技术来推断这种模型的最优层数，并表明它优于以前使用的马尔可夫阶检测技术。对路径和时间网络上的八个真实世界数据集的应用显示它允许推断图形模型，其捕获这些数据的拓扑和时间特征。我们的工作突出了网络抽象的谬误，并为公开问题提供了原则性的答案。将网络表示概括到多阶图形模型，它为新的数据挖掘和知识发现算法打开了观点。

复杂网络中的最大熵采样

地址： http://arxiv.org/abs/1703.03858

作者： Filippo Radicchi, Claudio Castellano

摘要：许多现实世界系统的特征在于随机动力学规则，其中各个元素之间的依赖的复杂网络概率地确定它们的状态。即使完全知道网络结构和动态过程的随机规则，预测系统配置的能力通常具有较大的不确定性。对节点的一部分进行采样并确定性地观察它们的状态可以有助于减少不可观察节点的不确定性。然而，选择这些观察点的目的是最大化预测能力是一个非常重要的任务，取决于随机过程的性质和基础网络的结构。在这里，我们介绍一种计算高效的算法，以确定准最优解的任意随机过程定义在通用稀疏拓扑。我们显示该方法是有效的不同基板上的各种过程。我们进一步展示了如何有效地使用该方法来识别在半监督概率分类算法中标记的最佳节点。

拮抗作用还通过转发流动：中外语言行为对观点的影响极化分析

地址： http://arxiv.org/abs/1703.03895

作者： Pedro Calais Guerra, Roberto C.S.N.P. Souza, Renato M. Assunção, Wagner Meira Jr

摘要：在本文中，我们研究常见假设的影响，大多数社交媒体研究对信息共享（例如转发）的性质作为主要积极的互动。通过分析两个大型纵向巴西Twitter数据集，包含两个极化主题 - 政治和体育 - 的5年的对话 - 我们经验表明，持有对立观点的团体实际上可以互相转发互相比他们转发其他团体更频繁。我们表明假设转推作为背书互动可以导致关于社会群体之间的对抗水平的误导性结论，并且这种明显的矛盾部分解释部分使用转发来引用原始内容创作者从信息的原始时间语境，幽默和批评的目的。因此，散布在在线媒体上的消息可能随着时间的推移而极性反转，这对社会和计算机科学家构成挑战，旨在对在线媒体上的观点群体进行分类和跟踪。另一方面，我们发现，用户在最初发布后转发消息的时间可以是在社交平台中推断对抗的有用信号，并且上下文外转发的浪涌与由触发的情绪漂移相关联现实世界的事件。我们还讨论如何将这样的证据嵌入情感分析模型。

在线搜索中搜寻模式

地址： http://arxiv.org/abs/1703.03901

作者： Xiangwen Wang, Michel Pleimling

摘要：现在，在线搜索无疑是最常见的信息收集形式，如通过搜索引擎每天产生的数十亿次点击所见证的。在这项工作中，我们将在线搜索描述为在半无限线上发生的觅食过程。使用各种量，如步长和等待时间的概率分布和互补累积分布函数以及均方位移和熵，我们分析三个不同的点击日志，其包含提交给搜索引擎的数百万个查询的详细信息。不同日志之间的显着差异显示出搜索引擎的效率提高。在觅食的语言中，较新的日志指示在线搜索绝大多数产生本地搜索（即，在搜索引擎提供的链接的一个页面上），而对于较旧的日志，搜索进程是本地搜索和重定位阶段的组合，幂律分布。因此，我们对搜索引擎的点击日志的调查突出显示在线搜索中间歇性搜索过程的存在（其中局部探索的阶段由权力法分布的重定位跳跃分离）。因此，良好的搜索引擎使得用户能够通过对具有搜索结果的单个页面的本地探索来找到他们正在寻找的信息，而对于差的搜索引擎，用户经常被迫对不同的页面进行更广泛的探索。

从网络招聘：发现Twitter用户，可以帮助打击寨卡流行病

地址： http://arxiv.org/abs/1703.03928

作者： Paolo Missier, Callum McClean, Jonathan Carlton, Diego Cedrim, Leonardo Silva, Alessandro Garcia, Alexandre Plastino, Alexander Romanovsky

摘要：近年来，像\ textit {Chikungunya}和\ textit {Zika}这样的热带疾病已成为引起严重，持久，全人类健康问题的原因。在像巴西这样的大国，卫生当局牵头的传统疾病预防方案并没有特别有效。我们探索的假设是，监控和分析社交媒体内容流可以有效补充这些努力。具体来说，我们的目标是找出那些可能对在当地社区组织的病毒战斗行动敏感的公众的选定成员。关注Twitter和Zika的主题，我们的方法涉及（i）训练分类器，从Twitter馈送中选择与主题相关的推文，以及（ii）发现主动发布关于该主题的相关内容的热门用户。然后，我们可以推荐这些用户作为他们社区内直接参与的主要候选人。在这篇短文中，我们描述我们的分析方法和原型架构，讨论处理噪声和稀疏信号的挑战，并提出令人鼓舞的初步结果。

间接互惠的标准剔除方法揭示不可缺少的规范

地址： http://arxiv.org/abs/1703.03943

作者： Hitoshi Yamamoto, Isamu Okada, Satoshi Uchida, Tatsuya Sasaki

摘要：尽管已经提出了对于基于互惠的合作的各种规范，其对于来自自由行为者的入侵是进化稳定的，但是在合作的演变中，交替规范的过程和多样化规范的作用仍然不清楚。我们阐明了间接互惠规范和合作的共同进化动力，并确定了合作演变的不可或缺的规范。受基因敲除方法启发，基因工程技术，我们开发了常规敲除方法，澄清了建立合作所必需的规范。数字调查的结果表明，大多数规范逐渐转变为容忍规范，叛逃者被严格的规范消除。此外，当违反不法行为的具体规范被淘汰时，没有合作出现。

语言使用问题：对问题文本的语言结构的分析可以表征Quora中的可接受性

地址： http://arxiv.org/abs/1703.04001

作者： Suman Kalyan Maity, Aman Kharb, Animesh Mukherjee

摘要： Quora是最近最流行的社区问答网站之一。然而，这个问答网站上的许多问题的帖子经常得不到回答。在本文中，我们量化各种语言活动，歧视一个回答的问题和一个未回答的问题。我们的中心发现是，用户在写问题文本时使用语言的方式可以是一种表征可回答性的非常有效的方法。这种表征帮助我们早期预测在特定时间段t内未答复的问题将最终得到回答，并达到76.26％（t = 1个月）和68.33％（t = 3个月）的准确度。值得注意的是，表示用户的语言使用模式的特征是最有辨别力的，并且单独考虑74.18％的准确度。我们还将我们的方法与一些类似的作品（Dror等人，Yang等人）进行比较，在精度方面实现了〜39％的最大改进。

重复激活在社会网络中的传导效应

地址： http://arxiv.org/abs/1703.04017

作者： Pablo Piedrahita, Javier Borge-Holthoefer, Yamir Moreno, Sandra González-Bailón

摘要：示威，抗议，骚乱和公共舆论的转变响应了通信网络的协调潜力。数字技术已经将人际网络变成了大量的，普遍的结构，它们随着信息不断地波动。在这里，我们提出一个模型，旨在分析传播的动态，出现在网络中，当重复激活是允许的，也就是说，当演员可以反复参与集体努力。我们分析了通信网络的结构如何影响协调行动者的能力，我们确定更有可能出现大规模协调的条件。

双边国际贸易网的大规模验证

地址： http://arxiv.org/abs/1703.04090

作者： Mika J. Straka, Guido Caldarelli, Fabio Saracco

摘要：在全球竞争格局中制定经济发展战略需要对各国技术进步和出口产品之间的相似性有一个坚实和不偏不倚的理解。这两者都可以通过国际贸易网络的双边代表来解决。在本文中，我们应用最近提出的大规范投影算法来揭示国家和产品社区。与过去的努力相反，我们的方法基于信息理论，以无偏见和分析的方式创建单向投影。国家或产品之间的单个链接表示统计上有意义的信号，其不被诸如双配置模型的零模型考虑。我们发现稳定的乡村社区反映了发达国家，新兴工业化国家和发展中国家的社会经济差别。此外，产品网络基于上述国家组表现出分组成簇。

QT2S：通过微动接地监测道路交通的系统

地址： http://arxiv.org/abs/1703.04280

作者： Noora Al Emadi, Sofiane Abbar, Javier Borge-Holthoefer, Francisco Guzman, Fabrizio Sebastiani

摘要：社交媒体平台提供对用户生成内容的连续访问，使得能够实时监视用户行为和事件。这种用户行为和事件的地理维度最近在几个领域引起了很多关注：移动性，人道主义或基础设施。虽然解析用户的位置可以是直接的，这取决于他们的设备和/或他们正在使用的应用的可用性，在大多数情况下，定位用户需要更大的努力，例如利用文本特征。例如，在Twitter上，只有2％的tweets是地理参考的。在本文中，我们提出了一种用于放大接地（低于城市级别）的短消息（例如，tweet）的系统。该系统结合了不同的自然语言处理和机器学习技术，以增加地理接地的推文的数量，这对于诸如灾害响应和实时流量监视等许多应用是至关重要的。

在大型网络中实现高效节点发现性优化

地址： http://arxiv.org/abs/1703.04307

作者： Junzhou Zhao, John C.S. Lui, Pinghui Wang, Xiaohong Guan

摘要：许多人梦想着名，YouTube视频制作者也希望他们的视频有大量的观众，产品零售商总是希望尽可能多地向客户展示他们的产品。这些看似不同的现象有共同的结构吗？我们发现名声，流行度或曝光度可以被建模为一个节点在一些正确定义的网络中的可发现性，并且所有之前提到的现象可以被描述为目标节点希望被网络中的现有节点容易地发现。在这项工作中，我们明确定义网络中的节点可发现性，并制定一般节点发现性优化问题。虽然优化问题是NP-hard，我们发现定义的可发现性度量分别满足子模型和超模，使我们能够使用贪心算法找到可靠的近最优解。贪婪算法的计算复杂度由oracle调用的时间成本支配，即计算给定节点的边际增益。为了在大型网络上扩展oracle调用，我们提出了一种估计和细化方法，其在估计精度和计算效率之间提供良好的权衡。在真实图上进行的实验证明，我们的方法比使用动态规划的精确方法快好几百倍，从而允许我们解决大型网络上的优化问题。

金融时间序列的拓扑数据分析：崩溃的风景

地址： http://arxiv.org/abs/1703.04385

作者： Marian Gidea, Yuri Katz

摘要：我们探讨了在2000年技术崩溃和2007-2009年金融危机期间四大美国股市指数的日收益的演变。我们的方法是基于拓扑数据分析（TDA）。我们使用持久性同源性来检测和量化出现在多维时间序列中的拓扑模式。使用滑动窗口，我们提取时间依赖的点云数据集，我们关联的拓扑空间。我们检测出现在这个空间的瞬态回路，我们测量它们的持久性。这被编码在被称为“持久性景观”的实值函数中。我们通过$ L ^ p $ -norms量化持久性景观的时间变化。我们测试这个程序对多维非线性和非平衡模型产生的多维时间序列。我们发现，在金融崩溃附近，$ L ^ p $ -norms在主峰之前呈现强劲增长，在崩溃期间上升。值得注意的是，在持续性风景的时间序列的时间序列的低频率下的平均频谱密度在250个交易日之前表现出强劲的上升趋势，在2000年10月3日的网络通信崩溃之前或在雷曼破产于2008年9月15日。我们的研究表明，TDA提供了一种新型的计量经济学分析，超越了标准的统计测量。该方法可用于检测即将发生的市场崩溃的早期警告信号。我们认为，这种方法可以用于超出这里介绍的财务时间序列的分析。

社会指纹：通过DNA启发的行为模型检测spambot组

地址： http://arxiv.org/abs/1703.04482

作者： Stefano Cresci, Roberto Di Pietro, Marinella Petrocchi, Angelo Spognardi, Maurizio Tesconi

摘要：在线社交网络中的Spambot检测是一个长期的挑战，涉及研究和设计能够有效识别不断变化的垃圾邮件发送者的检测技术。最近，出现了一个新的社会垃圾邮件浪潮，具有先进的人类特征，即使通过当前最先进的算法，它们也不会被检测到。在本文中，我们表明高效的spambots检测可以通过深入分析他们的集体行为利用数字DNA技术建模的社交网络用户的行为实现。受其生物对应物启发，在数字DNA表示中，数字账户的行为寿命被编码在字符序列中。然后，我们定义这种数字DNA序列的相似性度量。我们建立在数字DNA和用户组之间的相似性，以表征真实帐户和灌水。利用这种特征，我们设计了社会指纹技术，其能够在监督和无监督的方式中区分垃圾邮件和真实帐户。我们最终评估社会指纹的有效性，并将其与三个最先进的检测算法进行比较。在我们的方法的特点是使用现成的DNA分析技术研究在线用户行为和有效地依赖有限数量的轻量级帐户特性的可能性。

为自治和实时城市危机管理提供分散，健全和高效的服务

地址： http://arxiv.org/abs/1703.04519

作者： Frédéric Le Mouël (CITI), Carlos Barrios Hernández (UIS), Oscar Carrillo (CITI), Gabriel Pedraza (UIS)

摘要：贸易全球化和工作安排目前正在引起向城市的大规模迁移。城市的这种增长需要新的城市规划，其中数字工具采取主要的地方来捕获数据，并且面对变化来理解和决定。这些工具几乎不能抵御自然灾害，恐怖主义，事故等。根据INSA里昂CITI实验室和桑坦德工业大学SC3的专业知识，我们建议实时创建ALERT项目 - 自主式应急服务 - 具有分散，可靠和高效的服务，与公民密切接触，以相关方式在当地作出决定，而不存在与中央主管机构断开的风险。这些信息收集和决策将涉及人口参与和社会方法。

声明：Arxiv文章摘要版权归论文原作者所有，由本人进行翻译整理，未经同意请勿随意转载。本系列在个人博客网络科学研究速递进行同步更新，并提供RSS订阅。