Arxiv网络科学论文摘要12篇(2018-02-28)

  • 使用服务器日志改进网站超链接结构;
  • 基于iMacros的数据爬虫的设计与实现,用于Facebook用户的行为分析;
  • 绘制在线政治互动的调用结构;
  • MILE:可扩展图嵌入的多级框架;
  • 多尺度平面图生成;
  • 使用复杂网络中的边界节点的社区检测;
  • 留守或离开:初期城市移民的流失预测;
  • 复杂网络增长的优先连接机制:“富者更富”还是“适者更富”?;
  • DebateNight:美国总统第一次辩论期间社交机器人在Twitter上的角色和影响;
  • 度量保持有向图对称化;
  • 互动网络中的多重结构转换;
  • P2P借贷网络中的私人信息,信用风险与图结构;

使用服务器日志改进网站超链接结构

原文标题: Improving Website Hyperlink Structure Using Server Logs

地址: http://arxiv.org/abs/1512.07258

作者: Ashwin Paranjape, Robert West, Leila Zia, Jure Leskovec

摘要: 好的网站应该很容易通过超链接导航,但保持高质量的链接结构很困难。识别应该链接的页面对对于人类编辑来说可能是困难的,特别是如果网站很大并且经常变化。此外,给定一组有用的链接候选者,将它们合并到网站中的任务可能是昂贵的,因为它通常涉及人类编辑页面。鉴于这些挑战,需要开发数据驱动的方法来自动执行链接放置任务。在这里,我们开发了一种自动查找有用的超链接添加到网站的方法。我们展示被动收集的服务器日志,除了告诉我们哪些现有链接是有用的,还包含隐含信号,指示哪些不存在的链接如果要被引入将是有用的。我们利用这些信号来模拟尚未存在的链接的未来用途。基于我们的模型,我们定义了预算约束下的链接布局问题,并提出了解决它的有效算法。我们通过对维基百科进行评估来证明我们的方法的有效性,该维基百科是一个我们可以访问这两个服务器日志(用于查找有用的新链接)和完整修订历史(包含新链接的基本事实)的大型网站。由于我们的方法完全基于标准服务器日志,因此我们可能也会将其应用于任何其他网站,正如我们以生物医学研究网站Simtk为例展示的。

基于iMacros的数据爬虫的设计与实现,用于Facebook用户的行为分析

原文标题: Design and Implementation of iMacros-based Data Crawler for Behavioral Analysis of Facebook Users

地址: http://arxiv.org/abs/1802.09566

作者: Mudasir Ahmad Wani, Nancy Agarwal, Suraiya Jabin, Syed Zeeshan Hussai

摘要: 在分析在线社会网络(OSN)网站时,获取期望的数据集仍然是研究人员面临的主要挑战。由OSN服务提供商提供的用于检索数据的应用程序编程接口(API)施加了几个不可避免的限制,这使得难以获得期望的数据集。在本文中,我们提出所谓IMcrawler一个基于技术的iMacros数据履带,能够收集的每一条信息是通过由Facebook.The重新批准的法律框架内,Facebook网站浏览器访问提出的履带地址最挑战的结盟使用Web数据提取方法以及OSN服务提供商提供的大部分API。已从Facebook用户配置文件中提取了两大部分,即个人信息和墙上活动。将收集的数据预处理成两个数据集,并对每个数据集进行统计分析,以绘制语义知识并理解Facebook用户的多个行为方面,诸如用户主要披露的信息种类,显示信息模式中的性别差异,高度在网络上张贴的内容,在网络上高度执行的活动,个人和帖子属性之间的关系等。据我们所知,目前的工作是提供爬虫设计和基于性别的信息的详细描述的第一次尝试揭示Facebook用户的行为。

绘制在线政治互动的调用结构

原文标题: Mapping the Invocation Structure of Online Political Interaction

地址: http://arxiv.org/abs/1802.09597

作者: Manish Raghavan, Ashton Anderson, Jon Kleinberg

摘要: 政治信息,话语和互动的激增是社交媒体在过去几年中最重要的发展之一。思想谱上不同观点之间的互动关系结构丰富。然而,我们仍然只有有限的分析词汇来表达这些观点互动的方式。在本文中,我们开发基于网络的方法,以用户共享内容的方式进行操作;我们在Web域上构建\ emph {调用图},显示用户调用一个域中的页面以回复包含来自其他域的页面的帖子的范围。当我们根据数据导致的政治谱定位域时,我们获得了一个嵌入图,显示这些交互链路如何跨越谱上的不同距离。这一嵌入式网络的结构及其随着时间的演变,有助于我们获得关于2016年之前政治互动如何展开的宏观层面的见解,并引导到美国总统大选。特别是,我们发现,在接近选举的几个月中,答复中援用的领域跨越了谱距离的增加,并且在左向右和从右向左的联系模式之间存在明显的不对称。

MILE:可伸缩图嵌入的多级框架

原文标题: MILE: A Multi-Level Framework for Scalable Graph Embedding

地址: http://arxiv.org/abs/1802.09612

作者: Jiongqian Liang, Saket Gurukar, Srinivasan Parthasarathy

摘要: 最近,人们对图嵌入方法的设计感兴趣。由于计算复杂性和内存需求,很少有可能扩展到具有数百万节点的大型图。在本文中,我们通过引入MultI级嵌入(MILE)框架来放宽这个限制 - 一种允许当代图嵌入方法扩展为大图的通用方法。 MILE使用混合匹配技术将图重复粗化为较小的图,以保持图的骨架结构。然后它将现有的嵌入方法应用到最粗糙的图上,并通过它学习的新型图卷积神经网络将嵌入改进为原始图。所提出的MILE框架对于底层图嵌入技术是不可知的,并且可以将其应用于许多现有的图嵌入方法而不用修改它们。我们在几种流行的图嵌入技术中使用我们的框架,并为真实世界的图进行嵌入。五个大规模数据集上的实验结果表明,MILE显著提高了图嵌入的速度(数量级),同时还经常为节点分类任务生成质量更好的嵌入。 MILE可以舒适地扩展到具有900万个节点和4000万个边的图,现有方法在现有工作站上耗尽内存或花费太长时间计算。

多尺度平面图生成

原文标题: Multiscale Planar Graph Generation

地址: http://arxiv.org/abs/1802.09617

作者: Varsha Chauhan, Alexander Gutfraind, Ilya Safro

摘要: 对物理,生物和社会现象的网络表征的研究可以帮助我们更好地理解其网络的结构和功能动态,并制定这些现象的预测模型。然而,由于网络数据收集所需的成本和工作量以及这些数据对盗窃和滥用的敏感性等因素导致真实世界的网络数据稀缺,工程师和研究人员往往依靠合成数据进行模拟,假设检验,决策制定和算法工程。基础设施网络如道路,配水系统和其他公用事业系统的一个重要特征是它们可以嵌入到飞机中,因此为了模拟这些系统,我们需要平面的实际网络。虽然目前可用的合成网络生成器可以对展现真实性的网络建模,但它们不能保证或实现平面性。因此,在本文中,我们提出了一种可以合成平面实际网络的灵活算法。该方法遵循多尺度随机编辑方法,该方法生成给定平面图的粗化网络的分层结构并引入分层结构中的各种级别的编辑。该方法保留了包括网络平面性在内的最小偏差的结构特性,同时在多尺度上引入了实际的变化性。

使用复杂网络中的边界节点的社区检测

原文标题: Community detection using boundary nodes in complex networks

地址: http://arxiv.org/abs/1802.09618

作者: Mursel Tasgin, Haluk O. Bingol

摘要: 我们提出了一种新的本地社区检测算法,该算法通过使用边界节点来识别它们之间的边界来找到社区。我们将标签传播的修改版本应用于社区检测,该版本使用公共邻居的数量来决定每个节点的社区标签。我们的算法速度快,能够准确找到社区。它优于其他算法,特别是当社区结构微妙时。可以在并行系统中扩展算法。

留守或离开:初期城市移民的流失预测

原文标题: To Stay or to Leave: Churn Prediction for Urban Migrants in the Initial Period

地址: http://arxiv.org/abs/1802.09734

作者: Yang Yang, Zongtao Liu, Chenhao Tan, Fei Wu, Yueting Zhuang, Yafeng Li

摘要: 在中国,2.6亿人迁移到城市实现城市梦想。尽管这些移民在迅速的城市化进程中发挥着重要作用,但他们中的许多人未能定居下来并最终离开这座城市。因此,移民的融入过程对学者和决策者来说是一个重要问题。在本文中,我们以上海为例,调查了移民在第一周的行为,特别是他们的行为与提前离开的关系。我们的数据集包括5400万用户的698个电信日志的一个月完整数据集,以及上海18K房地产的新颖和公开的住房价格数据。我们发现,最终离开的移民往往在开始的几周内不会发展多元化的关系,也不会在城市周围走动。他们的活跃区域的住房价格也比滞留的移民高。我们制定了流失预测问题,以确定移民是否会在头几天内根据自己的行为而离开。随着我们收集更多天的数据,预测性能会有所提高。有趣的是,当使用相同的特征时,从最初几天开始训练的分类器已经和使用完整数据训练的分类器一样好,这表明性能差异主要在于特征之间的差异。

复杂网络增长的优先连接机制:“富者更富”还是“适者更富”?

原文标题: Preferential attachment mechanism of complex network growth: "rich-gets-richer" or "fit-gets-richer"?

地址: http://arxiv.org/abs/1802.09786

作者: Michael Golosovsky

摘要: 我们分析了复杂网络的增长模型,包括优先附着(A.-L.Barabasi和R.Albert,Science 286,509(1999))和适应性模型(Caldarelli等,Phys.Rev.Lett.89,258702( 2002)),并且证明了在非常一般的条件下,这两个模型产生了相同的网络增长动力学方程,其中$(t)(K + K_ {0})$ A(t)$是老化常数,$ K $是节点的度数,$ K_ {0} $是初始吸引力。基于这个结果,我们证明了适应度模型为优先依恋机制提供了基础微观基础。这种方法对初始吸引力产生了长期寻求的解释,这是一个难以捉摸的参数,在优惠依恋模型的框架内没有得到解释。我们证明$ K_ {0} $主要由适应度分布的宽度决定。许多复杂网络中$ K_ {0} $的度量通常会得到相同的$ K_ {0} \ sim 1 $。这种经验普遍性可以追溯到宽度为$ \ sigma \ approx 1 $的频繁出现的对数正态分布。

#DebateNight:美国总统第一次辩论期间社交机器人在Twitter上的角色和影响

原文标题: #DebateNight: The Role and Influence of Socialbots on Twitter During the 1st U.S. Presidential Debate

地址: http://arxiv.org/abs/1802.09808

作者: Marian-Andrei Rizoiu, Timothy Graham, Rui Zhang, Yifei Zhang, Robert Ackland, Lexing Xie

摘要: 人们对“社交机器人”在操纵民意和影响选举结果方面的作用提出了严重关切,通过转发党派内容来扩大其影响力。在这里,我们通过确定Twitter如何促成转推扩散来分析社交圈在Twitter上的作用和影响力。我们在2016年第一次美国总统大选辩论(#DebateNight)期间收集了大量推文数据集,我们从三个角度分析了150万用户:用户影响力,政治行为(党派和敬业度)和僵化程度。首先,我们根据用户对信息扩散的积极贡献(即他们的推文和转发)来定义用户影响力度量。鉴于Twitter不公开转发结构 - 它将所有转发与原始的tweet相关联 - 我们仅使用tweet时间和用户功能对潜在扩散结构进行建模,并且实施可扩展的新颖方法来估计对所有可能展开的影响。接下来,我们使用党派分类标签分析来量化用户的政治分化和参与度。最后,我们使用BotOrNot API来测量用户自身的可能性(作为机器人的可能性)。我们建立了一个二维的“极化图”,可以对僵化,党派和影响力之间的相互作用进行细致分析。我们发现,不仅社交机器人在Twitter上更加活跃 - 开始更多转发级联和转发更多 - 但它们比人类更具影响力2.5倍,而且更多地参与政治活动。而且,亲共和党的机器人比亲民主党的机器人更具影响力,更具政治色彩。不过,我们警告不要一blank不振的陈述,即设计出现人类的软件主宰政治辩论。我们发现许多极具影响力的推特用户实际上是亲民主党人,而且大多数亲共和党用户都具有中等影响力并且可能是人类(低僵化)。

度量保持有向图对称化

原文标题: Metric preserving directed graph symmetrization

地址: http://arxiv.org/abs/1802.09829

作者: Katherine Fitch

摘要: 这项工作提出了一种有向图对称化的新方法,它构造了一个具有等价成对有效电阻的无向图作为给定的有向图。因此,在有向图与其对称版本之间保留了一个图度量,即有效电阻的平方根。结果表明,由于有效电阻与拉普拉斯谱之间的关系,该度量的保留允许解释有向图上下文中对称图的代数和谱特性。此外,李亚普诺夫理论用于证明有向图的拉普拉斯矩阵可以分解为投影矩阵,斜对称矩阵和对称图的拉普拉斯矩阵的乘积。在有向图的谱图划分和Kron约化的背景下讨论了有效阻力保持图对称化的应用。

互动网络中的多重结构转换

原文标题: Multiple structural transitions in interacting networks

地址: http://arxiv.org/abs/1802.09897

作者: Giacomo Rapisardi, Alex Arenas, Guido Caldarelli, Giulio Cimini

摘要: 许多真实世界的系统可以建模为互连的多层网络,即一组网络彼此交互。在这里,我们提出了一种微扰方法来研究互联网络的一般类别的性质,因为建立了网络间的相互作用。我们揭示了这些系统的代数连通性的多重结构转换,其中每个网络层保持其独立身份或驱动整个系统的扩散过程,从而推广了以前的结果,报告了单个转换点。此外,我们证明,在扰动理论的第一阶中,每层的代数连通性的增长仅取决于交互网络的程度配置(投影在相应的Fiedler向量上),而不取决于实际的交互拓扑。我们的研究结果可以在强大的互联网络系统的设计中产生重要影响,特别是在网络层面的情况下,其完整性对于整个系统的运行更为重要。最后,我们将微扰理论的结果应用于互连网络的邻接矩阵,这对于表征这类系统中的渗流过程很有用。

P2P借贷网络中的私人信息,信用风险与图结构

原文标题: Private Information, Credit Risk and Graph Structure in P2P Lending Networks

地址: http://arxiv.org/abs/1802.10000

作者: J. Christopher Westland, Tuan Q. Phan, Tianhui Tan

摘要: 该研究调查了通过使用关于借款人的通信和旅行的“私人信息”来改进P2P(对等)信用评分的潜力。我们发现,P2P借款者的自我网络展现出无标度行为,这种行为是由潜在的优惠依附机制驱动的,这些机制以可用于预测贷款盈利能力的方式连接借款人。这些私人网络从移动电话GPS到移动电话通信网络和地理位置的投影可能会使贷款提供商通过我们用来预测贷款盈利能力的图表和位置指标访问私人信息。图拓扑被认为是贷款盈利能力的重要预测因素,解释了超过5.5%的可变性。借款人位置信息网络解释了盈利额外的19%。将机器学习算法应用于之前分析的数据集以开发预测模型,并导致均方误差降低4%。

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。

你可能感兴趣的:(Arxiv网络科学论文摘要12篇(2018-02-28))