- 衡量,理解和分类新闻媒体在危机事件后对Twitter的同情;
- 无模型从非线性集体动力学推理直接网络相互作用;
- 加密货币市场动态的实证研究;
- 网络表示学习综述;
- 时间很重要:社交媒体流行的多尺度时间化;
- NDlib:用于模拟和分析复杂网络上的扩散过程的Python库;
- 谱图嵌入:非回溯视角与图逼近;
- 活跃社区检测:最大似然法;
- 创新信息通讯技术引文分析与治理进展(2008-2017);
- 基于分布式动态图的高效检测重叠社区;
- 在线错误信息网络解剖;
- 找出风电场功率波动的结构;
- 社会网络中的话题生命周期:分析语义连续性和社会共同体的影响;
衡量,理解和分类新闻媒体在危机事件后对Twitter的同情
原文标题: Measuring, Understanding, and Classifying News Media Sympathy on Twitter after Crisis Events
地址: http://arxiv.org/abs/1801.05802
作者: Abdallah El Ali, Tim C Stratmann, Souneil Park, Johannes Schöning, Wilko Heuten, Susanne CJ Boll
摘要: 本文调查了2015年11月贝鲁特和巴黎恐怖袭击事件之后Twitter上西方和阿拉伯媒体的报道偏差。使用包含每次攻击的两个Twitter数据集,我们调查西方媒体和阿拉伯媒体在报道偏差,同情偏见和信息传播方面的差异。我们用四种语言(英语,阿拉伯语,法语,德语)为2,390条推文发布了众多同情和情感标签,建立了一个回归模型来表征同情,然后训练了一个深度卷积神经网络来预测同情。主要调查结果显示:(a)这两个事件都不成比例地被覆盖(b)西方媒体表现出较少的同情,其中每个媒体的报道都更加同情他们各自地区受影响的国家(c)同情预测支持地面真相分析,西方媒体较少同情比阿拉伯媒体(d)同情的鸣叫不再传播。我们根据全球新闻流量,Twitter可供性和公众感知影响来讨论我们的结果。
无模型从非线性集体动力学推理直接网络相互作用
原文标题: Model-free inference of direct network interactions from nonlinear collective dynamics
地址: http://arxiv.org/abs/1801.05803
作者: Jose Casadiego, Mor Nitzan, Sarah Hallerberg, Marc Timme
摘要: 网络动力系统中的交互拓扑从根本上决定了它们的功能。加速技术进步创造了有关物理,生物和技术系统中集体非线性动力学的大量数据。从这些动态检测直接交互模式仍然是一个重大的开放性问题。特别是,目前的非线性动力学方法大多需要先验地知道(经常是高维的)系统动力学模型。在这里,我们开发了一个模型独立的框架来推断直接相互作用,仅仅记录所产生的非线性集体动力。引入明确的依赖矩阵与块正交回归算法相结合,该方法在许多动态机制中可靠地工作,包括向稳态的瞬态动力学,周期性和非周期性动力学以及混沌。结合其揭示网络(两点)以及超网络(例如三点)相互作用的能力,该框架因此可以打开非系统动力学选项,推断跨系统的直接交互模式,其中没有模型是已知的。
加密货币市场动态的实证研究
原文标题: An Experimental Study of Cryptocurrency Market Dynamics
地址: http://arxiv.org/abs/1801.05831
作者: Peter M Krafft, Nicolás Della Penna, Alex Pentland
摘要: 随着加密货币的普及和可信度的提高,加密货币的市场地位越来越重要。了解这些市场的动态可以帮助评估cryptocurrnency生态系统的可行性,以及设计选择如何影响市场行为。加密货币存在的一个存在威胁是交易者买卖意愿的剧烈波动。我们利用一种新颖的实验方法,进行了在线实验,研究这些市场中易受到交易者的交易行为影响。我们创造了在六个月的时间内执行超过十万笔交易,在217个加密货币中,每笔交易成本低于一美分。我们发现,个人“买入”行为导致随后的买方活动短期增长数百倍于我们干预的规模。从设计的角度来看,我们注意到我们研究的交易所的设计选择可能促进了这种和其他同行的影响效应,这突出了HCI在数字机构设计中的潜在社会和经济影响。
网络表示学习综述
原文标题: Network Representation Learning: A Survey
地址: http://arxiv.org/abs/1801.05852
作者: Daokun Zhang, Jie Yin, Xingquan Zhu, Chengqi Zhang
摘要: 随着信息技术的广泛使用,信息网络越来越流行,以捕捉跨社会网络,引文网络,电信网络和生物网络等各种学科的复杂关系。分析这些网络揭示了社会生活的不同方面,如社会结构,信息传播和不同的交流方式。然而,大规模的信息网络往往使网络分析任务计算成本昂贵和棘手。最近,网络表示学习被提出作为一种新的学习范式,通过保留网络拓扑结构,顶点内容和其他边信息,将网络顶点嵌入低维向量空间。这有助于在新的向量空间中容易地处理原始网络以供进一步分析。在这次调查中,我们对目前关于数据挖掘和机器学习领域的网络表示学习的文献进行了全面的回顾。我们提出了一种新的分类方法来分析和总结最先进的网络表示学习技术,根据他们使用的方法和他们保存的网络信息。最后,为了便于研究这个话题,我们总结了基准数据集和评估方法,并讨论了这个领域的未来研究方向。
时间很重要:社交媒体流行的多尺度时间化
原文标题: Time Matters: Multi-scale Temporalization of Social Media Popularity
地址: http://arxiv.org/abs/1801.05853
作者: Bo Wu, Wen-Huang Cheng, Yongdong Zhang, Tao Mei
摘要: 社交媒体流行的演变呈现出丰富的时间性,即流行度随着时间在各个时间粒度级上变化。这受到公众关注或用户活动的时间变化的影响。例如,观察Flickr上街头流行的流行模式,可以在特定的时间尺度上描绘独特的时尚风格,例如风衣的季节性周期性波动或晚礼服的一天高峰。然而,这一事实往往被现有的流行模型研究所忽视。我们提出了第一个研究纳入多个时间尺度的动态预测在线流行。本文提出了一种新的计算框架,称为多尺度时间化,用于通过联合低秩约束在用户,岗位和时间的张量空间中基于多尺度分解和结构重构来估计流行度。通过考虑上下文不一致造成的噪声,我们设计了一个基于上下文聚合的数据重排步骤作为预处理,以增强张量空间中相邻数据的上下文相关性。因此,我们的方法可以利用多层次的时间特征,并减少数据分解的噪音,从而提高建模效率。我们评估我们的方法在两个大型的Flickr图像数据集,总共有超过180万张照片,用于流行预测的任务。结果表明,我们的方法显著优于最先进的流行预测技术,在预测精度方面相对提高了10.9%-47.5%。
NDlib:用于模拟和分析复杂网络上的扩散过程的Python库
原文标题: NDlib: a Python Library to Model and Analyze Diffusion Processes Over Complex Networks
地址: http://arxiv.org/abs/1801.05854
作者: Giulio Rossetti, Letizia Milli, Salvatore Rinzivillo, Alina Sirbu, Fosca Giannotti, Dino Pedreschi
摘要: 如今对网络动态的分析成为社会网络分析的一个热门话题。为了支持这项工作中的学生,教师,开发人员和研究人员,我们引入了一个新颖的框架,即NDlib,一个用来描述扩散模拟的环境。 NDlib被设计成一个多层次的生态系统,可以被不同的用户群使用。出于这个原因,在NDlib上,我们设计了一个允许远程执行实验的模拟服务器,以及一个在线可视化工具,它抽象出其编程接口,并将模拟平台提供给非技术人员。
谱图嵌入:非回溯视角与图逼近
原文标题: On Spectral Graph Embedding: A Non-Backtracking Perspective and Graph Approximation
地址: http://arxiv.org/abs/1801.05855
作者: Fei Jiang, Lifang He, Yi Zheng, Enqiang Zhu, Jin Xu, Philip S. Yu
摘要: 已经证明图嵌入在促进图分析方面是高效和有效的。在本文中,我们提出了一种名为NON-Backtracking Embedding(NOBE)的新型谱框架,它提供了一种新的视角,通过跟踪禁止回溯的边上的流动遍历来深层次地组织图数据。进一步,通过分析非回溯过程,设计了一种称为图近似的技术,该技术提供了将边到边矩阵上的谱分解转换成节点到节点矩阵上的谱的分解的通道。理论保证是通过限制原始图的相应特征值与其图近似之间的差值来提供的。在各种现实世界网络上进行的大量实验证明了我们的方法在宏观和微观两个层面上的有效性,包括聚类和结构孔扳手检测。
活跃社区检测:最大似然法
原文标题: Active Community Detection: A Maximum Likelihood Approach
地址: http://arxiv.org/abs/1801.05856
作者: Benjamin Mirabelli, Dan Kushnir
摘要: 我们针对网络上的社区检测问题提出了新的半监督和主动学习算法。这些算法是基于给定图的社区分配的似然函数和生成它的统计模型的估计来优化的。这个优化框架受到以前关于使用半定规划(SDP)的随机块模型(SBM)中的无监督社区检测问题的启发。在本文中,我们提供学习社区在这个背景下的演变的后续步骤,涉及约束半定规划算法和新提出的主动学习算法。主动学习者智能地查询预期最大化模型可能性变化的节点。实验结果表明,这种主动学习算法优于相同算法的随机选择半监督版本以及其他现有技术的主动学习算法。即使在SBM具有低于已知的无监督可检测性阈值的信噪比(SNR)的情况下,我们的算法也显著改进了性能,这在现实世界和SBM生成的网络上都得到了证明。
创新信息通讯技术引文分析与治理进展(2008-2017)
原文标题: Citation Analysis of Innovative ICT and Advances of Governance (2008-2017)
地址: http://arxiv.org/abs/1801.05916
作者: Shuhua (Monica)Liu, Liting Pan, Xiaowei Chen
摘要: 本文首先介绍了在过去十年中出现的新政府计划 - 互联网+政府(IPG)。为了解全球范围内这一举措带来的收益和挑战,我们对2008年至2017年在电子政务领域发表的研究文章进行了分析。对2105篇文章进行了内容分析和引用分析,以解决三个问题:(1) IPG计划在过去十年中采用了新的ICT技术? (2)学者是如何研究新的ICT和治理核心与IPG之间的相互作用的? (3)新的信息通讯技术是如何相互作用和塑造的,同时也受到过去十年治理演变的影响?我们的分析表明,IPG举措丰富了政府信息基础设施。它提供了积累和使用大量数据的机会,以便更好地做出决策,积极主动的政府与公民的互动。与此同时,开放数据的推进,社交媒体的广泛使用以及数据分析的潜力也给电子民主领域的挑战性问题提出了很大的压力。
基于分布式动态图的高效检测重叠社区
原文标题: On Efficiently Detecting Overlapping Communities over Distributed Dynamic Graphs
地址: http://arxiv.org/abs/1801.05946
作者: Xun Jian, Xiang Lian, Lei Chen
摘要: 现代网络具有巨大的规模和高度的动态性,这对社区检测算法的效率提出了挑战。在本文中,我们研究分布式和动态图上的重叠社区检测问题。给定一个分布式,无向和未加权的图,目标是随着图动态变化而逐渐检测重叠的社区。通过放宽标签传播的概率分布,基于\ textit {扬声器 - 听众标签传播算法}(SLPA),我们提出了一种高效的算法,叫做\ textit {随机化的扬声器 - 听众标签传播算法}(rSLPA)。除了检测高质量的社区之外,rSLPA还可以在一批边插入和删除操作之后逐步更新检测到的社区。就我们所知,rSLPA是第一个可以递增地捕获与通过在更新的图上从头开始应用检测算法而获得的社区相同的社区的算法。对合成和现实世界的数据集进行了大量的实验,结果表明我们的算法可以同时达到高精度和高效率。
在线错误信息网络解剖
原文标题: Anatomy of an online misinformation network
地址: http://arxiv.org/abs/1801.06122
作者: Chengcheng Shao, Pik-Mai Hui, Lei Wang, Xinwen Jiang, Alessandro Flammini, Filippo Menczer, Giovanni Luca Ciampaglia
摘要: 在2016年美国总统选举之前和之后,尽管进行了大量的事实核查工作,大量假新闻和阴谋内容在社交媒体上蔓延。错误信息和事实核查的传播如何竞争?错误信息传播网络核心的结构和动态特征是什么?它的主要传播者是谁?如何减少错误信息的总量?为了探索这些问题,我们建立了Hoaxy,这是一个开放的平台,能够对Twitter上的错误信息和事实检查如何传播和竞争进行大规模的系统研究。 Hoaxy过滤公共鸣叫,包括未经验证的声明或事实检查文章的链接。我们对选举前六个月内从几十万个帐户产生的200万次转发中获得的扩散网络进行k核分解。当我们从网络的边移动到核心时,事实检查几乎消失,而社交机器人却在扩散。主要核心用户数量在选举时达到平衡,流失有限,连接日益密集。我们通过量化大多数中心节点来量化网络如何被破坏,从而得出结论。这些发现提供了一个大规模的在线误传播网络的解剖。
找出风电场功率波动的结构
原文标题: Towards uncovering the structure of power fluctuations of wind farms
地址: http://arxiv.org/abs/1801.06139
作者: Huiwen Liu, Yaqing Jin, Nicloas Tobin, Leonardo P. Chamorro
摘要: 基本概念从根本上说明风电场湍流驱动的功率波动的结构。通过实验得到的推导出的无调谐模型揭示了风电场功率波动的基本谱内容。它包含两个相对低频和高频范围内的幂律趋势和振荡。前者主要是由于流动和涡轮机特性之间的紊流相互作用;而后者是由于涡轮对之间的平流。谱风电场规模功率波动$ \ Phi_P $在对应于湍流惯性子范围的区域内和在相对较大的比例下显示幂律衰减,其中$ \ Phi_P \ sim f ^ { - 2} $。由于大尺度结构的对流和湍流扩散,在频域中存在正弦行为和指数衰减的积分。
社会网络中的话题生命周期:分析语义连续性和社会共同体的影响
原文标题: Topic Lifecycle on Social Networks: Analyzing the Effects of Semantic Continuity and Social Communities
地址: http://arxiv.org/abs/1801.06161
作者: Kuntal Dey, Saroj Kaushik, Kritika Garg, Ritvik Shrivastava
摘要: Twitter上的话题生命周期分析是研究Twitter主题从诞生到生命周期到死亡的研究分支,已经获得了巨大的主流研究热度。在文献中,主题通常被视为(a)主题标签(独立于其他主题标签)之一,(b)在短时间跨度内的关键字突发或(c)由高级文本分析方法学捕获的潜在概念空间作为潜在狄利克雷分配(LDA)。前两种方法不能识别不同用户使用不同标签表达相同概念(语义上相关)的主题,而第三种方法不能识别用户通过主题标签表达的明确意图。在我们的工作中,我们使用基于单词嵌入的方法来将不同的主题标签聚合在一起,以及主题标签用法的时间并发性,从而形成主题(语义上和时间上相关的主题标签组)。我们提出了关于主题生命周期到社区。我们将社会群体的参与描述为话题群体的特征,并分析话题群体参与的生命周期。我们从社区和时间话题的复杂演化中获得了首创的新颖见解:话题在社区内的主题标签上的时间变形,主题标签如何在某些社区中死亡,但在其他社区中变成其他主题标签(这是一个社区级的现象),以及特定社区如何采用特定的主题标签。我们的工作对于社区中的话题生命周期建模和理解空间是至关重要的:它重新定义了我们对话题生命周期的理解,并且表明话题生命周期的社会边界深深根植于社区行为。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。