- CSI:假冒新闻的混合深度模型;
- 假新闻传播“瘟疫”:是否可预防?;
- 在VKontakte社交网络中测量,预测和可视化词表示和使用中的短期变化;
- 拓扑加权质心(TWC):流行病学和类流行病学时空结构的拓扑学方法;
- 关于传染病爆发的可预测性;
- 有向2K图的构建;
CSI:假冒新闻的混合深度模型
地址: http://arxiv.org/abs/1703.06959
作者: Natali Ruchansky, Sungyong Seo, Yan Liu
摘要: 在最近的政治气候中,假新闻的主题引起了公众和学术界的关注。这种错误信息被引用对公众舆论产生强烈影响,从而带来恶意操纵的机会。检测假新闻是一个重要但具有挑战性的问题,因为人类通常很难区分错误信息。然而,已经有三个一般商定的假新闻的特点:文本,收到的答复和源用户宣传它。现有的工作主要集中于针对特定特征定制解决方案,但是假新闻流行的复杂性限制了它们的成功和通用性。在这项工作中,我们提出一个模型,结合所有三个特点,以更准确和自动化的预测。具体来说,我们包括双方,用户和文章的行为,以及传播假新闻的用户的群体行为。受三个特征的驱动,我们提出了一个名为CSI的模型,它由三个模块组成:捕获,评分和积分。第一模块使用递归神经网络(RNN)来捕获与给定文章一起发生的用户活动的时间模式,并且第二模块捕获用户随时间的行为。然后,两者与第三模块集成以将物品分类为假的或非假的。通过对现实世界数据的实验分析,我们证明CSI实现比现有模型更高的精度。此外,我们显示每个模块捕获关于用户和文章的相关行为信息关于假新闻的传播。
假新闻传播“瘟疫”:是否可预防?
地址: http://arxiv.org/abs/1703.06988
作者: Eni Mustafaraj, Panagiotis Takis Metaxas
摘要: 2010年,一篇题为“从分钟到突出:政治言论和实时搜索”的论文获得了Web Science 2010会议的最佳论文奖。其中的发现是发现和记录什么被称为“Twitter炸弹”,有组织的努力传播关于民主候选人玛莎·科克利通过匿名Twitter帐户的错误信息。在本文中,总结了该事件的细节之后,我们将概述社交网络如何传播错误信息的方法。这样的配方中最重要的步骤之一是“渗透”已经参与关于主题的对话的用户团体,以使用它们作为在其扩展子网络中的错误信息的有机传播者。然后,我们采取这种错误信息传播食谱,并指出它是如何成功地用来传播假的新闻,在2016年美国总统选举。这些情景之间的主要区别是使用Facebook而不是Twitter,以及各自的动机(在2010年:政治影响;在2016年:通过在线广告的经济利益)。在将这些事件放在更广泛的利用网络的背景下,我们抓住这个机会来解决研究结果的影响的局限性,并开始谈论研究人员社区如何增加对现实世界社会问题的影响。
在VKontakte社交网络中测量,预测和可视化词表示和使用中的短期变化
地址: http://arxiv.org/abs/1703.07012
作者: Ian Stewart, Dustin Arendt, Eric Bell, Svitlana Volkova
摘要: 社交媒体中的语言是非常动态的:新词出现,趋势和消失,而现有词的意义可随时间波动。这种动态在危机期间尤其显着。这项工作解决了测量,可视化和预测短期文本表示移位,即单词的上下文语义的变化,并将这种移位与在社交媒体流中观察到的表面级词动力学或概念漂移进行对比的几个重要任务。与以前的文本学习词表示的方法不同,我们研究短期概念漂移和大型社交媒体语料库的表示移动之间的关系 - 在俄罗斯 - 乌克兰危机期间收集的俄罗斯VKontakte帖子在2014-2015年。我们的新颖贡献包括定量和定性方法(1)测量短期表示移位和与表面水平概念漂移的对比; (2)构建预测模型以预测来自先前含义和概念漂移的意义的短期变化;和(3)可视化短期表示移动的示例关键词,以证明我们的方法发现和跟踪新兴词在社交媒体的意义的实际使用。我们显示短期表示移位可以提前几个星期准确预测。我们在社交媒体中建模和可视化单词表示移动的独特方法可用于在危机事件期间探索和表征流语料库的特定方面,并可能改进其他下游分类任务,包括实时事件检测。
拓扑加权质心(TWC):流行病学和类流行病学时空结构的拓扑学方法
地址: http://arxiv.org/abs/1703.07175
作者: Massimo Buscema, Giulia Massini, Pier Luigi Sacco
摘要: 本文首先系统地介绍了流行病学和类流行病学空间过程分析的拓扑方法。我们介绍基本概念和证据,在历史记录的流行和假流行过程的案例研究的多样收集测试的方法。该方法被发现一致地提供流行过程的结构特征的可靠估计,并且提供对片段伪流行过程的有用的分析洞察和解释。虽然这种分析必须被视为初步的,但我们发现,该方法的基本原则得到了第一次测试的强烈支持,并保证了本研究的未来研究。
关于传染病爆发的可预测性
地址: http://arxiv.org/abs/1703.07317
作者: Samuel V. Scarpino, Giovanni Petri
摘要: 传染病爆发重现生物学:它们来自宿主,病原体及其共享环境的多层次相互作用。因此,预测疾病何时,在何地以及在多大程度上将传播需要复杂的系统方法来建模。最近的研究表明,预测爆发的不同组成部分 - 例如,预期的病例数量,需要治疗的病例的速度和速度,输入概率等是可行的。因此,推进疾病预测的科学和实践现在需要测试暴发预测的基本限制的存在。为了研究爆发预测的问题,我们使用置换熵作为模型独立的可预测性度量,研究信息理论限制以预测广泛的传染病。研究多种历史暴发的可预测性 - 包括淋病,流感,寨卡,麻疹,脊髓灰质炎,百日咳和腮腺炎 - 我们确定了时间序列预测的基本熵屏障。然而,我们发现,对于大多数疾病,这种预测的障碍通常远远超出单次爆发的时间尺度,这意味着预测可能成功。我们还发现,预测水平随着疾病的变化而变化,并且表明移动模型结构和社交网络异质性是观察到的传染病可预测性差异的最可能的机制。我们的结果突出了超越时间序列预测的重要性,通过采用动态建模方法进行预测,并提出在长期疾病时间序列中进行模型选择的挑战。我们进一步预测,我们的研究结果将有助于快速增长的流行病学预测领域,并且可以更广泛地涉及复杂的适应性系统的可预测性。
有向2K图的构建
地址: http://arxiv.org/abs/1703.07340
作者: Bálint Tillman, Athina Markopoulou, Carter T. Butts, Minas Gjoka
摘要: 我们研究构建与真实世界有向图在其度相关性方面类似的合成图的问题。我们定义定向2K构造(D2K)的问题,其将有向度序列(DDS)和联合程度和属性矩阵(JDAM)作为输入,以便在有向图中特别捕获程度相关性。我们提供必要和充分的条件来决定目标D2K是否可实现,我们设计一个有效的算法,创建与目标D2K的实现。我们评估我们的算法创建目标现实世界有向图(例如Twitter)的合成图,我们显示它相比于最先进的方法带来显着的好处。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在个人博客网络科学研究速递 进行同步更新,并提供RSS订阅。