- 人机融合时代的全球治理体系;
- 测量机器人和人类行为动态;
- 用于Bot检测的深度神经网络;
- 政治操纵的数字痕迹分析:2016年俄罗斯干扰Twitter活动;
- 保留谱特性的网络摘要;
- 通过似然优化进行社区检测:寻找合理的模型;
- 用于函数最大化的基于图的上升算法;
- 涉及Facebook讨论组的攻击策略和时间分析;
- 用一般营销策略实现可扩展影响最大化;
- DyPerm:最大限度地延长动态社区检测的持久性;
- 多于两种选项的投票动态共识时间尺度分析;
- 利用媒体分组进行弱化监督集体特征学习;
人机融合时代的全球治理体系
原文标题: Systems of Global Governance in the Era of Human-Machine Convergence
地址: http://arxiv.org/abs/1802.04255
作者: Eugenio Maria Battaglia, Jie Mei, Guillaume Dumas
摘要: 技术正在日益塑造我们的社会结构,并正在成为改变人类生物学的驱动力。此外,人类活动已经证明会对地球系统产生重大影响,从而在社会和生态系统之间产生复杂的反馈循环。此外,由于我们的物种从小群狩猎采集者向大型和技术密集的城市群发展相对较快,因此人类社会的主要机构不再适合应对当前的复杂性并不令人惊讶。在本文中,我们将绘制神经生理系统和ICT支持的社会系统之间的基本对应关系,讨论植根于生物学和物理学的框架如何为设计与政治和经济相关的演化系统提供启发式价值。在这方面,我们强调新兴技术(即纳米技术,生物技术,信息技术和认知科学)的管理以及气候变化两者目前面临着一系列相关挑战。特别是:历史上的高度不平等;在空前连通的世界中不断增长的多极文化系统的共存;所需的机构协议不太可能达到偏离异常发展轨迹所需的程度。我们认为,对这些相互关联的问题的明智的通用解决方案应该嵌入对如何在地球系统的社会经济子系统中引起相互激励的深刻理解,以便共同赞同全球效用函数(例如避免行星界限的到达和普遍社会动荡)。关于技术社会系统如何能够有效地学习和适应我们对地缘政治复杂性的理解,我们留下了一些开放性问题。
测量机器人和人类行为动态
原文标题: Measuring bot and human behavioral dynamics
地址: http://arxiv.org/abs/1802.04286
作者: Iacopo Pozzana, Emilio Ferrara
摘要: 机器人,社交媒体账户由软件而不是人类控制,最近因其与各种形式的在线操纵的关联而备受关注。到目前为止,很多工作都集中在社交机器人检测上,但很少关注机器人的行为和活动的定性和度量,而不是人类。多年来,机器人变得更加复杂,并且能够反映一些短期行为,模拟人类用户的行为。本文的目标是研究机器人在一次活动过程中表现出的行为动态,并强调这些动作是否以及如何与人类活动签名不同。通过使用与最近的政治事件相关的大型Twitter数据集,我们首先分离机器人和人类,然后隔离他们的活动会话。我们编制一系列量度量表,如用户参与社交互动或制作内容的倾向。我们的分析强调了人类短期行为趋势的存在,这种趋势可能与认知起源有关,在机器人中缺乏,直观地由于其自动化活动。这些研究结果最终被编纂为创建和评估机器学习算法,以检测机器人和人类产生的活动会话,以允许更多细微的机器人检测策略。
用于Bot检测的深度神经网络
原文标题: Deep Neural Networks for Bot Detection
地址: http://arxiv.org/abs/1802.04289
作者: Sneha Kudugunta, Emilio Ferrara
摘要: 检测僵尸程序的问题,自动社交媒体帐户由软件管理,但伪装成人类用户,这具有强烈的影响。例如,僵尸已被用于通过歪曲在线话语,操纵股票市场或推动引发健康流行病的反疫苗阴谋理论来影响政治选举。目前提出的大多数技术都是通过处理大量社交媒体帖子,并利用网络结构,时间动态,情感分析等信息来检测帐户级别的僵尸工具。本文中,我们提出了一种基于上下文冗长的深度神经网络短期记忆(LSTM)体系结构,它利用内容和元数据在推特层次上检测僵尸程序:从用户元数据中提取上下文特征,并将其作为辅助输入提供给处理推文文本的LSTM深层网络。我们提出的另一个贡献是提出一种基于合成少数过采样的技术,从少量标记数据(大约3000个复杂的Twitter机器人示例)中生成一个适用于深度网络训练的大型标记数据集。我们证明,从仅仅一条推文中,我们的架构可以实现将机器人与人分离的高分类准确率(AUC> 96%)。我们将相同的体系结构应用于帐户级别的机器人检测,实现了近乎完美的分类准确性(AUC> 99%)。我们的系统优于先前的技术水平,同时利用了一小部分可解释的功能,但只需要最少的培训数据。
政治操纵的数字痕迹分析:2016年俄罗斯干扰Twitter活动
原文标题: Analyzing the Digital Traces of Political Manipulation: The 2016 Russian Interference Twitter Campaign
地址: http://arxiv.org/abs/1802.04291
作者: Adam Badawy, Emilio Ferrara, Kristina Lerman
摘要: 直到最近,社交媒体才被视为促进关于社会和政治问题的民主话语。然而,这个强大的沟通平台已经受到审查,允许敌对行为者利用在线讨论来操纵公众舆论。一个很好的例子就是正在进行的美国国会对俄罗斯干涉2016年美国竞选活动的调查,俄罗斯指责使用巨魔(恶意账户操纵)和机器人传播错误信息和政治偏见信息。在这项研究中,我们探讨了这一操纵活动的效果,仔细研究了美国国会调查公开披露的俄罗斯巨魔账户在Twitter上分享职位的用户。我们收集了一个数据集,其中包含2016年9月16日至10月21日在Twitter上分享的超过4300万选举相关帖子,大约有570万不同用户。这个数据集包括与被识别的俄罗斯巨魔相关的账户。我们使用标签传播来根据所分享的新闻来源推断所有用户的意识形态。这种方法使我们能够将大量用户分类为自由或保守,准确率高达90%以上。保守派转推俄罗斯巨魔的频率比自由主义者多出31倍,并产生36倍多的推文。此外,大部分troll内容转发源自南部的两个州:田纳西州和德克萨斯州。使用最先进的机器人检测技术,我们估计约有4.9%和6.2%的自由和保守用户是机器人。对巨魔分享内容的文本分析表明,他们有一个最保守的,亲特朗普的议程。尽管在2016年美国总统大选前,一群意识形态广泛的Twitter用户曾接触过俄罗斯巨魔,但主要是保守派帮助扩大了他们的信息。
保留谱特性的网络摘要
原文标题: Network Summarization with Preserved Spectral Properties
地址: http://arxiv.org/abs/1802.04447
作者: Yu Jin, Joseph F. JaJa
摘要: 大规模网络广泛用于表示许多现实世界应用中的对象关系。大规模网络的出现对处理,分析和提取来自这些网络的信息提出了重大的计算挑战。网络汇总技术通常用于减少计算负荷,同时试图维持原始网络的基本结构特性。以前的工作主要集中在某些类型的网络分区策略和依赖于应用程序的规则化,通常导致强连通的集群。在本文中,我们基于谱图论的概念,介绍了一个关于网络摘要问题的新观点。我们提出了一种新的距离测量来表征原始和粗化网络之间的谱差异。我们用交错定理和随机块模型的结果严格证明了谱距离的合理性。我们提供了一种有效的算法来生成最大程度地保留原始网络谱特性的粗化网络。我们提出的网络摘要框架允许灵活地生成一组粗糙网络,其具有与原始网络的不同方面保存的显著不同的结构,这将我们的工作与其他方面区分开来。我们对各种大型网络进行了广泛的实验测试,包括实际应用和随机图模型。我们表明,与以前的网络摘要算法相比,我们提出的算法在谱测量和运行时间方面始终如一地执行更好的结果。
通过似然优化进行社区检测:寻找合理的模型
原文标题: Community detection through likelihood optimization: in search of a sound model
地址: http://arxiv.org/abs/1802.04472
作者: Liudmila Ostroumova Prokhorenkova, Alexey Tikhonov
摘要: 社区检测最近成为网络分析中最重要的问题之一,并提出了许多算法来解决这个问题。其中,基于统计推断的方法具有特别的意义:这种算法在数学上是合理的,并且被证明可以提供高质量的分区。统计推断方法的主要成分是假设一些潜在的随机图模型,然后通过最大化可能性将该模型拟合到观察图。这种基础模型(也称为空模型)的选择对于这种方法是非常重要的,这种选择是当前研究的焦点。我们提供了一个广泛的理论和实证分析来比较几个模型:随机区块模型,它是目前最广泛使用的似然优化模型;最近提出了这个模型的度数修正修正,以及一个新的具有一些理想统计特性的单参数零模型。我们还开发并比较了两种适用于所考虑空模型的可能性优化算法。对各种数据集进行广泛的实证分析表明,与合成数据集相比,现实世界网络具有多样性,并且没有适合所有数据集的模型。
用于函数最大化的基于图的上升算法
原文标题: Graph-Based Ascent Algorithms for Function Maximization
地址: http://arxiv.org/abs/1802.04475
作者: Muni Sreenivas Pydi, Varun Jog, Po-Ling Loh
摘要: 我们研究在连通图的节点上找到定义的函数的最大值的问题。目标是确定函数获得最大值的节点。我们专注于局部迭代算法,它沿着路径遍历图的节点,并且从当前迭代的邻居中选择下一个迭代,其中概率分布由当前迭代中的函数值及其邻居来确定。我们研究了对应于具有不同过渡内核的Metropolis-Hastings随机游走的两种算法:(i)第一种算法是由参数$ \ gamma $控制的指数加权随机游走。 (ii)关于图拉普拉斯算子和平滑参数$ k $定义第二算法。我们从总变差距离和命中时间的角度推导出两种算法的收敛速度。作为图函数平滑性的函数,我们还提供了仿真,显示我们的算法与无偏随机游走相比的相对收敛速度。我们的算法可以被归类为图的节点上用于函数最大化的一类新的“基于下降”的方法。
涉及Facebook讨论组的攻击策略和时间分析
原文标题: Attacking Strategies and Temporal Analysis Involving Facebook Discussion Groups
地址: http://arxiv.org/abs/1802.04500
作者: Chun-Ming Lai, Xiaoyun Wang, Yunfeng Hong, Yu-Cheng Lin, S. Felix Wu, Patrick McDaniel, Hasan Cam
摘要: 在线社会网络(OSN)讨论组正在对政治对话产生重大影响。在没有访问控制机制的情况下,任何用户都可以贡献给任何OSN线程。个人可以利用这一特性来执行有针对性的攻击,从而增加后续恶意行为(如网络钓鱼和恶意软件分发)的可能性。这些行动也将破坏媒体,政治家和他们的选民之间的桥梁。对于安全管理的关注,将恶意网络攻击与在线社交互动混合在一起引发了一个全新的挑战。在本文中,我们描述了我们提出的一种新方法,用于研究和理解攻击者在Facebook讨论组中使用恶意URL进行传播的策略。我们定义和分析了与预测针对新闻媒体组织创建的主题的攻击可能性有关的问题。我们使用宏观静态特征和帖子和线程的微动态演变组合来识别可能的目标,其准确度高于90%。我们的第二个目标之一是在短时间(10分钟)内做出这样的预测。我们希望本文中提供的数据和分析能够更好地理解攻击者的策略和脚印,从而开发新的系统管理方法来处理社会网络中的网络攻击。
用一般营销策略实现可扩展影响最大化
原文标题: Scalable Influence Maximization with General Marketing Strategies
地址: http://arxiv.org/abs/1802.04555
作者: Ruihan Wu, Zheng Yu, Wei Chen
摘要: 在本文中,我们研究了用一般营销策略(IM-GMS)来影响最大化的可伸缩算法,其中营销策略组合被建模为一个向量$ \ mathbf {x} =(x_1,\ ldots,x_d)以概率$ h_v(\ mathbf {x})$激活社会网络中的节点$ v $。 IM-GMS问题是寻找最佳策略组合$ \ mathbf {x} ^ * $,以最大化由于受激活种子的影响传播而引起的影响扩散,受到预算约束$ \ sum_ {j \ in [d ]} x_j \ le k $。我们调整可扩展的反向影响采样(RIS)方法,并设计一个可扩展的算法,提供$(1-1 / e - \ varepsilon)$近似解(对于任何$ \ varepsilon> 0 $),运行时间接近线性在网络大小。我们进一步扩展IM-GMS以允许分区预算约束,并证明我们的可扩展算法在这种情况下提供了$(1 / 2- \ varepsilon)$解决方案。通过广泛的实验,我们证明了我们的算法比基于蒙特卡罗模拟的爬山算法快几个数量级,并且还优于文献中提出的其他基线算法。
DyPerm:最大限度地延长动态社区检测的持久性
原文标题: DyPerm: Maximizing Permanence for Dynamic Community Detection
地址: http://arxiv.org/abs/1802.04593
作者: Prerna Agarwal, Richa Verma, Ayush Agarwal, Tanmoy Chakraborty
摘要: 在本文中,我们提出了DyPerm,这是第一种动态社区检测方法,它优化了一种称为永久性的新型社区评分指标。 DyPerm通过更新已执行节点和边的编辑的社区,递增地修改社区结构,从而保持网络的其他部分不变。我们提出了强有力的理论保证,以显示现有社区结构的更新如何/为什么导致动态网络中的永久性最大化,从而大大降低了计算复杂度。对具有给定的地面实况社区结构的合成网络和六个真实世界网络的实验表明,与四种基线方法中的最佳方法相比,DyPerm实现(平均)35%的准确度增加(基于NMI)。 DyPerm的结果也比静态对象快15倍。
多于两种选项的投票动态共识时间尺度分析
原文标题: Analysis of Time Scale to Consensus in Voting Dynamics with more than Two Options
地址: http://arxiv.org/abs/1802.04654
作者: Degang Wu, K.Y.Szeto
摘要: 我们将自适应网络上的二元多数票模型推广到其多元票对应模型,并且在选民给予两个以上选项时分析时间尺度达到共识。当意见在初始状态下的选民人口中均匀分布时,我们发现从数值模拟和使用三态多项投票模型的主方程的数学分析,到共识的时间尺度比二元投票模型要短。当干预如认为转换是允许的,如因任何原因选民的心态突然变化的情况下,在热力学极限的共识状态推零散三认为人口所需要的努力,在最少的干预成本计量,比同性恋的程度($ p $)低于0.8时所需的数量少于将两极分化的两极群体推到共识状态所需的数量。对于有限制的系统,与两极分化人口相比,分散的三意见人口将自发地达到共识状态,达成共识的时间更快,范围广泛的p $。
利用媒体分组进行弱化监督集体特征学习
原文标题: Weakly supervised collective feature learning from curated media
地址: http://arxiv.org/abs/1802.04668
作者: Yusuke Mukuta, Akisato Kimura, David B Adrian, Zoubin Ghahramani
摘要: 当前最新的特征学习依赖于监督学习由目标内容项目及其各自类别标签组成的大规模数据集。但是,构建这种大规模完全标记的数据集通常需要费力的手动工作。解决此问题的一个可能方法是将社区贡献的文本标签用作弱标签,但是,单个文本标签的基本概念很大程度上取决于用户。相反,我们通过充分利用社会网络服务(SNS)上的人员策略过程,提出了一种学习歧视性特征的新范式。在内容管理的过程中,SNS用户从各种来源手动收集内容项目并按照上下文进行分组,这些都是为了他们自己的利益。由于这个过程的本质,我们可以假设:(1)同一组中的内容项共享相同的语义概念;(2)共享相同图像的组可能具有相关的语义概念。通过这些见解,我们可以将人为策划的组定义为弱标签,从中我们提出的框架可以学习歧视性特征作为用户在创建组时所用的语义概念空间中的表示。我们表明,这种特征学习可以表示为节点对应于内容项目和人类策划组的二部图的链路预测问题,并且提出了一种基于稀疏编码或网络微调的新颖特征学习方法。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。