Arxiv网络科学论文摘要12篇(2017-08-22)

  • FLICA:协调活动领导者识别框架;
  • 大学Twitter参与:使用Twitter关注者来排名大学;
  • 实时预测通过Twitter下载驱动攻击;
  • 基于主体的计算从多代理系统到基于主体的模型:视觉调查;
  • 什么驱动国际发展议程? 1970-2016年联合国一般性辩论的NLP分析;
  • 篡改复杂的基因组网络;
  • 基尔霍夫指数作为加权网络中边中心的度量:近线性时间算法;
  • 对于潜在的社会事件发现应用的无限进化集群模型的有效的在线推论;
  • 当代人群中的家庭网络:区域和文化的分类;
  • 社交网络中的虚假新闻;
  • 网络模型选择任务聚焦归因网络推理;
  • ConStance:建模注释背景以改善姿态分类;

FLICA:协调活动领导者识别框架

地址: http://arxiv.org/abs/1603.01570

作者: Chainarong Amornbunchornvej, Ivan Brugere, Ariana Strandburg-Peshkin, Damien Farine, Margaret C. Crofoot, Tanya Y. Berger-Wolf

摘要: 领导是社会组织的一个重要方面,影响到人类社会以及许多其他动物物种的社会制度中组织形成,协调和决策的过程。根据他们的行为和随后的其他反应来识别领导者的能力开辟了探索组决策的机会。了解谁影响力对社会组织的结构有重要的认识。在本文中,我们提出了一个简单而强大的领导推理框架,提取团队协调期,并根据个人在一组内的活动来确定领导。我们不仅能够识别一个领导者或领导者,还可以分类与观察到的群体决策模式相一致的领导模式。该框架在区分各种领导模式(例如独裁,线性层级或局部影响)方面表现良好。我们提出了五个简单的特征,可用于对每个领导模型的特征进行分类,从而使模型分类成为可能。提出的方法自动(1)确定协调组活动的时期,(2)确定领导的身份,(3)对组织协调发生的可能机制进行分类。我们展示了我们关于模拟和现实世界数据的框架:狒狒部队的GPS轨迹和鱼类学校的视频跟踪以及纳斯达克指数的股票收盘价格数据。我们的领导模式的结果与地面生物数据一致,框架在财务数据中发现了许多未知的纳斯达克综合指数报告。我们的方法很容易推广到来自互动实体的任何协调的活动数据。

大学Twitter参与:使用Twitter关注者来排名大学

地址: http://arxiv.org/abs/1708.05790

作者: Corren G. McCoy, Michael L. Nelson, Michele C. Weigle

摘要: 我们检查和排名从美国国家大学体育协会(NCAA)Division I成员和美国新闻,时代高等教育,世界大学学术排名和金钱杂志发表的全球名单中提取的264所美国大学。我们的大学Twitter参与(UTE)排名是基于大学主页上引用的主要和附属二级Twitter帐户的朋友和扩展跟踪网络。在排名比较中,我们观察到UTE与总体信誉排名之间的显着的正秩相关({\τ} = 0.6018),这表明UTE可能是通常排除在传统列表之外的非典型机构排名的可行代理。此外,我们通过仅使用基于Web的工件和可公开访问的Twitter应用程序编程接口(API)来显着降低对每个机构进行排名所需的数据收集成本。

实时预测通过Twitter下载驱动攻击

地址: http://arxiv.org/abs/1708.05831

作者: Amir Javed, Pete Burnap, Omer Rana

摘要: Twitter的信息发现受到欢迎,加上自动缩短网址以节省空间,给予140个字符的限制,网络犯罪分子可以在一个tweet内混淆恶意网页的URL。一旦URL被模糊化,网络犯罪分子可以引诱用户在使用恶意Web服务器进行网络攻击之前用诱惑的文本和图像进行点击。这被称为驱动器下载。在驱动器下载中,用户的计算机系统在与恶意端点交互时受到感染,通常没有意识到攻击已发生。攻击者可以通过利用未修补的系统漏洞来获得对系统的控制,而这种形式的攻击目前代表着最常用的方法之一。在本文中,我们使用机器活动数据和tweet元数据构建机器学习模型,以超越诸如恶意网址的执行后分类,以预测URL将是恶意的99.2%F度量(使用10倍交叉验证)和83.98%(使用看不见的测试集)在1秒内与URL的交互。因此,提供了在攻击完成之前杀死与服务器的连接的基础,并主动阻止和防止攻击,而不是稍后进行反应和修复。

基于主体的计算从多代理系统到基于主体的模型:视觉调查

地址: http://arxiv.org/abs/1708.05872

作者: Muaz A. Niazi, Amir Hussain

摘要: 基于主体的计算是基于“代理”概念构建智能软件的多元化研究领域。在本文中,我们使用Scientometric分析来分析基于主体的计算的所有子域。我们的数据包括在二十年期间出版的ISI知识网络中索引的1,064篇期刊文章:1990 - 2010年。这些使用主题搜索检索,其中使用常用于基于主体的计算的子域中的各种关键字。在我们提出的方法中,我们采用了两个应用程序的组合,即网络工作台和CiteSpace,其中网络工作台允许对域的复杂网络方面进行分析,使用CiteSpace执行详细的基于可视化的书目数据分析。我们的结果包括基于关键字识别最大的集群,指标术语发布的时间表,核心期刊和主要类别。我们还与核心研究机构一起确定了手稿的核心作者,最高起源国。最后,我们的研究结果有趣地揭示了代理计算在许多非计算相关的科学领域,包括生命科学,生态科学和社会科学的强大存在。

什么驱动国际发展议程? 1970-2016年联合国一般性辩论的NLP分析

地址: http://arxiv.org/abs/1708.05873

作者: Alexander Baturo, Niheer Dasandi, Slava J. Mikhaylov

摘要: 尽管联合国(UN)对发展努力的进程和成果产生了重大的影响,但对于联合国(UN)国际发展的议程设置却令人吃惊。本文利用一种将自然语言处理技术应用于联合国一般性辩论中的国家年度报表的新颖方法来解决这一缺陷。每年联合国成员国在一般性辩论中就政府对世界政治重大问题的看法提供陈述。这些演讲提供了有关国家对各种问题的偏好的宝贵资料,包括国际发展,但在全球政治学研究中却大有被忽视。本文确定了1970年至2016年间在这些演讲中提出的主要国际发展议题,并研究了国际发展言论的具体推动力。

篡改复杂的基因组网络

地址: http://arxiv.org/abs/1708.05926

作者: Komal Batool, Muaz A. Niazi

摘要: 网络是现在用于存储全球个人个人信息的重要存储数据结构。随着个人基因组测序的出现,网络将被用于存储人们的个人基因组测序。与社交媒体网络相比,这种基因组网络中关系的重要性非常重要。失去个人之间的联系意味着失去关系信息(例如父亲或儿子等)。目前在存储网络数据方面存在着相当严重的问题。简单地说,网络数据不是篡改的。换句话说,如果某些链接或节点被恶意攻击者更改/删除/添加,管理员将无法检测到这些更改。而在社会媒体网络的当前时代,节点特征和链接的变化在关系方面可能是坏的,在存储个人基因组的网络的情况下,结果可能是真正的毁灭性的。在这里,我们提出了使用加密和基于自我的网络分析方法的组合构建防篡改网络的方案。使用实际发布的数据集,我们还演示了该方案的实用性和有效性,同时展示了其在各种可能的使用场景中的工作。广泛实验的结果表明了所提出的方法的有效性。

基尔霍夫指数作为加权网络中边中心的度量:近线性时间算法

地址: http://arxiv.org/abs/1708.05959

作者: Huan Li, Zhongzhi Zhang

摘要: 大多数以前的中心工作侧重于顶点重要性的度量和识别强大顶点的方法,而边的相关工作要小得多,特别是对于加权网络,由于计算挑战。在本文中,我们提出使用着名的基尔霍夫指数作为加权网络中边中心度的度量,称为$ \θ$ -Kirchhoff边中心。网络的基尔霍夫指数定义为所有顶点对上的有效电阻之和。边$ e $的中心性反映在网络的基尔霍夫指数的增加中,当边$ e $部分停用时,其特征在于参数$ \ theta $。我们为$ \ theta $ -Kirchhoff边中心定义了两个等效的度量。两者都是全局度量,并且具有比通常使用的措施更好的辨别力,基于网络的局部或部分结构信息,例如。边中间性和跨越边中心。尽管基尔霍夫指数作为中心度量和广泛应用的强大优势,但是计算图中每个边的基尔霍夫边中心的确切值是计算上的要求。为了解决这个问题,对于$ \θ$ -Kirchhoff边中心性指标中的每一个,我们提出了一种有效的算法,以$ m $的近似线性时间计算其$ $ eps $ -approximation。所提出的$ \θ$ -Kirchhoff边中心性是边重要性的第一个全局度量,可以在几乎线性的时间内被证明近似。此外,根据$ \ theta $ -Kirchhoff边中心性,我们提出了一个$ \ theta $ -Kirchhoff顶点中心度量,以及一个可以计算$ \ epsilon $ -approximate Kirchhoff顶点中心位置的所有$ n的快速算法$顶点近似线性时间$ m $。

对于潜在的社会事件发现应用的无限进化集群模型的有效的在线推论

地址: http://arxiv.org/abs/1708.06000

作者: Wei Wei, Kennth Joseph, Kathleen Carley

摘要: 经常性中餐餐厅流程(RCRP)是一种强大的统计方法,用于对大型社交媒体数据中的演变群体进行建模。使用RCRP,可以允许模型中的群集数量和群集参数随时间变化。然而,RCRP的应用在很大程度上受到限制,这是由于集群进化先验与多项似然性之间的非共轭性。这种非共轭性使得推论和限制了使用RCRP的模型的可扩展性,导致RCRP仅在简单的问题中被应用,例如可以由单个高斯发射近似的问题。在本文中,我们为RCRP的非共轭问题提供了一个新颖的解决方案,以及如何将我们的解决方案用于一个特定问题 - 社会事件发现问题的示例。通过在推理中使用顺序蒙特卡罗方法,我们的方法可以大量并行,并且具有高度可扩展性,可以在数千万个文档上工作。我们能够生成可以直接解释为真实社会事件的群集的高质量的主题和位置分布,我们的实验结果表明,与先前工作中报道的技术相比,所提出的方法具有更好的预测性能。我们还展示了我们开发的技术如何以更通用的方式用于类似的问题。

当代人群中的家庭网络:区域和文化的分类

地址: http://arxiv.org/abs/1708.06186

作者: Kunal Bhattacharya, Venla Berg, Asim Ghosh, Janos Kertesz, Anna Rotkirch, Kimmo Kaski

摘要: 在当代芬兰,使用一个具有6万个家庭的个人层面人口信息的大型数据集,我们分析了家庭网络中的差异和文化差异性。家庭被认为是具有共同孩子并属于不同家庭的男性和女性之间的顶点和工会被认为是这种家庭网络的边。采样网络是许多不相交的组件的集合,其中最大的连接组件由以一个特定区域为基础的家庭主导。我们根据基本的结构特征来描述网络,然后探讨网络传播性和分类性,并分析其原始地域和语言认同。传播性被认为是由网络中的语言嗜好引起的。总体而言,我们的研究结果表明,地理接近度和语言对网络结构的影响很大。

社交网络中的虚假新闻

地址: http://arxiv.org/abs/1708.06233

作者: Christoph Aymanns, Jakob Foerster, Co-Pierre Georg

摘要: 我们将新闻的传播模型作为网络上的社交学习博弈。代理人可以赞同或反对在一条新闻中提出的索赔,其本身可能是真的还是假的。代理人根据私人信号及其邻居的过去行动决定他们的决定。鉴于这些投入,代理人遵循通过多代理深层加强学习获得的策略,并根据索赔的真实性接受效用。我们的框架产生策略,代理效用接近理论上的贝叶斯最优基准,同时保持灵活的模型重新规范。优化的策略允许代理人正确识别大多数虚假声明,当所有代理人都收到无偏见的私人信号。然而,对手试图通过针对具有偏袒私人信号的代理商的一个子集传播假消息可能是成功的。当对手拥有代理商的网络位置或私人信号的信息时,更是如此。当代理人知道对手的存在时,他们会在训练阶段重新优化他们的策略,而对手的攻击效果较差。因此,让代理商冒出假消息的可能性可以成为限制社交网络中假冒新闻传播的有效途径。我们的研究结果还强调,用户私人信念及其社交网络结构信息对对手来说极具价值,应受到良好的保护。

网络模型选择任务聚焦归因网络推理

地址: http://arxiv.org/abs/1708.06303

作者: Ivan Brugere, Chris Kanich, Tanya Y. Berger-Wolf

摘要: 网络是表示实体之间关系的模型。通常这些关系是明确给出的,或者我们必须学习一种概括和预测基础个人数据(例如属性或标签)中观察到的行为的表示。无论是给定还是推断,选择最佳表示都会影响网络上的后续任务和问题。这项工作侧重于模型选择,以评估网络表示从数据,重点关注网络上的基本预测任务。我们提出了一种使用一般可解释网络模型,跨域发现的任务邻域函数以及强大模型选择的几个标准的模块化方法。我们展示了我们在三个在线用户活动数据集中的方法论,并且显示了适当的网络任务和替代任务的网络模型选择在我们的实验中将性能提高了一个数量级。

ConStance:建模注释背景以改善姿态分类

地址: http://arxiv.org/abs/1708.06309

作者: Kenneth Joseph, Lisa Friedland, William Hobbs, Oren Tsur, David Lazer

摘要: 手动注释是许多机器学习应用的先决条件。然而,注释过程本身的缺点很容易忽视。特别是,学者经常选择什么信息给评论者,而不是经验地检查这些决定。对于主观任务,如情绪分析,讽刺和态度检测,这些选择可能会影响结果。在这里,对于Twitter上政治态度检测的任务,我们表明提供太少的上下文可能会导致嘈杂和不确定的注释,而提供太强的上下文可能会导致其超过其他信号。为了表征和减少这些偏差,我们开发了ConStance,一种关于信息条件注释推理的通用模型。鉴于多个注释器产生的冲突标签看到与不同上下文相同的实例,ConStance同时估计黄金标准标签,并且还可以学习新实例的分类器。我们表明,ConStance学习的分类器在预测政治立场方面优于各种基准,而模型的可解释参数揭示了每个上下文的影响。

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在个人博客 https://www.complexly.me 进行更新,并提供RSS订阅。

你可能感兴趣的:(Arxiv网络科学论文摘要12篇(2017-08-22))