- SepNE:为网络嵌入带来可分性;
- 社会网络策略扩散的多赢家竞赛;
- 从健康记录中的自由文本到内容集群:一种无监督的图划分方法;
- 利用Ricci曲率测量道路网络拓扑脆弱性;
- 基于接触的含时网络流行病传播模型;
- 图神经网络评估的缺陷;
- 推特上的模拟网络攻击:在2018年美国中期选举之前评估易受网络钓鱼和错误信息攻击的支持脆弱性;
- 网络上的结构和时间异质性;
- 用于网络社区检测的SCORE+;
- 利用局部活动的流网络嵌入;
SepNE:为网络嵌入带来可分性
原文标题: SepNE: Bringing Separability to Network Embedding
地址: http://arxiv.org/abs/1811.05614
作者: Ziyao Li, Liang Zhang, Guojie Song
摘要: 已经提出了许多用于在大规模网络上学习低维表示的成功方法,而几乎所有现有方法都是在不可分离的过程中设计的,即使只有一小部分节点感兴趣,也可以学习整个网络的嵌入。这导致极大的不便,特别是在超大型或动态网络上,这些方法几乎不可能实现。在本文中,我们将分离矩阵分解的问题形式化,在此基础上我们详细阐述了一个保留本地和全局信息的新的目标函数。我们进一步提出了SepNE,一种简单灵活的网络嵌入算法,可以独立地学习分离过程中不同节点子集的表示。通过实现可分离性,我们的算法减少了嵌入不相关节点的冗余工作,为超大型网络提供可扩展性,在分布式学习中自动实现以及进一步调整。我们在几个具有不同规模和主题的现实网络上证明了这种方法的有效性。凭借相当的准确性,我们的方法在大型网络上的运行时间明显优于最先进的基线。
社会网络策略扩散的多赢家竞赛
原文标题: Multi-Winner Contests for Strategic Diffusion in Social Networks
地址: http://arxiv.org/abs/1811.05624
作者: Wen Shen, Yang Feng, Cristina V. Lopes
摘要: 战略传播鼓励参与者通过奖励成功的推荐,积极推动利益相关者的议程。随着社交媒体不断改变人们的沟通方式,战略扩散已成为利益相关者影响人们的决策或行为以达到预期目标的有力工具。现有的战略扩散奖励机制通常要么容易受到假名攻击,要么对于成功转介的参与者而言不是个人理性的。在这里,我们介绍了一种新的多赢家竞赛(MWC)机制,用于社会网络中的战略扩散。 MWC机制满足几个期望的属性,包括假名称证明,个体合理性,预算约束,单调性和子图约束。对四个真实世界社会网络数据集的数值实验表明,利益相关者可以通过适当的竞赛设计显著提高参与者的总体努力。我们的工作揭示了如何设计具有适当竞赛的操纵抗性机制。
从健康记录中的自由文本到内容集群:一种无监督的图划分方法
原文标题: From Free Text to Clusters of Content in Health Records: An Unsupervised Graph Partitioning Approach
地址: http://arxiv.org/abs/1811.05711
作者: M. Tarik Altuncu, Erik Mayer, Sophia N. Yaliraki, Mauricio Barahona
摘要: 电子医疗记录包含大量不同形式的非结构化数据。自由文本构成了这类数据的很大一部分,但由于缺乏适当的方法来及时提取可解释的内容,这种丰富详细信息的来源在实践中往往仍未得到充分利用。在这里,我们将网络理论工具应用于英国国家卫生服务中医院病人事件报告中的自由文本分析,以无人监督的方式和不同级别的分辨率直接根据其中包含的自由文本描述查找报告集群。为此,我们将最近开发的基于段落向量的深度神经网络文本嵌入方法与多尺度马尔可夫稳定性社区检测结合应用于从稀疏文本向量相似性获得的文档的相似性图。我们通过分析伦敦帝国理工学院医疗保健NHS信托提交的事故报告来展示这种方法。多尺度社区结构在数据集的主题中显示具有不同分辨率的含义级别,如从记录组中提取的相关描述性术语所示,以及通过将后验与由医疗保健人员分配的手动编码类别进行比较来示出。我们的内容社区与明确定义的手工编码类别表现出良好的对应关系,但我们的结果还在某些领域提供了进一步的医学细节,并揭示了超出外部分类的事件的补充描述。我们还讨论了该方法如何用于监控不同医疗服务提供者的报告,并检测不属于预先存在的类别的新兴趋势。
利用Ricci曲率测量道路网络拓扑脆弱性
原文标题: Measuring Road Network Topology Vulnerability by Ricci Curvature
地址: http://arxiv.org/abs/1811.05743
作者: Lei Gao, Xingquan Liu, Yu Liu, Pu Wang, Min Deng, Qing Zhu, Haifeng Li
摘要: 描述道路网络系统的基本属性,例如其鲁棒性,脆弱性和可靠性,已成为城市交通领域中非常重要的研究课题。目前的研究主要使用复杂网络的几个统计指标来分析道路网络系统。但是,这些方法基本上是基于节点的。这些基于节点的方法更关心节点之间的连接数,并且缺乏对交互的考虑。因此,这导致了众所周知的节点悖论问题,并且它们表征网络的局部和内在属性的能力很弱。从网络内在几何的角度出发,提出了一种利用离散Ricci曲率测量道路网脆弱性的方法,该方法能够识别道路网的关键部分并指出其脆弱的要素。结果表明,我们的方法在测量道路网络的脆弱性方面比复杂的网络统计数据表现更好。此外,它可以通过我们的方法描述同一城市不同时期的道路网络脆弱性的演变。最后,我们将我们的方法与之前的中心方法进行比较,并显示它们之间的差异。本文提供了一个关于几何的新视角,以分析道路网络的脆弱性,并从新的角度描述道路系统脆弱性的固有性质。它还有助于丰富复杂道路网络的分析方法。
基于接触的含时网络流行病传播模型
原文标题: Contact-based model for epidemic spreading on temporal networks
地址: http://arxiv.org/abs/1811.05809
作者: Andreas Koher, Hartmut H. K. Lentz, James P. Gleeson, Philipp Hövel
摘要: 我们提出了一种基于联系的模型,通过将动态消息传递方法扩展到时间网络来研究流行病的传播。从节点到边中心量的视角的转变允许在时变树上精确地模拟马尔可夫敏感 - 感染 - 恢复的爆发,即具有无环路底层拓扑的时间网络。在任意图上,所提出的基于接触的模型结合了潜在的接触网络的潜在结构和时间异质性,并且以低计算和概念成本改进了基于个体(以节点为中心)方法的分析估计。在这个新框架内,我们得出了时间网络上流行阈值的分析表达式,并证明了经验数据的可行性。
图神经网络评估的缺陷
原文标题: Pitfalls of Graph Neural Network Evaluation
地址: http://arxiv.org/abs/1811.05868
作者: Oleksandr Shchur, Maximilian Mumme, Aleksandar Bojchevski, Stephan Günnemann
摘要: 图中的半监督节点分类是图挖掘中的一个基本问题,最近提出的图神经网络(GNN)已经在这个任务上取得了无可比拟的结果。由于其巨大的成功,GNN引起了很多关注,并且已经提出了许多新颖的架构。在本文中,我们表明现有的GNN模型评估策略存在严重缺陷。我们表明,使用相同数据集的相同训练/验证/测试分割,以及对训练过程进行重大更改(例如,早期停止标准)排除了对不同体系结构的公平比较。我们对四个着名的GNN模型进行了全面的实证评估,并表明考虑到数据的不同分割会导致模型的排名显著不同。更重要的是,我们的研究结果表明,如果超参数和训练程序适用于所有模型,那么简单的GNN架构能够胜过更复杂的架构。
推特上的模拟网络攻击:在2018年美国中期选举之前评估易受网络钓鱼和错误信息攻击的支持脆弱性
原文标题: A Simulated Cyberattack on Twitter: Assessing Partisan Vulnerability to Spear Phishing and Disinformation ahead of the 2018 U.S. Midterm Elections
地址: http://arxiv.org/abs/1811.05900
作者: Michael Bossetta
摘要: 国家赞助的“坏演员”越来越多地将社交媒体平台武器化,以便在选举期间发起网络攻击和虚假宣传活动。社交媒体公司由于其快速增长和规模,努力防止其平台的武器化。这项研究在2018年美国中期选举之前在Twitter上进行了自动鱼叉式网络钓鱼和虚假宣传活动。一个虚假的新闻机器人帐户 - @DCNewsReport--被创建并编程为在被Twitter限制之前自动向138个Twitter用户发送带有“突发新闻”链接的定制推文。总体而言,五分之一的用户点击了链接,这可能导致勒索软件的下载或私人信息的窃取。但是,此实验中的链接是非恶意的,并将用户重有向到Google Forms调查。在预测用户点击Twitter上的链接的可能性时,右翼和左翼游击队之间,或者网络用户和移动用户之间没有观察到统计上显著的差异。调查结果表明,Twitter上具有政治色彩的美国人,无论他们的党派偏好或他们用来访问平台的设备如何,都有可能在社交媒体上遭受鱼叉式网络钓鱼。
网络上的结构和时间异质性
原文标题: Structural and temporal heterogeneities on networks
地址: http://arxiv.org/abs/1811.05913
作者: Liubov Tupikina, Denis S. Grebenkov
摘要: 异质连续时间随机游走是一种分析形式,用于在微观和宏观尺度上研究和建模异质结构中的扩散过程。在本文中,我们从分析和数值上研究时空异质性对不同类型网络的扩散动力学的影响。我们研究了第一次通过时间的分布如何受到全球拓扑网络属性和旅行时间分布的异质性的影响。特别地,我们分析随机网络的传输属性并基于第一通道特征定义网络测量。异构连续时间随机游走框架在生物学,社会和城市科学,最佳运输性质的搜索,运输网络中异质性或突发的影响分析方面具有潜在的应用。
用于网络社区检测的SCORE+
原文标题: SCORE+ for Network Community Detection
地址: http://arxiv.org/abs/1811.05927
作者: Jiashun Jin, Zheng Tracy Ke, Shengming Luo
摘要: SCORE是Jin(2015)提出的最近一种网络社区检测方法。在本文中,我们提出了SCORE的简单改进,称为SCORE +,并使用10种不同的网络数据集将其性能与其他几种方法进行比较。对于其中7个数据集,SCORE和SCORE +的性能相似,但对于其他3个数据集(Polbooks,Simmons,Caltech),SCORE +提供了显著的改进。
利用局部活动的流网络嵌入
原文标题: Streaming Network Embedding through Local Actions
地址: http://arxiv.org/abs/1811.05932
作者: Xi Liu, Ping-Chun Hsieh, Nick Duffield, Rui Chen, Muhe Xie, Xidao Wen
摘要: 最近,网络嵌入已经引起了相当多的研究关注,网络嵌入是构造顶点特征向量的流行方法。由于图数据集中的维度和稀疏性的诅咒,这种方法已经成为大型网络上机器学习任务不可或缺的一部分。大多数现有文献在假设网络是静态的情况下考虑了这种技术。然而,许多应用程序,节点和边中的网络作为流式传输而成为不断增长的网络。最近的一些结果已经解决了动态网络嵌入的问题。然而,它们或者依赖于顶点属性的知识,遭受高时间的复杂性,或者需要在没有封闭形式表达的情况下重新训练。因此,使现有方法适应流式传输环境的方法面临着非平凡的技术挑战。这些挑战激发了开发流网络嵌入问题的新方法。在本文中,我们提出了一个新的框架,能够在指定的迭代轮次中为新顶点生成具有高效率和低复杂度的潜在特征。我们制定了一个约束优化问题,用于修改由流到达产生的表示。我们表明这个问题没有封闭形式的解决方案,而是开发了一个在线近似解决方案。我们的解决方案遵循三个步骤:(1)识别受新顶点影响的顶点,(2)为新顶点生成潜在特征,以及(3)更新受影响最大顶点的潜在特征。生成的表示可证明是可行的,并且在期望方面与最佳表示相差不远。五个真实世界网络上的多类分类和聚类表明,我们的模型可以有效地更新顶点表示,同时实现可比较甚至更好的性能。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。