- TipTop:在十亿级网络中影响最大化的精确解决方案;
- mvn2vec:多视图网络嵌入中的保存和协作;
- 欧洲冠军联赛进入三个赛季并没有满足战略的要求;
- 动态社会网络建模与分析教程。第二部分;
- 我们如何自然地排序和组织图拉普拉斯特征向量?;
- 在优先连接图中恢复隐藏的社区;
- 在线社会网络中身份盗窃检测的综合行为建模;
- 用于定位隐私保护的伪装;
- 将社交媒体地理位置进行地理定位,以进行应急地图绘制;
- 大规模灾害后二手车的公众情绪和需求:Facebook页面的社交媒体情感分析;
- 网上新闻馈送的多源社会反馈;
- 维基百科在学术界作为教学工具:从厌恶到积极的教师档案;
- 一种新的多属性图的加权距离度量;
TipTop:在十亿级网络中影响最大化的精确解决方案
原文标题: TipTop: Exact Solutions for Influence Maximization in Billion-scale Networks
地址: http://arxiv.org/abs/1701.08462
作者: Xiang Li, J. David Smith, Thang N. Dinh, My T. Thai
摘要: 在本文中,我们研究了成本感知型目标病毒式营销(Cost-aware Target Viral Marketing,CTVM)问题,这是病毒式营销中众所周知的影响最大化(IM)的概括。 CTVM要求最具成本效益的用户影响最相关的用户。我们试图提供确切的解决方案,而不是像文献中那样对问题进行近似处理。由于问题在NP难,显然精确的解决方案不是在多项式时间,因此最大的挑战是设计可扩展的精确解决方案,可以在大型网络上运行。我们首先强调,使用传统的两阶段随机规划来准确求解CTVM是不可能的,因为可扩展性。然后,我们提出我们的解决方案TipTop,其近似比为$(1 - ε)$。这一结果显著改善了当前对于IM和CTVM的最佳解决方案。 TipTop的核心是一种创新技术,尽可能减少样本数量。这使我们可以使用整数规划在更小的生成样本空间上精确地求解CTVM。在获得几乎精确的解决方案的同时,TipTop具有很高的可扩展性,可以在诸如Twitter之类的数十亿个网络上运行。此外,TipTop还为研究人员提供了一个工具,用于将他们的解决方案与大规模网络中的最佳解决方案进行基准比较,目前尚不可用。
mvn2vec:多视图网络嵌入中的保存和协作
原文标题: mvn2vec: Preservation and Collaboration in Multi-View Network Embedding
地址: http://arxiv.org/abs/1801.06597
作者: Yu Shi, Fangqiu Han, Xinran He, Carl Yang, Jie Luo, Jiawei Han
摘要: 多视点网络在真实世界的应用中无处不在。为了提取知识或业务价值,将这种网络转换成易于机器操作的表示是有意义的。同时,网络嵌入已经成为生成分布式网络表示的一种有效方法。因此,我们有必要研究多视图网络嵌入问题,着重介绍嵌入这种网络的特点和重要性。在我们嵌入实际的多视图网络的实践中,我们确定了两个这样的特征,我们称之为保存和协作。然后我们探讨通过同时建模保存和协作来实现更好的嵌入质量的可行性,并提出mvn2vec算法。通过对一系列合成数据集,内部Snapchat数据集和两个公共数据集的实验,我们进一步确认了保存和协作的存在和重要性。这些实验还表明,通过同时建模两个特性可以获得更好的嵌入,同时不会使模型过度复杂或需要额外的监督。
欧洲冠军联赛进入三个赛季并没有满足战略的要求
原文标题: UEFA Champions League entry has not satisfied strategy-proofness in three seasons
地址: http://arxiv.org/abs/1801.06644
作者: László Csató
摘要: 从理论角度对体育排位规则的调查可以揭示其可能的意外后果。激励相容性的重要性似乎是无可争议的,因为故意为了获得其他优势而蓄意降分或失败的行为被视为违背博弈精神。本文研究了欧洲足球联赛冠军联赛(European Championship League)在欧洲足球界最具威望的俱乐部竞赛中的防守策略。我们发现,在三个赛季(2015-16,2016-17,2017-18),欧洲联赛冠军可能有动力在冠军争夺赛中失去冠军杯冠军。
动态社会网络建模与分析教程。第二部分
原文标题: A Tutorial on Modeling and Analysis of Dynamic Social Networks. Part II
地址: http://arxiv.org/abs/1801.06719
作者: Anton Proskurnikov, Roberto Tempo
摘要: 近年来,填补社会网络分析(SNA)和控制理论之间的差距已经有了明显的趋势。通过引入描述社会群体动力学的新数学模型,数据分析算法和软件的发展,以及在理解复杂网络和多智能体系统(MAS)动力学方面取得巨大进展,这一趋势得以实现。本教程旨在强调控制理论的新篇章,处理社会网络的动态模型和流程,引起广泛研究界的关注。在第一部分[1]中,我们已经考虑了最经典的社会动态模型,这些模型预期并在很大程度上激发了最近对MAS和复杂网络的广泛研究。本文是本教程的第二部分,重点介绍了与MAS理论同时发展的更新的社会过程模型。还讨论了未来的社会和技术社会系统控制的观点。
我们如何自然地排序和组织图拉普拉斯特征向量?
原文标题: How can we naturally order and organize graph Laplacian eigenvectors?
地址: http://arxiv.org/abs/1801.06782
作者: Naoki Saito
摘要: 当试图为图和网络开发小波变换时,一些研究人员已经使用图拉普拉斯特征值和特征向量来替代傅立叶理论中的频率和复指数,用于欧几里德域中的正则格。然而,这个观点有一个根本的缺陷:在一般图上,拉普拉斯特征值不能被解释为相应特征向量的频率。在本文中,我们进一步讨论这个重要的问题,并提出一种新的方法来组织这些特征向量,通过定义和测量特征向量之间的“自然”距离,使用分裂最优运输理论,然后将得到的距离矩阵嵌入到一个低维欧几里德域进一步分组和组织这样的特征向量。我们使用合成图以及鼠标的视网膜神经节细胞的树状树来证明其有效性。
在优先连接图中恢复隐藏的社区
原文标题: Recovering a Hidden Community in a Preferential Attachment Graph
地址: http://arxiv.org/abs/1801.06818
作者: Bruce Hajek, Suryanarayana Sankagiri
摘要: 消息传递算法(MP)被导出用于恢复由Barab'{a} si-Albert优先附着模型的变体生成的图中的稠密子图。假定估计器知道顶点的到达时间或附着顺序。该算法的推导是基于独立性假设下的置信传播。分析消息传递算法的两个前兆:第一个是度量阈值(DT)算法,第二个是基于给定顶点的孩子(C)的到达时间的算法,其中给定顶点的孩子是连接到它的顶点。 C显著优于DT,显示了知道孩子的到达时间,而不仅仅是知道他们的数量是有益的。结果表明,对社区$ \ rho $中固定的顶点部分,每个到达顶点$ m $有固定数量的新边,以及社区$ \ beta $中顶点之间的固定相关性,的算法DT或C,或收敛为$ T \到\ infty。$
在线社会网络中身份盗窃检测的综合行为建模
原文标题: Composite Behavioral Modeling for Identity Theft Detection in Online Social Networks
地址: http://arxiv.org/abs/1801.06825
作者: Cheng Wang, Bo Yang
摘要: 在这项工作中,我们的目标是建立一个桥梁,从不良的行为数据到一个有效的,快速响应,强大的在线身份盗窃检测行为模型。我们专注于在线社会网络(OSN)中的这个问题,用户通常具有复合行为记录,包括多维低质量数据,例如脱机登记和在线用户生成内容(UGC)。作为一个有洞察力的结果,我们发现在用户行为模式建模中,记录的不同维度之间存在互补作用。为了深入挖掘这种互补效应,我们提出了一个联合模型来捕获用户复合行为的在线和离线功能。我们通过与两个真实世界数据集上的一些典型模型进行比较来评估所提出的联合模型:Foursquare和Yelp。在被广泛使用的盗窃模拟设置(通过行为替换模拟盗窃)中,实验结果表明,我们的模型优于现有的模型,AUC值分别是Foursquare 0.956 $和Yelp 0.947 $。特别是,在Foursquare中,召回率(True Positive Rate)可以达到65.3%,在Yelp中达到$ 72.2 \%$,相应的干扰率(假阳性率)低于$ 1 \%$。值得一提的是,这些性能可以通过每个认证只检查一个复合行为(同时访问一个地方并在线发布一个提示)来实现,这保证了我们方法的低响应延迟。这项研究将为网络安全社区提供新的见解,通过对用户的综合行为模式进行建模,是否以及如何改进实时在线身份认证。
用于定位隐私保护的伪装
原文标题: Artificial Impostors for Location Privacy Preservation
地址: http://arxiv.org/abs/1801.06827
作者: Cheng Wang, Zhiyang Xie
摘要: 定位服务的进展导致了对位置隐私泄漏的严重关注。为了有效和高效的位置隐私保护(LPP),现有的方法仍然不完全胜任。它们在带有辅助信息的识别攻击下经常是脆弱的,或者由于计算复杂度高而难以实施。在本文中,我们同时追求高保护效率和低计算复杂性。我们提出了一个基于伪造地点范例的可扩展LPP方法。为了使伪造的地点非常合理,我们通过合成\人造骗子{AIs}来伪造他们。 AI是指与实际轨迹具有相似语义特征的合成轨迹,并且不包含任何目标位置。设计了两种专门的技术:\ emph {基于采样的综合方法}和\ emph {人口级语义模型}。它们在综合AI的两个关键步骤中起着重要的作用。我们在两个城市(上海,中国和西班牙阿斯图里亚斯)的实际数据集上进行了实验,验证了所提方法的高效性和可扩展性。在这两个数据集中,实验结果表明,我们的方法实现了$ 97.65 \%$和$ 96.12 \%$的保存效率,其生成生成器的运行时间分别只有$ 230.47 $和$ 215.92 $秒。这项研究将为研究界提供新的见解,通过假冒地点提高最先进的LPP范例的实用性。
将社交媒体地理位置进行地理定位,以进行应急地图绘制
原文标题: Geolocating social media posts for emergency mapping
地址: http://arxiv.org/abs/1801.06861
作者: Barbara Pernici, Chiara Francalanci, Gabriele Scalia, Marco Corsi, Domenico Grandoni, Mariano Alfonso Biscardi
摘要: 演示将演示一个webGIS界面的功能,以支持自然灾害发生后的快速测绘活动,目标是向社交媒体提供附加信息给测绘运营商。本演示展示了E2mC H2020欧洲项目的首个成果,其目标是从现有的社交媒体资源中提取精确定位的信息,提供准确的地理定位功能,并从Twitter搜索的帖子开始,将社交媒体探索扩展到Flickr,YouTube和Instagram。
大规模灾害后二手车的公众情绪和需求:Facebook页面的社交媒体情感分析
原文标题: Public Sentiment and Demand for Used Cars after A Large-Scale Disaster: Social Media Sentiment Analysis with Facebook Pages
地址: http://arxiv.org/abs/1801.07004
作者: Yuya Shibuya, Hideyuki Tanaka
摘要: 大规模的灾难发生后,进行了各种分析民意的研究。然而,很少有研究关注社交媒体上的公众情绪与其在现实世界中人们活动的结果之间的关系。本文在2011年东日本大地震和海啸之后,利用Facebook Pages进行长期的情绪分析,旨在调查民众对水灾灾害地区民众的实际需求的相关性。此外,我们试图分析不同类型的灾害相关的交流是否在人们在现实世界中的活动中创造了不同类型的关系。我们的分析表明,地理信息相关的交流情绪可能受到受损地区内情绪的影响,与受损地区的二手车价格呈正相关关系。另一方面,灾害感兴趣者可能更多地受到影响,而在受损地区之外的灾害 - 利益 - 沟通情感则与二手车价格呈负相关。结果可以解释为,当人们开始恢复时,二手车价格上涨,因为他们的情绪变得更加积极。这项研究表明,对于长期的灾难恢复分析,我们需要考虑直接受到灾害影响的本地人和非直接受灾害影响的非本地人发布的在线交流的不同特征。
网上新闻馈送的多源社会反馈
原文标题: Multi-Source Social Feedback of Online News Feeds
地址: http://arxiv.org/abs/1801.07055
作者: Nuno Moniz, Luís Torgo
摘要: 由社交媒体平台的兴起引起的用户生成内容的大量涌现,使得信息检索,推荐系统,数据挖掘,机器学习等领域的研究兴起。但是,缺乏全面的基准数据集以进行彻底的评估比较已成为一个重要问题。在本文中,我们提出一个来自着名的聚合器,如谷歌新闻和雅虎新闻项目的大型数据集。新闻以及他们在多个平台上的社交反馈:Facebook,Google +和LinkedIn。所收集的数据涉及2015年11月至2016年7月的8个月期间,约4万个新闻项目,涉及四个不同的主题:经济,微软,奥巴马和巴勒斯坦。该数据集针对预测分析任务中的评估性比较而设计,尽管允许其他研究领域的任务,例如主题检测和跟踪,短文本中的情感分析,第一个故事检测或新闻推荐。
维基百科在学术界作为教学工具:从厌恶到积极的教师档案
原文标题: Wikipedia in academia as a teaching tool: from averse to proactive faculty profiles
地址: http://arxiv.org/abs/1801.07138
作者: Julià Minguillón, Eduard Aibar, Maura Lerga, Josep Lladós, Antoni Meseguer-Artola
摘要: 这项研究涉及维基百科作为高等教育课堂教学工具的积极使用,试图确定不同的使用情况和特征。西班牙巴塞罗那的加泰罗尼亚大学和庞培法布拉大学的所有全职和兼职教师都进行了问卷调查。调查问卷使用技术接受模型作为参考,其中包括关于教师的Web 2.0配置文件,维基百科的用法,专业知识,感知的有用性,易用性,可见性和质量,以及维基百科在同事之间的地位,积极。使用k-medoids算法进行聚类和统计分析,通过列联表和广义线性模型(logit)评估聚类之间的差异。受访者被分为四类,从较少到较可能在课堂上采用和使用维基百科,即厌恶(25.4%),不情愿(17.9%),公开(29.5%)和积极(27.2%)。积极的教师大多是在STEM领域兼职的男性,主要是工程学,而厌恶的教师大多是在非STEM领域全职教学的女性。尽管如此,与可见性,质量,形象,有用性和专业知识有关的问卷项目决定了集群之间的主要区别,而不是年龄,性别或领域。涉及维基百科正面观点的集群和至少一些使用频率明显多于那些有严格消极立场的集群。这违背了大多数教师对维基百科持怀疑态度的观点。学术文化和同事的意见等环境因素比教师的个人特征更重要,特别是他们对维基百科质量的看法。
一种新的多属性图的加权距离度量
原文标题: A Novel Weighted Distance Measure for Multi-Attributed Graph
地址: http://arxiv.org/abs/1801.07150
作者: Muhammad Abulaish, Jahiruddin
摘要: 由于复杂数据的指数级增长,图结构对于模拟各种实体及其交互作用变得越来越重要,许多有趣的应用包括生物信息学,社会网络分析等。根据数据的复杂性,底层图模型可以是一个简单的有向/无向和/或加权/未加权的图到一个复杂的图(也称为多属性图),其中顶点和边用多维向量标注。本文提出了一种基于加权欧几里德范数的加权距离度量,该加权距离度量既是顶点属性又是边属性的函数,可用于分类和聚类分析等各种图分析任务。所提出的距离度量具有灵活性以在计算顶点对之间的距离时增加/减小边标签的权重。我们还提出了MAGDist算法,该算法读取存储在包含顶点矢量和边矢量列表的CSV文件中的多属性图,并使用所提出的加权距离度量来计算每个顶点对之间的距离。最后,我们提出了一个多属性相似度图生成算法MAGSim,它读取MAGDist算法的输出,并生成一个可以使用分类和聚类算法进行分析的相似度图。在Iris和Twitter数据集上评估了所提出的距离度量和算法的重要性和准确性,发现由我们提出的方法产生的相似度图比现有的相似度图生成方法产生更好的聚类结果。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。