- 在线领域的贝叶斯社会影响;
- 比较特征提取方法和收入推断的预测用变量;
- 谁是电影宇宙的中心?使用Python和NetworkX解读影星社会网络;
- Twitter上谣言传播的信息扩散途径和识别;
- 计算批发及零售业数据交易市场的时空数据价值;
- MGA:网络的动量梯度攻击;
- 优化跨区医院分布减少结核病死亡;
- 社会困境中远离坏选择比接近好选择的结果更好;
- 展示社会物联网对社会方面影响的仿真模型;
- 网络表示学习用于链路预测:相比简捷启发式方法我们是否有改进?;
- 在线劳动力交易市场的公平团队构成算法;
- 用手机数据衡量城市移动性的空间子分割;
- 使用Facebook广告作为测量城乡差距的人口统计工具;
- 贪婪的限制:重新考虑无向网络的影响力最大化:;
- 区域边际价格的大幅波动;
在线领域的贝叶斯社会影响
原文标题: Bayesian Social Influence in the Online Realm
地址: http://arxiv.org/abs/1512.00770
作者: Przemyslaw A. Grabowicz, Francisco Romero-Ferrero, Theo Lins, Fabrício Benevenuto, Krishna P. Gummadi, Gonzalo G. de Polavieja
摘要: 我们的意见,我们喜欢或不喜欢哪些东西,取决于我们周围的人的意见。现在,我们是通过网上相识的意见,在网络平台的评论和评分表达的影响。在这里,我们执行与超过2500参与者小说“学术A / B测试”实验测量的这种影响的程度。在我们的实验中,参与者观察和评估在YouTube和Vimeo的镜面主体视频。我们控制所显示的每个这些视频下方的评论和评级。我们的研究表明,受试者从5 %可达 40 %采纳的意见表达陌生人的多数意见。使用贝叶斯定理,我们得到的社会影响力的车型,其中每个单独的形式后路意见随机以下Logit模型分析一个灵活的,可解释的家庭。我们的混合模型的变种,最大限度地提高赤池信息准则表示两个亚群,即非可影响的和可影响的个人。非可影响个人的意见之前,强烈与外部意见相关,具有低标准错误,而可影响个人的意见之前,具有高标准错误,并成为与因社会影响力的外部意见相关。我们的研究结果表明,意见是通过贝叶斯法则,其标准差与意见感应能力相关更新的随机变量。基于这些发现,我们讨论如何在在线领域阻碍舆论操纵和误导扩散。
比较特征提取方法和收入推断的预测用变量
原文标题: Comparison of Feature Extraction Methods and Predictors for Income Inference
地址: http://arxiv.org/abs/1811.05375
作者: Martin Fixman, Martin Minnoni, Carlos Sarraute
摘要: 手机通讯,再加上社会网络图和金融行为的信息的模式,让我们能够对用户的社会经济属性的推论,如他们的收入水平。这里,我们介绍手机使用(电话和邮件)几种方法来提取特征,并比较学习用作输入用户收入的推理功能,技术和台监督的机器的不同组合。我们的实验结果表明,基于该通信图贝叶斯方法优于使用的基于节点的特征标准的机器学习算法。
谁是电影宇宙的中心?使用Python和NetworkX解读影星社会网络
原文标题: Who is the Centre of the Movie Universe? Using Python and NetworkX to Analyse the Social Network of Movie Stars
地址: http://arxiv.org/abs/2002.11103
作者: Rhyd Lewis
摘要: 本文提供最初发表在谈话二月2020年的一篇文章中的技术细节的目的是利用中心地位的措施来分析电影明星的社会网络,从而确定在电影业最“重要”的角色。分析呈现在一步一步的,教程,喜欢时尚和品牌一起使用Python编程语言与NetworkX库。这表明,在网络中最核心的参与者是那些漫长的演艺生涯,如克里斯托弗·李,纳塞尔,萨库马里,迈克尔·凯恩,姆·普里,成龙和罗伯特·德尼罗。我们还提出了每一个十年的电影上映了类似的结果。这表明,自世纪之交最核心的参与者包括人喜欢安吉丽娜·朱莉,布拉曼南达姆,塞缪尔·杰克逊,纳塞尔和本·金斯利。
Twitter上谣言传播的信息扩散途径和识别
原文标题: An Information Diffusion Approach to Rumor Propagation and Identification on Twitter
地址: http://arxiv.org/abs/2002.11104
作者: Abiola Osho, Caden Waters, George Amariucai
摘要: 随着越来越多地使用在线社会网络为一体的新闻和信息来源,对于传闻广泛和迅速传播的倾向,造成了极大的关注,特别是在灾害情况下,用户不必使前有足够的时间,以事实为检查站明智的决定作出反应似乎是可信的一个职位。在这项研究中,我们通过探索微观级误传传播的动态探索传言Twitter上传播模式的基础上,潜消息和用户交互属性。我们执行的特征选择和预测的监督学习。与现实世界的数据集上的实验结果给出了模型的预测准确率在90 %的真假两主题的扩散。我们的研究结果证实,传闻级联运行更深,那个谣言掩盖新闻和消息煽动恐惧,会扩散比其他消息更快。我们发现,真假消息的传播模型显著不同,无论是在预测参数和支配扩散消息的功能。最后,我们表明,扩散模体是识别鸣叫信誉的重要指标。
计算批发及零售业数据交易市场的时空数据价值
原文标题: Computing the Value of Spatio-Temporal Data in Wholesale and Retail Data Marketplaces
地址: http://arxiv.org/abs/2002.11193
作者: Santiago Andres Azcoitia, Marius Paraschiv, Nikolaos Laoutaris
摘要: 时空的信息越来越多地用于推动智能交通,智能城市,人群传感应用过多。与此同时,不同类型的数据集市都提出了去提升摇臂式和货币化个人和企业数据。在本文中,我们研究在一定区域内,例如估算时空数据的批发和零售业数据集市卖了预测未来的需求为目的的相对值的问题一座城市。采用案例研究从芝加哥和纽约的出租车乘坐的大型数据集,我们提出这样的问题:“当它为不同的出租车公司感觉自己的数据结合起来?”和“应该如何不同的公司的数据补偿,他们分享的吗?”。然后,我们把注意力转移到建立由个别司机带到零售市场中的数据的价值更难的问题。总体而言,我们表明,简单的方法,比如假设数据,由公司或司机持有的价值正比于它的体积是不准确的,因为他们没有考虑到,可能不同的数据集之间存在复杂的互补性。为了解决这个问题,价值共享,从经济学和博弈论,如Shapley值需要更复杂的概念被用来捕获由他们带动预测算法的准确性混合数据集的效果。从许多来源运用Shapley值到大型数据集的计算挑战。我们使用结构化抽样克服这些挑战的可扩展性和管理,以准确计算的不同数据源的重要性,甚至当他们的编号范围数以千计,如在一个大都市的所有出租车司机的情况。
MGA:网络的动量梯度攻击
原文标题: MGA: Momentum Gradient Attack on Network
地址: http://arxiv.org/abs/2002.11320
作者: Jinyin Chen, Yixian Chen, Haibin Zheng, Shijing Shen, Shanqing Yu, Dan Zhang, Qi Xuan
摘要: 基于梯度信息对抗的攻击方法能充分找到扰动,也就是重连链路的组合,从而降低了深度学习模型基于图嵌入算法的有效性,但也容易陷入局部最优。因此,本文提出反对GCN模型,从而可以实现用更少的重连链路更具侵略性的攻击动量梯度攻击(MGA)。使用梯度信息直接更新原有网络中,动量项纳入迭代过程可以稳定更新方向,这使得模型跳差局部最优的出并提高该方法具有更强的转印性进行比较。基于三个著名的网络嵌入算法的节点分类和社区检测方法,实验结果表明,MGA有更好的攻击效果和转移性。
优化跨区医院分布减少结核病死亡
原文标题: Optimizing hospital distribution across districts for reducing tuberculosis fatalities
地址: http://arxiv.org/abs/2002.11324
作者: Mi Jin Lee, Kanghun Kim, Junik Son, Deok-Sun Lee
摘要: 多样化的设施空间分布通常理解的通勤距离或经济利益的优化方面。将更多的总目标函数为这样的优化框架可能是有用的,帮助决策,以满足不同的社会和经济需求。作为一个例子,我们考虑如何医院要分给结核病(TB)的总死亡人数减少。韩国显示了经验数据TB的在一个地区的死亡率与医院的面密度降低,这意味着它们的相关性,并通过调整跨区医院分布降低了全国范围内死亡的可能性。由病人的概率接近病死率没有去参观她的医院/他对时间段TB的住宅小区和评估随机行走框架后者的概率,我们得到病死率的指数函数医院密度与每个小区的有效晶格常数难能可贵的经验特征不变。这使我们发现其在区内的医院密度的最佳医院分布是重尺度患者密度的对数函数。总死亡是由13 %减少了与该最佳。从以不同的方式优化一个从分区到分区,这是在该模型的框架分析了当前医院的密度偏差。我们研究的假设和限制进行了讨论。
社会困境中远离坏选择比接近好选择的结果更好
原文标题: Leaving bads provides better outcome than approaching goods in a social dilemma
地址: http://arxiv.org/abs/2002.11468
作者: Zhilong Xiao, Xiaojie Chen, Attila Szolnoki
摘要: 个体迁移一直被视为合作在流动人口发展的重要因素。迁移的动机,但是,可以在很大程度上发散:一种是高度由开发者或叛逃者附近受挫,而其他踊跃搜索合作者配合。尽管这两种极端的态度是人类行为中观察到,但对健康的具体影响仍然未知。在这项工作中,我们提出了移动个人结合所提到的迁移喜好的方向驱动的迁移方法,并在二维公共物品博弈合作水平研究自己的角色。我们发现,合作可以在个人更倾向于从他们的瑕疵邻居逃跑离开来极大地促进。相反,合作不能有效地当一个人被更主动地接近他们的合作邻居保持。此外,具有随机移民相比,留下叛逃者运动可以更有效地促进合作。通过理论分析和数值计算的方法,我们进一步发现,当一个人只能选择从他们的缺陷邻居逃跑了,合作者和叛逃者之间的平均距离可以被放大,因此倒戈的自然入侵,可以有效地阻挡。我们的工作,因此,提供了不同的迁移喜好如何影响在空间上社交博弈的统一框架合作的发展进一步了解。
展示社会物联网对社会方面影响的仿真模型
原文标题: A Simulation Model Demonstrating the Impact of Social Aspects on Social Internet of Things
地址: http://arxiv.org/abs/2002.11507
作者: Kashif Zia
摘要: 除了无缝连接和机灵,在物联网(IOT)的互联网的对象应具备的社会功能 - 这些对象被称为``社交对象'。在本文中,这些对象之间的社会互动的直观的范式被认为和建模。对社会对象的交互模式的社会行为的影响进行了研究采取对等网络(P2P)的资源共享作为一个示例应用程序。本文研究的竞争与合作的社会范式的影响提出的,而同龄人试图达到共享资源/服务模型。仿真结果透露的同龄人的社会能力传授社交对象之间的交互的质量显著上升。通过基于主体的模拟研究,证明了战略合作比竞争策略更为有效。此外,与现实生活中的网络结构和流动性不会产生负面的所有系统的效率影响的托底的合作;而它帮助。
网络表示学习用于链路预测:相比简捷启发式方法我们是否有改进?
原文标题: Network Representation Learning for Link Prediction: Are we improving upon simple heuristics?
地址: http://arxiv.org/abs/2002.11522
作者: Alexandru Mara, Jefrey Lijffijt, Tijl De Bie
摘要: 网络表示学习已经成为一个活跃的研究领域,近年来随着许多新方法,展示上下游预测的任务,如链路预测它们的性能。尽管社会各界的努力,通过提供方法的实现,以确保研究的重复性,重要的问题仍然存在。该评估管道的设计选择丰富的复杂性导致了量化在该领域的进展情况,并确定了国家的最先进的困难。在这项工作中,我们分析了17网络嵌入方法7现实世界的数据集和发现,使用一致的评价管道,只是在最近几年薄进展。此外,许多嵌入方法是通过简单的启发式跑赢。最后,我们讨论的标准化评估工具如何修复这种情况,推动这一领域的进展。
在线劳动力交易市场的公平团队构成算法
原文标题: Algorithms for Fair Team Formation in Online Labour Marketplaces
地址: http://arxiv.org/abs/2002.11621
作者: Giorgio Barnabò, Adriano Fazzone, Stefano Leonardi, Chris Schwiegelshohn
摘要: 作为自由职业者的工作不断成长几乎无处不由于沟通成本急剧下降,并广泛基于互联网的交易市场的劳动力(例如,guru.com,feelancer.com,mturk.com,upwork.com),许多研究者和实践者已经开始探索外包和众包的好处。由于雇主经常使用这些平台找到一群工人来完成特定的任务,研究人员专注于团队的形成和匹配算法研究和有效的激励机制的设计,他们的努力。然而,就在最近,一些关注已经提出通过用于执行这些选择和匹配的程序算法引入可能不公平的偏见。为此,研究人员已经开始研究相关的这些在线市场算法的公平性,寻找智能的方法来克服算法的偏见频频出现。概括地说,其目的是保证,例如,通过使用机器学习算法和数据分析工具,雇佣工人的过程,而且一视同仁,即使是无意,国籍或性别的理由。在这短短的文章中,我们定义以下列方式交易会球队阵型问题:给定一个在线的劳动力市场,在这里每个工人拥有一个或更多的技能,并在所有的工人被分为两个或多个不重叠类(例子,男人和女),我们要设计一个算法,能够找到一个团队的所有完成特定任务所需的技能,并具有从所有类相同数量的人。我们提供了四个算法问题本身的公平球队阵型的问题一起inapproximability结果。我们还通过利用从网上劳动市场真实数据的实验测试了我们的算法解决方案的有效性。
用手机数据衡量城市移动性的空间子分割
原文标题: Measuring Spatial Subdivisions in Urban Mobility with Mobile Phone Data
地址: http://arxiv.org/abs/2002.11636
作者: Eduardo Graells-Garrido, Irene Meta, Feliu Serra-Burriel, Patricio Reyes, Fernando M. Cucchietti
摘要: 城市人口不断增长。到2050年,世界人口的三分之二将居住在城市地区。这一增长比城市来衡量的能力和计划的可持续性更快,更复杂。要了解是什么让一个城市的包容所有,我们定义了一个方法来识别和表征空间细分:地区与过度和代表性不足的特殊人群,分别热点和冷点命名的。使用聚合手机数据,我们采用这种方法来巴塞罗那市的评估三组人的流动性:妇女,老人和游客。我们发现,在三组中,冷点具有的设施和服务,比热点更低的多样性。此外,妇女和游客的冷点往往有较低的人口的收入。这些见解适用于巴塞罗那的流动人口,从而加强的包容性如何能够在城市待分析的范围。
使用Facebook广告作为测量城乡差距的人口统计工具
原文标题: Facebook Ads as a Demographic Tool to Measure the Urban-Rural Divide
地址: http://arxiv.org/abs/2002.11645
作者: Daniele Rama, Yelena Mejova, Michele Tizzoni, Kyriaki Kalimeri, Ingmar Weber
摘要: 在向城市化的全球性的举动,确保留在农村的人都没有在发展和政策考虑方面留下的是全球政府的工作重点。然而,越来越具有挑战性跟踪有关该稀疏,地理上分散的人口,导致缺乏可靠的,最新的最新数据的重要的统计信息。在这项研究中,我们研究了Facebook的广告平台,它提供了超过两百亿其用户的数字“普查”,在衡量潜在的城乡不平等的有效性。我们专注于意大利,大约30%的人口生活在农村地区的国家。首先,我们表明,人口统计数据,Facebook的产生来自全国各地的时间和人口稀少的城市覆盖面不全的不稳定性受到影响。为了克服这种限制,我们提出了估计Facebook广告的观众,近三倍,从19%的农村乡镇,以55%的覆盖范围,使可行的细粒度亚群分析的替代方法。用官方的全国人口普查数据,我们评估的方法,并确认受教育程度和收入方面称为显著城乡鸿沟。扩展分析,Facebook的用户专门的“利益”和行为,我们提供进一步的见解上的分歧,例如,发现农村地区显示出赌博更高的利息。值得注意的是,我们发现,在农村收入的最有预测功能,从那些城市中心不同,这表明研究人员需要检查农村福利时要考虑属性的范围更广。这项研究的结果说明改进现有的工具和方法,包括在数字人口统计研究代表性不足的群体的必要性 - 未能这样做可能会导致误导性意见,结论,以及最重要的政策。
贪婪的限制:重新考虑无向网络的影响力最大化:
原文标题: Limitations of Greed: Influence Maximization in Undirected Networks Re-visited
地址: http://arxiv.org/abs/2002.11679
作者: Grant Schoenebeck, Biaoshuai Tao, Fang-Yi Yu
摘要: 我们认为影响最大化问题(选择网络在ķ种子最大化预期的总影响),线性阈值模型下的无向图。在一方面,我们证明了贪心算法总是实现了(1 - (1 - 1 / K)^ K + 欧米茄(1 / K ^ 3)) - 逼近,显示出贪婪算法稍微好一点呢上无向图比通用(1-(1 - 1 / K)^ k)的结合这也适用于向图。在另一方面,我们表明在此结合是通过呈现一个例子不可能其中贪婪算法可以至多获得(1-(1-那实质性的改进 - 1 / K)^ K + O(1 / K ^ 0.2 ))近似。这个结果鲜明对比的独立级联模型的前期工作。像线性阈值模型,贪心算法获得(1-(1-1 / K)^ k)的 - 近似上在独立级联模型有向图。然而,卡纳和Lucier表明,在无向图中,贪婪算法执行基本上更好:一个(1-(1-1 / K)^ K + C个)近似为常数 C> 0 。我们的结果显示,令人惊奇地,没有这样的改进线性阈值模型发生。最后,我们显示,线性阈值模型下,近似比(1 - (1 - 1 / K)^ k)的或者是紧如果1)的曲线被引导2)的顶点进行加权。换句话说,根据以下两种设置,贪婪算法不能达到(1 - (1 - 1 / K)^ K + F(k))的 - 近似为任意正函数 F(k)的。在设置2中的结果)再次处于形成了鲜明对比卡纳和Lucier的(1 - (1 - 1 / K)^ K + C个) - 为对独立级联模型,近似的结果,其中的(1 - (1- - 1 / K)^ K + C个)近似保证可以扩展到其中的顶点进行加权设置。我们还讨论扩展到更广义的设置,包括那些边加权图表。
区域边际价格的大幅波动
原文标题: Large Fluctuations in Locational Marginal Prices
地址: http://arxiv.org/abs/2002.11680
作者: Tommaso Nesti, John Moriarty, Alessandro Zocca, Bert Zwart
摘要: 本文研究中所引起的挥发可再生能源发电型材能源批发市场的节点边际价格(LMP的)的大的波动。具体地,我们研究了形式 mathbb P 大的事件( mathbf LMP notin prod_ I = 1 ^ N [ alpha_i ^ - , alpha_i ^ +] 大),其中 mathbf LMP 是在 N 电网的节点,和 boldsymbol 阿尔法的LMP的矢量^ - , boldsymbol 阿尔法 ^ + 在 mathbb R ^ N 是价格阈值指定不希望的价格发生的载体。通过利用在电网供需匹配机制的结构,我们看的LMP为确定性分段仿射,随机输入过程中可能不连续的功能,造型不可控的可再生能源发电。我们利用从大偏差理论技术来确定最有可能的途径极端价格暴涨的情况发生,并且排名电网的节点在他们经历了价格上涨的可能性方面。我们的研究结果,导出在高斯波动的情况下,并且在IEEE 14节点测试用例数值验证。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。