- GhostLink:影响感知推荐的潜在网络推理;
- 超图中的放置命中集恢复;
- 基于面部嵌入匹配不同社会网络的用户档案;
- 检测越南语垃圾营销评论;
- BuSCOPE:“实时”智能城市服务的个人和聚合移动行为融合;
- 配水管网的动态稳定性;
- 在有偏见的现实世界中推荐梦想工作;
- 科学家流动网络:分析科学职业的时间相关性;
- 计算社会经济学;
- 走廊障碍物中行人躲避行为的实验研究;
- VICSOM:来自社交媒体的虚拟线索用于心理评估;
- GMNN:图马尔可夫神经网络;
GhostLink:影响感知推荐的潜在网络推理
原文标题: GhostLink: Latent Network Inference for Influence-aware Recommendation
地址: http://arxiv.org/abs/1905.05955
作者: Subhabrata Mukherjee, Stephan Guennemann
摘要: 社交影响在塑造用户在线社区中的行为方面发挥着至关重要的作用,这些社区处理电影,食品和啤酒等精美品味。对于在线推荐,这意味着用户的偏好和评级会受到其他人的影响。只考虑用户的时间戳评论,我们能否找出谁影响谁,以及潜在影响网络的特征?我们可以使用此网络来改进推荐吗?虽然社交意识推荐中的先前工作通过考虑观察到的用户社会网络来利用社交互动,但是诸如Amazon,Beeradvocate和Ratebeer的许多社区没有明确的用户-用户链接。因此,我们建议GhostLink(一种无监督的概率图模型)自动学习评论社区潜在的影响网络:只给出用户帖子及其内容的时间痕迹(时间戳)。基于对包含1300万条评论的四个真实数据集的大量实验,我们证明GhostLink比不考虑这种影响的最先进方法提高了大约23%的项目推荐。作为附加用例,我们表明GhostLink可用于区分用户的潜在偏好和受影响的偏好,以及根据学习的影响图检测有影响的用户。
超图中的放置命中集恢复
原文标题: Planted Hitting Set Recovery in Hypergraphs
地址: http://arxiv.org/abs/1905.05839
作者: Ilya Amburg, Jon Kleinberg, Austin R. Benson
摘要: 在各种应用领域中,通过测量涉及一些特定核心节点集的交互来收集网络数据。这导致包含核心节点的网络数据集以及可能更大的边节点集合,所有这些边节点都具有与核心节点的至少一个交互。在许多情况下,这种类型的数据产生于比图更丰富的结构,因为它们涉及更大集合的相互作用;例如,核心节点可能是受监视的一组个体,我们观察至少一个核心个体的会议参加者。我们使用超图来模拟这样的场景,我们研究核心恢复的问题:如果我们观察超图而不是核心和边节点的标签,我们能否在超图中恢复“种植”的核心节点集?我们为分析这样一组核心节点的恢复提供了理论框架,并利用我们的理论开发了一种实用且可扩展的核心恢复算法。我们的分析和算法的关键在于核心节点是超图的命中集,这意味着每个超边界在核心节点集中至少有一个节点。我们证明了我们的算法在许多真实世界数据集上的有效性,优于从网络中心性和核心边界度量得出的竞争基线。
基于面部嵌入匹配不同社会网络的用户档案
原文标题: User profiles matching for different social networks based on faces embeddings
地址: http://arxiv.org/abs/1905.06081
作者: Timur Sokhin, Nikolay Butakov, Denis Nasonov
摘要: 如今,通常的做法是将多个社会网络用于不同的社交角色。尽管如此,这些网络在内容类型,通信和语音风格方面存在差异。如果我们打算将人类行为理解为推荐系统,银行风险评估或社会学研究的关键特征,那么最好使用来自不同社交媒体的数据组合来实现。在本文中,我们基于嵌入公共用户的面部照片,提出了一种新的社交媒体用户配置文件匹配方法,并对其效率进行了实验研究。我们的方法对于某些社交媒体的内容和风格的变化是稳定的。
检测越南语垃圾营销评论
原文标题: Detecting Vietnamese Opinion Spam
地址: http://arxiv.org/abs/1905.06112
作者: T.H.H Duong, T.D. Vu, V.M. Ngo
摘要: 最近,越南自然语言处理已经由学术和商业专家研究。但是,现有的论文只关注信息分类或从文档中提取。如今,随着电子商务网站,论坛和社会网络的快速发展,产品,人员,组织或奇迹成为网络社区的评论或评论的目标。很多人经常使用这些评论来做出决定。然而,有许多人或组织使用评论来误导读者。因此,有必要在评论中检测这些不良行为。在本文中,我们研究了这个问题,并提出了一种检测越南语评论是垃圾邮件或非垃圾邮件的适当方法。我们的方法的准确性高达90%。
BuSCOPE:“实时”智能城市服务的个人和聚合移动行为融合
原文标题: BuSCOPE : Fusing Individual & Aggregated Mobility Behavior for "Live" Smart City Services
地址: http://arxiv.org/abs/1905.06116
作者: Lakmal Meegahapola, Thivya Kandappu, Kasthuri Jayarajah, Leman Akoglu, Shili Xiang, Archan Misra
摘要: 虽然对城市通勤数据的分析有很长的历史,可以提供有关人类流动行为的有用见解,但这种分析主要以线下方式进行,并有助于中长期城市规划。在这项工作中,我们展示了对实时移动数据应用预测分析的能力,特别是新加坡数百万公共巴士通勤者的智能卡生成的旅行数据,以创建两个新颖的“现场”智能城市服务。我们工作中的关键分析新颖性在于将城市交通的两个方面结合起来:(a)整合:反映沿公交线路的乘客总量流的可预测性;(b)规律性:捕捉每个人的重复旅行模式通勤。我们证明了这两种行为测量的融合可以使用我们的BuScope平台在城市规模上进行,并可用于创建两个创新的智能城市应用。最后一英里需求发电机为邻近公交车站的下机乘客提供O(分钟)预测;通过将个体水平规律性与总体水平一致性巧妙地结合起来,它在预测这种下船方面达到了85%以上的准确率。通过主动移动无人驾驶车辆以满足这一预测需求,我们可以减少乘客下车的等待时间超过75%。独立地,邻居事件检测器使用当前运行的公共汽车的异常值测量来检测和空间定位动态城市事件,提前1.5小时,具有450米的定位误差。
配水管网的动态稳定性
原文标题: Dynamical stability of water distribution networks
地址: http://arxiv.org/abs/1905.06132
作者: Naoki Masuda, Fanlin Meng
摘要: 配水网络是液压基础设施,旨在满足各个节点的用水需求。水流过网络中的管道,在网络上产生非线性动态。配水网络的一个理想特征是对系统的故障和其他冲击的高抵抗力。这种威胁至少会瞬时改变各种管道中的流速,从而潜在地减轻整个配水系统的功能。在这里,我们对非线性动力系统进行线性稳定性分析,表示通过管道的流速,管道通过任意管网与储层和消费者节点相互连接。我们证明了稳态始终是局部稳定的,并且开发了一种计算特征值的方法,该特征值对应于向平衡衰减最慢的模式,我们将其用作系统弹性的指标。我们表明,所提出的指数与管网的恢复率正相关,这是从一个现实的,工业上流行的模拟器得出的。目前的分析框架有望用于将工具从非线性动力学和网络分析部署到配水网络的设计,弹性管理和情景测试。
在有偏见的现实世界中推荐梦想工作
原文标题: Recommending Dream Jobs in a Biased Real World
地址: http://arxiv.org/abs/1905.06134
作者: Nadia Fawaz
摘要: 机器学习模型学习我们教他们学习的东西。机器学习是推荐系统的核心。如果机器学习模型是针对有偏差的数据进行训练的,则得到的推荐系统可以反映其推荐中的偏差。在推荐系统的不同阶段产生偏差,从数据中的现有社会偏差(如专业性别差距)到数据收集或建模过程引入的偏差。这些偏差影响推荐系统的各种组件的性能,从离线培训到评估和在线提供生产系统中的建议。特定技术可以帮助减少推荐系统的每个阶段的偏差。减少我们的推荐系统中的偏见对于成功向全球数亿成员推荐梦想工作至关重要,同时忠于LinkedIn的愿景:“为全球员工的每一位成员创造经济机会”。
科学家流动网络:分析科学职业的时间相关性
原文标题: The Mobility Network of Scientists: Analyzing Temporal Correlations in Scientific Careers
地址: http://arxiv.org/abs/1905.06142
作者: Giacomo Vaccario, Luca Verginer, Frank Schweitzer
摘要: 为了理解科学家的流动模式,我们结合了两个大型书目数据集来揭示科学家的地理“职业轨迹”及其时间属性。每个轨迹在个人层面上包含有关机构,城市和国家的信息以及科学家在那里度过的时间。通过汇总各个职业轨迹,我们重建了科学家运动的世界网络,其中节点代表城市以及链接的入口和出口。我们通过度,局部聚类系数,路径长度和邻居连通性来表征该网络的拓扑属性。然后,通过使用多阶图模型,我们分析了科学家在国家,城市和机构层面的职业轨迹的时间相关性。我们发现,从静态网络的角度来看,城市和国家层面的科学家运动可以正确建模,因为在这些聚合水平上没有统计上显著的时间相关性。相反,在隶属层面,我们发现科学家的职业轨迹中的时间相关性很重要。这意味着,科学家职业生涯中的记忆效应会影响他们的下一个联系。我们证明可以使用二阶网络正确捕获这些相关性,其中节点表示两个不同从属关系之间的移动。记忆效应仅在最低聚合水平即机构中可检测到的发现意味着这是分析重定位决策决定因素的最合适水平。
计算社会经济学
原文标题: Computational Socioeconomics
地址: http://arxiv.org/abs/1905.06166
作者: Jian Gao, Yi-Cheng Zhang, Tao Zhou
摘要: 揭示社会经济系统的结构和及时估计社会经济地位对经济发展具有重要意义。对社会经济过程的理解为量化全球经济发展,绘制区域产业结构和推断个人社会经济地位提供了基础。在这篇综述中,我们将简要介绍一个名为计算社会经济学的新的跨学科研究领域,然后详细介绍数据资源,计算工具,数据驱动方法,理论模型和多种分辨率的新应用,包括全球量化。经济不平等和复杂性,区域产业结构和城市感知图,个人社会经济地位和人口统计的估计,以及紧急事件的实时监测。这篇综述以及我们强调的开创性工作将引起越来越多的跨学科关注,并引发未来社会经济研究的方法论转变。
走廊障碍物中行人躲避行为的实验研究
原文标题: Experimental study on the evading behavior of individual pedestrians when confronting with an obstacle in a corridor
地址: http://arxiv.org/abs/1905.06173
作者: Xiaolu Jia, Claudio Feliciani, Daichi Yanagisawa, Katsuhiro Nishinari
摘要: 本文采用对照实验对受一个障碍物影响的个体行人的躲避行为进行深入分析。傅里叶变换的结果表明,随着障碍物宽度的增加,人体摇摆的频率和幅度几乎不受影响,而行走方向的侧向偏差将大大增加。一方面,已经说明了提取的步态特征之间的关系,包括身体摇摆,步幅,频率和速度。另一方面,行走方向可以以三个关键回避点为特征,其中可以观察到行走方向的明显变化。高斯函数已被用于拟合行走方向,从而允许估计三个临界点并检查它们随障碍物大小的增加而变化。此外,还分析了直接间接逃避和左右转弯偏好以及背后可能存在的心理动机。结果表明,直接行走的行人具有较高的行走效率,右转行人具有较强的行为“直接”倾向。本文的结果有望为受障碍物影响的行人动力学建模提供实际依据。
VICSOM:来自社交媒体的虚拟线索用于心理评估
原文标题: VICSOM: VIsual Clues from SOcial Media for psychological assessment
地址: http://arxiv.org/abs/1905.06203
作者: Mohammad Mahdi Dehshibi, Gerard Pons, Bita Baiani, David Masip
摘要: 在社交网站(SNS)中共享多模式信息(通常是图像,视频或文本)占据了我们时间的相关部分。用户在SNS中展示自己的特定方式可以提供有用的信息来推断人类行为。本文提出使用从Instagram账户收集的多模态数据来预测格拉瑟选择理论中描述的感知原型需求。贡献是双重的:(i)我们根据Glasser的理论,提供了由专家心理学家根据每个感知行为注释的Instagram公共简介(超过30,000张图像和文字说明)的大型多模式数据库,以及(ii)我们建议自动化用户对(无意识的)感知需求的认识。特别地,我们提出了使用三种不同特征集的基线:基于像素图像的视觉描述符(SURF和Visual Bag of Words),基于使用卷积神经网络的自动场景描述的高级描述符,以及基于文本的描述符(从处理用户提供的字幕获得的Word2vec)。最后,我们提出这些描述符的多模式融合,在多标签分类问题中获得有希望的结果。
GMNN:图马尔可夫神经网络
原文标题: GMNN: Graph Markov Neural Networks
地址: http://arxiv.org/abs/1905.06214
作者: Meng Qu, Yoshua Bengio, Jian Tang
摘要: 本文研究了关系数据中的半监督对象分类,这是关系数据建模中的一个基本问题。在统计关系学习(例如关系马尔可夫网络)和图神经网络(例如图卷积网络)的文献中已经广泛研究了该问题。统计关系学习方法可以通过条件随机场有效地模拟对象标签对集体分类的依赖性,而图神经网络通过端到端训练学习有效的对象表示。在本文中,我们提出了结合两个世界的优点的图马尔可夫神经网络(GMNN)。 GMNN利用条件随机场对对象标签的联合分布进行建模,可以使用变分EM算法对其进行有效训练。在E步骤中,一个图神经网络学习有效的对象表示以近似对象标签的后验分布。在M步骤中,使用另一个图神经网络来模拟局部标签依赖性。对象分类,链接分类和无监督节点表示学习的实验表明,GMNN实现了最先进的结果。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。