ACM(国际计算机学会)主办的推荐系统专场(Recsys)是推荐系统圈子的顶级会议,从 2007 年开始,至今已经十年,这十年中每年都有
Tutorial 公布,本文整理出来,可以一探推荐系统的业界和学界兴趣点的迁移。
本年度并没有公开的 Tutorial,但从会议收录的文章主题,可以看到本届会议重点讨论的话题是:隐私和信任,协同过滤
作者:Robin Burke (DePaul University)
主题:关于推荐系统的健壮性,主要有:对推荐模型的攻击种类,量化分析攻击产生的影响,推荐算法替代方案,留住用户的信任,对攻击方的检测。
关键词:健壮性,推荐系统安全
作者:Yehuda Koren (Bell Labs)
主题:以 Netflix Prize 比赛为主线,回顾了协同过滤相关算法的前世今生。同时,强调推荐系统是一个多目标优化的系统,所以也对多种效果评价指标做了对比。
关键词:协同过滤,多目标优化,效果评价
作者:Gedas Adomavicius (University of Minnesota) and Alex Tuzhilin (NYU)
主题:传统推荐系统致力于给用户找出相关的物品,但是仅仅是这样已经不够了,现在(注意这时候是 2008 年)需要根据当时所在时间和位置给出更合适宜的推荐,比如旅行推荐。这就是所谓考虑上下文信息或者说场景的推荐系统。
关键词:场景信息
作者:John Riedl (University of Minnesota), John Sanders (Netflix) and Todd Beaupre (Yahoo!)
主题:回顾了个人在从事推荐系统研究过程中所遇到的挑战:透明度,EE 问题,防沉迷,兴趣迁移,长短期兴趣融合,读懂用户行为的含义,效果评价。
关键词:透明度,EE 问题,效果评价。
作者:Asim Ansari (Columbia University)
主题:关于在推荐系统建模中的贝叶斯身影。
关键词:贝叶斯
作者:Jennifer Golbeck (University of Maryland)
主题:在推荐系统中引入社交关系以增强推荐结果的信任度,从而提升推荐系统的效果。
关键词:社交推荐,信任度
作者:Guy Shani
主题:关于如何评价推荐系统的问题,分为在线和离线两部分。分别详细降到了离线阶段如何模拟用户行为做一个实验,在现阶段如何做一个实验,并讨论了用户研究、用户体验等泛技术领域话题。
关键词:效果评价
作者:Joseph A. Konstan
主题:介绍人机交互概念、技术,讨论推荐系统中关于交互设计的影响。
关键词:人机交互
作者:Ricardo Baeza-Yates
主题:查询意图是搜索引擎的技术范畴,但用户明确提交一个查询本身就反映了非常明确的用户需求和兴趣,所以本人就探讨了查询意图识别在推荐系统中的应用。同时,还在搜索中尝试了相关搜索推荐。
关键词:查询意图,搜索引擎
作者: Òscar Celma (BMAT) and Paul Lamere (The Echo Nest)
主题:回顾总结了在线音乐应用的推荐系统原理,挑战,以及那些可能用于在未来(站在 2011 年)提升音乐推荐系统效果的技术。
关键词:音乐推荐
作者:Neil Hurley (UCD)
主题:讨论推荐系统的攻击,列举了近十年来(站在 2011 年)真实发生的推荐系统攻击案例,总结其中的特点,为了更好的加强推荐系统的健壮性。
关键词:健壮性,推荐系统安全
作者:Daniel Tunkelang (LinkedIn)
主题:把推荐系统看成是用户和信息获取平台之间的对话通道,会是什么样的情形?
关键词:人机交互,对话系统
作者:Bart Knijnenburg (UC Irvine)
主题:我们一直以来就是聚焦于离线阶段用量化的指标去评价推荐系统的算法效果,但是如何去评价用户体验呢?用户体验是主观的,毕竟我们无法知道每个人内心的感受。本文主要讨论推荐系统中如何考虑用户体验。
关键词:用户体验,效果评价
作者: Maria Augusta S. N. Nunes (UF Sergipe) Rong Hu (EPFL)
主题:介绍了人这种非理性动物在做决策时的个性因素,及其对推荐系统的启发,把“个性化”和“推荐系统”放在一起考量,同时介绍了实现个性化的推荐系统需要哪些关键技术,以及会遇到哪些挑战。
关键词:个性化
作者:Xavier Amatriain (Netflix)
主题:这是当时的 Netflix 算法总监(现在已经是 Quora 主管工程的副总裁)总结的工业级推荐系统经验。推荐系统每年的论文层出不穷,但如何才能在自己的商业系统中将其落地,是很多人关心的头等大事,对此本文总结了若干要点。可扩展性,低延迟等工业级系统的要求要考虑,模型方面,除了准确性,还有新鲜度,新奇度,透明度也是工业级推荐系统要考虑的。以 Netflix 的生产系统为例将这些问题做了逐一梳理。
关键词:工业级
作者:Alan Said (TU Berlin), Domonkos Tikk (Gravity) and Andreas Hotho (U Wurzburg)
主题:近年来组织的推荐系统相关比赛很多,以 Netflix Prize, KDD Cup 为典型代表,这些比赛为推荐系统领域贡献了很多优秀的开发经验,那么到底赢得一场这样的比赛有哪些关键点要做好呢?本文就此讨论了一番。
关键词:推荐系统比赛,最佳实践
作者: Martin Ester (Simon Fraser University, Canada)
主题:社交信息可以为推荐系统带来贡献,这几乎是共识,但到底带来什么贡献?怎么带来贡献?为冷启动问题贡献用户个人信息,是一个典型的应用。社交网络上的好友推荐也是个典型应用。未来有哪些方向可以尝试或者挑战?把社交网络看成一个分布式网络,P2P 网络,以及如何保护隐私的问题。
关键词:社交网络
作者: Alexandros Karatzoglou (Telefonica Research, Spain), Linas Baltrunas (Telefonica Research, Spain) & Yue Shi (Delft University of Technology, Netherlands)
主题: 本文讨论排序模型在推荐系统的应用,现有模型的优劣区别,未来的可能发展方向。
关键词:LTR,排序模型
作者:Luiz Augusto Pizzato (University of Sydney, Australia) & Anmol Bhasin (LinkedIn, USA)
主题:关于社交网络推荐系统,不只是建立社交关系那么简单。本文深入讨论了这个问题,首先描述了经典方法如链接分析和协同过滤方法,接着深入讨论了诸如相互作用,基于用户之间的社交图谱的好友推荐,内容来自作者在 LinkedIn 的第一线工作内容。
关键词:社交网络
作者: Alexis Tsoukiàs (Université Paris Dauphine, France) & Paolo Viappiani (Université Pierre et Marie Curie, France)
主题:关于用户偏好研究。用户偏好不止是推荐系统的研究对象,它是很多其他领域的关注点:博弈论,决策论等。文中还讨论了在推荐系统中,用户偏好如何学习和融合。
关键词:用户偏好
作者:Xavier Amatriain (Netflix Inc., USA)
主题:本文回顾了 Netflix Prize 比赛用均方根误差简化了推荐系统的问题,实际上一个现代的商业推荐系统中,还要考虑:个性化排序,相似度,推荐解释,场景信息(上下文信息),和搜索引擎的结合。还回顾了一些重要的推荐模型,Factorization Machines, Restricted Boltzmann Machines, SimRank, Deep Neural Networks, Listwise Learning-to-rank。
关键词:工业级,场景信息
作者:Huiji Gao, Jiliang Tang, and Huan Liu (Arizona State University, USA)
主题:移动互联网的崛起,推荐系统可以接入的数据更多,应对的场景更丰富,上传地理位置,随时随地在社交网络上分享内容,这些都可以引入到社交推荐中了。本文从数据挖掘的角度去介绍当这些数据引入后有哪些新的尝试。
关键词:社交网络,地理位置
作者:Ivan Cantador (Universidad Autónoma de Madrid, Spain) and Paolo Cremonesi (Politecnico di Milano, Italy)
主题:社交电商中,用户提供的信息是跨领域的。用户在不同系统中产生的反馈,填写的资料可以互相交叉使用,尤其是:解决冷启动问题得到更好的推荐效果,解决数据稀疏问题得到更好的用户模型。本文针对跨领域的推荐系统,分别从用户建模、推荐系统、机器学习等角度讨论了这一问题。
关键词:跨领域,冷启动
作者:Ido Guy (Yahoo! Labs) and Werner Geyer (IBM Research)
主题:本文是全面梳理社交网络推荐系统的一篇综述性 Tutorial。
关键词:社交网络
作者:Alan Said (Recorded Future, Sweden) and Alejandro Bellogín (Universidad Autónoma de Madrid, Spain)
主题:推荐系统的效果评价一直是受多种因素影响的,尤其是对比两个推荐模型更不是那么容易。本文为你展示了一种非常清晰明了的方式来评价推荐系统结果,这个方式的特点是:可比较、可复现、无偏。
关键词:效果评价
作者:Frank Hopfgartner (University of Glasgow, UK), Benjamin Kille (TU Berlin, Germany), Tobias Heintz (plista GmbH, Germany) and Roberto Turrin (ContentWise, Italy)
主题:基于流式数据的实时推荐系统如何离线评价?如何做 AB 对照试验?本文讨论了这两个问题。
关键词:实时推荐,效果评价,ABtest
作者:Joaquin A. Delgado (Verizon, US) and Diana Hu (Verizon, US)
主题:典型的搜索和推荐都有两个阶段,召回和排序。所以整合了机器学习的搜索引擎也可以用于推荐系统,本文介绍了一个开源框架,ML-Score,一个深度整合 ElasticSearch 的插件,用于替换 ES 默认的排序机制,而代之以机器学习排序,模型可以用 Spark Weka R 训练得到。
关键词:搜索引擎,ElasticSearch
作者:Harald Steck (Netflix Inc., US), Roelof van Zwol (Netflix Inc., US) and Chris Johnson (Spotify Inc., US)
主题:有一种推荐系统,介于主动搜索和被动推送之间,就是交互式推荐系统,它的特点是用户不断对推送结果给予明确反馈,从而引导推荐系统朝自己希望的方向推荐结果。这是一个 EE 平衡的问题。本文针对音乐推荐(Spotify)和视频推荐(Netflix),根据用户研究和 AB 对照试验结果,讨论这种推荐系统的方方面面。
关键词:Explore&Exploit 问题,交互式推荐
作者:Xavier Amatriain (Quora, USA) and Deepak Agarwal (LinkedIn, USA)
主题:本文是 Quora 的工程副总裁根据自己在 Netflix 和 Quora 的实践总结出来的十条经验。
关键词:工业级
作者:Panagiotis Symeonidis (Aristotle University, Greece)
主题:推荐系统中有很多矩阵分解方法,本文用一个统一的例子带你逐一分析这些矩阵分解方法。
关键词:降维,矩阵分解
作者:Ido Guy (Yahoo Research, Israel) and Luiz Pizzato (Commonwealth Bank of Australia, Australia)
主题:本文介绍了社交网络中最常见的推荐系统“可能感兴趣的人”“你可能想关注”。
关键词:社交网络
作者:Ludovico Boratto (University of Cagliari, Italy)
主题:通常推荐系统都是针对单个用户的,那么针对一个群体的推荐系统该怎么做呢?有哪些不同?该如何评价?本文讨论的就是针对群体的推荐系统。
关键词:群推荐
作者:Bart Knijnenburg (Clemson University, USA) and Shlomo Berkovsky (CSIRO, Australia)
主题:推荐系统对数据是贪婪的,但是用户隐私保护也很重要。如何保护隐私,本文从架构、算法、策略相关、UI 设计等角度探讨了这一话题。
关键词:用户隐私
作者: Markus Schedl (Johannes Kepler University Linz, Austria), Peter Knees (Vienna University of Technology, Austria) and Fabien Gouyon (Pandora Inc., USA)
主题:音乐推荐早已经不再是简单的内容推荐或者协同推荐能满足得了听众的了,如今在线音乐推荐的是一种收听体验。简单说就是一种序列推荐,情境推荐,而不简单是某一首歌推荐得“精准”。本文介绍了学术界和工业界对现在音乐推荐提出的解决方案,主要包括:播单生成,情境推荐,音乐制作时的推荐。
关键词:音乐推荐,工业级
作者:Alexandros Karatzoglou (Telefonica Research, Spain) and Balázs Hidasi (Gravity R&D, Hungary)
主题:本文介绍了深度学习在推荐系统的应用,如 RNN,CNN;使用了深度学习的基于内容推荐和协同推荐是什么样的。
关键词:深度学习
作者:Muthusamy Chelliah (Flipkart, India) and Sudeshna Sarkar (IIT Kharagpur, India)
主题:电商中用户评价用于推荐系统非常常见,本文介绍了电商推荐系统中对用户评价的使用,涉及到文本挖掘,情感分析,话题模型,词向量学习。
关键词:NLP
作者: Róbert Pálovics (Hungarian Academy of Sciences, Hungary), Domokos Kelen (Hungarian Academy of Sciences, Hungary) and András A. Benczúr (Hungarian Academy of Sciences, Hungary)
主题:如今的推荐系统早已经不再是周期性计算出推荐结果后再呈现给用户的时代了,在线学习,实时或者准实时捕捉用户的反馈非常必要。但是相应的工程门槛也不低,本文手把手教你如何利用开源工具搭建在线学习系统用于实时推荐系统中。
关键词:实时推荐
历时十年,有几个话题是一直都存在的:
健壮性及推荐系统安全问题
从学术到工业级别的推荐系统的跨越问题
推荐系统的效果评估问题
如何使用更多的数据以及用户隐私的权衡问题
用户建模
下面这些产品是 Resys 中最常聊到的推荐系统落地场景:
在线视频
社交网络
在线音乐
电商网站
在这十年里,真正落地到工业界产生效果的算法和技术基本上围绕下面这些方向:
协同过滤
矩阵分解
深度学习
NLP
ACM 的推荐系统专场这十年汇集了全球顶级的 Resyser,他们把各自在工作中研究中碰到的问题,得到的经验毫无保留分享出来,非常值得尊敬和感谢。
但另一方面,我们要在自己的应用中落地实践这些又不是那么简单,中间存在一定的鸿沟需要跨过,毕竟路要一步一步走出来。
希望大家能在自己的产品中“大吉大利,每天吃鸡”。
转载自 https://zhuanlan.zhihu.com/p/34083992?group_id=952098886127419392