Real-time Personalization using Embeddings for Search Ranking at Airbnb

今天偷个懒,介绍一篇之前看过觉得很不错的paper。

本文最早于 2018 年 5 月 13 日发表(原文链接),主要介绍了机器学习的嵌入技术在 Airbnb 爱彼迎房源搜索排序和实时个性化推荐中的实践。Airbnb 爱彼迎的两位机器学习科学家凭借这项技术的实践获得了 2018 年 KDD ADS track 的最佳论文(论文链接),本文即是对这篇论文的精华概括。

详细的中文翻译https://zhuanlan.zhihu.com/p/43295545已经介绍得非常详细了,我就不赘述了。

用w2v来解决一些无监督的聚类和相似计算问题实际工作中也用过,记得刚出来的时候还有朋友diss了这篇文章,觉得这么简单的思路还能拿最佳论文。但是,这篇文章给我了不少收获和感触:

  • 自己定义优化函数来融合自己的特性进行embedding
    • 使用最终预订的房源作为全局上下文,这个应该是对一个用户的session来说的
    • 负采样也用了更合适的方式适配聚集搜索的情况
  • 冷启动做了近似
  • 离线和在线做了很多的验证的工作,表明embedding确实是带来了效果,这点非常重要,对于调整超参数来说离线就能完成,效率会比线上ab高很多。
  • session有个定义,是30分钟的连续点击
  • 用线上用户的行为日志来离线评估embedding好坏的方法,有点类似用ndcg的指标。

你可能感兴趣的:(Real-time Personalization using Embeddings for Search Ranking at Airbnb)