Paper Reading@csdl: embedding of Airbnb

paper:

目的:推荐house给客户,要使得客户喜欢,并且,房东要接受该用户(时间,偏爱的客户类型匹配)

细分目的:短期推荐(当客户点击了一个listing之后给他推荐相似的listing,最好属于同一个market),长期推荐(一个用户一年只用两三次,很稀疏,且订的房间属于不同market,cross market 应该如何推荐)

embedding 思想:一个序列中,相依出现的元素,相似度应该高,embedding的结果应该相似

方法:1、给listing做embedding,给定所有的点击序列(序列划分方法:30分钟内得连续点击或者booked了算一个序列),word2vec的办法,来给listing做embedding 特殊技巧:负采样,booked listing作为全局context,加入loss,然后,同一个市场(地方)的集合中选一些负样本,冷启动问题:根据基本的特征,选三个去平均来init

2、给user_type和listing_type做embedding,根据基本特征,分出user_type和listing_type的几个类别,给这些类别embedding,这个场景下只用booked listing,这样,就有(user_type,listing_type)序列(只针对一个用户而言),就可以按照上面的办法给type embedding,如此一来,客户的type可能随时间变化的问题可以解决,对于用户当前的user_type,选出cosine距离最小的listing_type给他推荐就好了。

技巧:loss里面加入reject的序列

你可能感兴趣的:(paper,reading)