推荐系统的冷启动

问题定义

冷启动即新加入的user或item, 在 user-item 二部图中, 新节点的度是0, 所以针对它们如何推荐, 就称为冷启动问题.
包括 user,item 两部分的冷启动.

论文笔记

Addressing Cold Start for Next-song Recommendation, 这是RecSys2016 的一篇有关冷启动论文, 基于pairWise Factorization, 见[1].

motivation

Next-song Recommendation.

dataset

∣ U s e r ∣ = 28 k , ∣ S o n g ∣ = 124 k |User|=28k, |Song|=124k User=28k,Song=124k, 10 万播放记录.

符号与公式

因为数据是成pair的,(user,last-time song, next song) ,所以为 last-time item 和 item 各自准备了一个latent space。

P i , j u = m P^u_{i,j}=m Pi,ju=m, 为用户u的transition matrix,表示在用户u的播放序列中, 有过m次在播放完歌曲i后, 下一首播放了歌曲j.
C i , j u = 1 + α log ⁡ ( 1 + P i , j u ϵ ) C^u_{i,j}=1+\alpha \log(1+\frac{P^u_{i,j}}{\epsilon}) Ci,ju=1+αlog(1+ϵPi,ju), 从P转换得到的 confidence value.
A i ∈ R m A_i\in \mathbb R^m AiRm, audio features.
U u ∈ R k U_u\in \mathbb R^k UuRk, a user latent vector.
X i ∈ R k X_i\in \mathbb R^k XiRk, last-item latent vector.
Y i ∈ R k Y_i\in \mathbb R^k YiRk, item latent vector.
Ψ X ∈ R k × m \Psi^X \in \mathbb R^{k\times m} ΨXRk×m, Ψ Y ∈ R k × m \Psi^Y \in \mathbb R^{k\times m} ΨYRk×m learn a mapping matrix between audio feature space and the item latent space, for the last-time item and item , respectively.

proposed approach

推荐系统的冷启动_第1张图片

Adaptive Linear Mapping Model (ALMM).
在使用交替最小二乘法进行因式分解的同时(而不是之后), 去 learn mapped latent vectors. 这样的好处是 content feature 和 latent vectors 可以被结合的更紧密.
也就是说, 它通过同时挖掘 sequential behavior 和 content feature 来捕捉 content-based transition preference.

base approach

Oord:mapping matrix 在因式分解得到 latent vectors 之后去学习.

evaluation metrics

mean average precision(MAP),novelty,diversity,freshness, popularity.

参考

  1. RecSys2016,paper, Addressing Cold Start for Next-song Recommendation

你可能感兴趣的:(推荐系统)