冷启动即新加入的user或item, 在 user-item 二部图中, 新节点的度是0, 所以针对它们如何推荐, 就称为冷启动问题
.
包括 user,item 两部分的冷启动.
Addressing Cold Start for Next-song Recommendation, 这是RecSys2016 的一篇有关冷启动论文, 基于pairWise Factorization, 见[1].
Next-song Recommendation.
∣ U s e r ∣ = 28 k , ∣ S o n g ∣ = 124 k |User|=28k, |Song|=124k ∣User∣=28k,∣Song∣=124k, 10 万播放记录.
因为数据是成pair的,(user,last-time song, next song) ,所以为 last-time item 和 item 各自准备了一个latent space。
P i , j u = m P^u_{i,j}=m Pi,ju=m, 为用户u的transition matrix,表示在用户u的播放序列中, 有过m次在播放完歌曲i后, 下一首播放了歌曲j.
C i , j u = 1 + α log ( 1 + P i , j u ϵ ) C^u_{i,j}=1+\alpha \log(1+\frac{P^u_{i,j}}{\epsilon}) Ci,ju=1+αlog(1+ϵPi,ju), 从P转换得到的 confidence value.
A i ∈ R m A_i\in \mathbb R^m Ai∈Rm, audio features.
U u ∈ R k U_u\in \mathbb R^k Uu∈Rk, a user latent vector.
X i ∈ R k X_i\in \mathbb R^k Xi∈Rk, last-item latent vector.
Y i ∈ R k Y_i\in \mathbb R^k Yi∈Rk, item latent vector.
Ψ X ∈ R k × m \Psi^X \in \mathbb R^{k\times m} ΨX∈Rk×m, Ψ Y ∈ R k × m \Psi^Y \in \mathbb R^{k\times m} ΨY∈Rk×m learn a mapping matrix between audio feature space and the item latent space, for the last-time item and item , respectively.
Adaptive Linear Mapping Model (ALMM).
在使用交替最小二乘法进行因式分解的同时(而不是之后), 去 learn mapped latent vectors. 这样的好处是 content feature 和 latent vectors 可以被结合的更紧密.
也就是说, 它通过同时挖掘 sequential behavior 和 content feature 来捕捉 content-based transition preference.
Oord:mapping matrix 在因式分解得到 latent vectors 之后去学习.
mean average precision(MAP),novelty,diversity,freshness, popularity.