在Spotify使用深度学习做音乐推荐(Recommending music on Spotify with deep learning)

August 05, 2014

这篇博客做的工作非常impressive,我花了陆陆续续大概一周之间将它翻译成中文。作者是比利时根特大学毕业,博士期间一直在做music information retrieval的工作,现在他是Deepmind的一名研究科学家。

前言

今年夏天,我在纽约Spotify实习,我的实习工作是使用卷积神经网络基于音乐内容做音乐推荐,在这篇博客中,我会解释我的方法和展示一些初步的结果。

Overview

这篇博客很长,这里提供一个博客各个部分的一些概览。如果你想跳过一些部分,直接在下面选择章节标题就可以到达。

  • 协同过滤

    非常简单的介绍一下协同过滤的优缺点

  • 基于内容的推荐

    当没有可用的数据时该如何做?

  • 使用深度学习来预测用户的偏好

    基于音乐音频信号的音乐推荐

  • 拓展部分

    我在Spotify训练的网络细节

  • 分析:卷积神经网络学到了什么?

    当使用很多音乐音频样本来训练卷积神经网络时,它学到了什么有关于音乐的东西?

  • 这项研究能够用来做什么?

    潜在的应用

  • 未来工作

  • 总结

Collaborative filtering

Spotify传统的音乐推荐非常依赖于协同过滤算法来提升推荐准确度。协同过滤的主要思想是从用户的历史行为数据决定用户的偏好。比如说,如果两个用户听了大量相同的歌曲,那么这两位用户的音乐品味可能是相似的,如果两首歌被相同的用户群体听过,那么这两首歌听起来也是相似的。这种信息能够用来做推荐

纯粹的协同过滤方法不使用任何和被推荐物品内容有关的信息,只使用和被推荐物品有关的消费行为信息,换句话说,这些信息是与被推荐物品内容无关的。这使得这种方法能够被广泛使用:同样的模型能够被用来推荐书,电影,音乐等。

不幸的是,这种方法也被证明有很大的缺陷。由于这种方法非常依赖于用户的行为数据,越流行的物品比不那么流行的物品会被更加容易被推荐,因为对于流行的物品来说,有更多的可用的用户行为数据。这个问题通常不是我们想遇到的。同样出于这个原因,推荐的物品可能让用户觉得无聊和重复的。

这种方法存在另外一个问题在因为推荐上尤为明显。那就是有着相似用户行为的物品往往内容却非常不相同(the heterogeneity of content with similar usage patterns)。比如说,用户可能一次收听一整张专辑,但是一张专辑也许包括intro tracks,outro tracks,interludes,cover songs,remixes。

但是最大的问题是新的和不流行的歌曲不能够被推荐,如果没有可用的用户行为数据分析,那么协同过滤算法就会失效。这也就是所谓的冷启动问题(cold-start problem ). 我们想要能够推荐刚刚发布的音乐作品,我们想要给用户推荐他们不知道的非常棒的乐队,想要完成这个目标,我们需要用不同的方法!

全文链接

作者语:
出于某种原因,我不想将本篇博客的完整内容放到CSDN上来。一个可能的原因是日后我写硕士论文如果使用了我翻译的这个博客内容,那么可能会被查重查到。不给自己挖坑,我只放了一部分在这里。

本篇文章转载前,请与我联系!!!!

你可能感兴趣的:(音乐推荐,深度学习,卷积神经网络,协同过滤,音乐信息检索,深度学习,翻译文章,音乐信息检索)