使用文本卷积神经网络,并使用MovieLens数据集完成电影推荐的任务。https://grouplens.org/datasets/movielens/
https://zhuanlan.zhihu.com/p/32078473
https://blog.csdn.net/yfren1123/article/details/79194064
GroupLens Research已从MovieLens网站(http://movielens.org)收集并提供了评级数据集。根据数据集的大小,在不同的时间段内收集数据集。在使用这些数据集之前,请查看其自述文件以获取使用许可和其他详细信息。
寻求许可?如果您有兴趣获得使用MovieLens数据集的许可,请首先阅读README文件中包含的使用条款。然后,请填写此表格以请求使用。我们通常不允许公共分发(如果您担心可用性,请参阅Kaggle以获得替代下载位置)。
推荐用于新研究
MovieLens 25M数据集
MovieLens 25M 电影分级。 稳定的基准数据集。2500万个收视率和100万个标签应用程序由162,000名用户应用于62,000部电影。包括在1,129个标签中具有1500万相关分数的标签基因组数据。已发行12/2019
README.txt
ml-25m.zip(大小:250 MB,校验和)
永久链接:https : //grouplens.org/datasets/movielens/25m/
推荐用于教育和发展
MovieLens最新数据集
这些数据集将随着时间而变化,不适用于报告研究结果。对于自动下载,我们将保持稳定的下载链接。我们不会存档或提供以前发布的版本。
小型:100,000个分级和3,600个标签应用程序被600个用户应用于9,000部电影。上次更新时间9/2018。
README.html
ml-latest-small.zip (大小:1 MB)
完整版:280,000名用户将27,000,000个评级和1,100,000个标签应用程序应用于58,000部电影。包括在1,100个标签中具有1400万相关分数的标签基因组数据。上次更新时间9/2018。
README.html
ml-latest.zip (大小:265 MB)
固定链接:https : //grouplens.org/datasets/movielens/latest/
综合数据集
MovieLens 1B综合数据集
MovieLens 1B是一个合成数据集,它从ML-20M的2,000万个实际分级中扩展而来,并支持MLPerf分发。请注意,这些数据以.npz文件的形式分发,您必须使用python和numpy进行读取。
自述文件
ml-20mx16x32.tar(3.1 GB)
ml-20mx16x32.tar.md5
扩展算法的代码可以在这里找到:https : //github.com/mlperf/training/tree/master/data_generation
要创建上面的数据集,我们运行了算法(使用提交1c6ae725a81d15437a2b2df05cac0673fde5c3a4),如README中“推荐基准的运行说明”部分所述。
永久链接:https : //grouplens.org/datasets/movielens/movielens-1b/
较旧的数据集
MovieLens 100K数据集
MovieLens 100K 电影分级。 稳定的基准数据集。1000位用户观看1700部电影时获得100,000个评分。4/1998发布。
README.txt
ml-100k.zip(大小:5 MB,校验和)
解压缩文件的索引
固定链接:https : //grouplens.org/datasets/movielens/100k/
MovieLens 1M数据集
MovieLens 1M 电影分级。 稳定的基准数据集。6000个用户观看4000部电影时获得100万个评分。发布2/2003。
README.txt
ml-1m.zip(大小:6 MB,校验和)
永久链接:https : //grouplens.org/datasets/movielens/1m/
MovieLens 10M数据集
MovieLens 10百万 电影评级。 稳定的基准数据集。1000万个分级和100,000个标签应用程序被72,000个用户应用于10,000部电影。发行了1/2009。
README.txt
ml-10m.zip(大小:63 MB,校验和)
永久链接:https : //grouplens.org/datasets/movielens/10m/
MovieLens 20M数据集
MovieLens 20M 电影分级。 稳定的基准数据集。2000万个分级和465,000个标签应用程序由138,000个用户应用于27,000部电影。包括在1,100个标签中具有1200万相关分数的标签基因组数据。2015年4月发布;已更新10/2016,以更新links.csv并添加标签基因组数据。
README.txt
ml-20m.zip(大小:190 MB,校验和)
另请参阅MovieLens 20M YouTube预告片数据集,以获取MovieLens电影与YouTube上托管的电影预告片之间的链接。
永久链接:https : //grouplens.org/datasets/movielens/20m/
MovieLens标签基因组数据集
从应用于10,000部电影的1,100个标签池中计算出1,100万个标签-电影相关性得分。已发布3/2014。
还可以考虑使用MovieLens 20M或最新的数据集,其中也包含(较新的)标签基因组数据。
README.html
tag-genome.zip (大小:41 MB)
永久链接:https : //grouplens.org/datasets/movielens/tag-genome/