搜索推荐系统的最佳实践:深入解析MovieLens电影评分数据集(数据构成、处理逻辑等)

搜索推荐系统的最佳实践:深入解析MovieLens电影评分数据集(数据构成、处理逻辑等)

MovieLens 是一个关于电影评分的数据集,里面包含了从 IMDB(The Movie DataBase)得到的用户对电影的评分信息,经常被用来做推荐系统、机器学习算法的测试数据集。

网站的数据集主要分两部分,

  • 一是用于推进最新研究进展的数据集,当前最新的是发布于2021年12月份的1.8GB数据集和2019年12月发布的25MB数据集。

  • 二是用于高校、组织科研的数据集。该类数据集2018年9月分为小型1MB数据集和全量335MB数据集。

主页:MovieLens

下载:Index of /datasets/movielens

搜索推荐系统的最佳实践:深入解析MovieLens电影评分数据集(数据构成、处理逻辑等)_第1张图片

搜索推荐系统的最佳实践:深入解析MovieLens电影评分数据集(数据构成、处理逻辑等)_第2张图片

1.MovieLens-1MB 数据集简介

你可能感兴趣的:(搜索推荐系统专栏,人工智能,自然语言处理,搜索推荐,推荐系统,特征离散化,推荐算法,大数据)