movielens 第7页

RDD转换为DataFrame

RDD转换为DataFrame今天在使用spark处理movielens数据集时，由于要在数据集中添加一列，所以不能直接读取数据集生成DataFrame,需要在生成DataFrame之前预处理一下数据集添加一列

Dillon2015·2017-03-29 19:22

羽恒·2017-02-26 18:54

基于用户的协同过滤算法原理分析及代码实现

我所采用的数据集：MovieLens数据集ml-100k。先进行原理分析，再讲代码实现。

Flying_sfeng·2017-02-18 15:14

Spark ALS推荐系统简单例子(python)

采用MovieLens100k数据集http://files.grouplens.org/datasets/movielens/ml-100k.zip#-*-coding:utf-8-*-#spark-submitmovie_rec.pyfrompysparkimportSparkConf

walk walk·2016-11-30 10:53

用pandas探索Movielens数据集

数据集：本文用的是Movielensml-100k.zip本文为译文，原文链接：Let’sbegin1.数据集情况，#u.user文件中为user_id，age，occupation，zip_code，格式如下：#u.data文件中为user_id，movie_id，rating，unix_timestamp，格式如下：#u.item文件中为movie_id，title,release_date,

蓁蓁尔·2016-11-21 21:52

Matlab以特殊分隔符写入txt（dlmwrite）

clcclearallload('E:\RSWeb\mahoyt数据集\movielens\u.data');dlmwrite('E:\RSWeb\mahoyt数据集\movielens\newdata.txt

weixin_34202952·2016-11-14 11:00

用pandas分析百万电影数据

numpy、matplotlib.安装pandas(Linux,Mac,Windows皆同)：pipinstallpandas电影数据来源：http://grouplens.org/datasets/movielens

xiaopihaierletian·2016-11-03 20:20

我来做数据--如何对数据进行处理以满足机器学习技术(一)：MovieLens数据

标签（空格分隔）：数据分析python数据挖掘MovieLens1M数据集一组从20世纪90年末到21世纪初由MovieLens用户提供的电影评分数据。

我是小居居·2016-10-29 21:20

我来做数据--如何对数据进行处理以满足机器学习技术(一)：MovieLens数据

标签（空格分隔）：数据分析python数据挖掘MovieLens1M数据集一组从20世纪90年末到21世纪初由MovieLens用户提供的电影评分数据。

我是小居居·2016-10-29 21:20

推荐系统实践学习笔记（二）：代码实现

写在前面：今天基于Movielens数据集把《推荐系统实践》上的部分算法实现了一下，顺便巩固python和pandas库的使用，发现书本上的代码有很多不靠谱之处（也许是我水平不够），所以基本都是自己写的

Cherrie3·2016-10-08 15:39

推荐系统实践学习笔记（二）：代码实现

写在前面：今天基于Movielens数据集把《推荐系统实践》上的部分算法实现了一下，顺便巩固python和pandas库的使用，发现书本上的代码有很多不靠谱之处（也许是我水平不够），所以基本都是自己写的

Cherrie3·2016-10-08 15:39

bitcarmanlee·2016-09-27 21:30

学习python出现的问题_读取表格分界符不对

这是做的O’Relly的一个开篇练习，尝试利用http://grouplens.org/datasets/movielens/上的关于影评数据的dataset做的一个分析。

Aukuno·2016-06-14 13:46

用pandas分析百万电影数据

numpy、matplotlib.安装pandas(Linux,Mac,Windows皆同)：pipinstallpandas电影数据来源：http://grouplens.org/datasets/movielens

Royecode·2016-05-29 17:00

用 Mahout 和 Elasticsearch 实现推荐系统

Thistutorialwillgivestep-by-stepinstructionsonhowto:使用的电影评分数据位于http://grouplens.org/datasets/movielens

船长&CAP·2016-05-24 10:00

用 Mahout 和 Elasticsearch 实现推荐系统

Thistutorialwillgivestep-by-stepinstructionsonhowto:使用的电影评分数据位于http://grouplens.org/datasets/movielens

船长&CAP·2016-05-24 10:00

Spark中组件Mllib的学习11之使用ALS对movieLens中一百万条（1M）数据集进行训练，并对输入的新用户数据进行电影推荐

KeepLearningBigData·2016-05-17 22:48

Spark中组件Mllib的学习11之使用ALS对movieLens中一百万条（1M）数据集进行训练，并对输入的新用户数据进行电影推荐

bob601450868·2016-05-17 22:00

Spark中组件Mllib的学习10之修改MovieLens来对movieLen中的100k数据进行预测

KeepLearningBigData·2016-05-17 21:19

Spark中组件Mllib的学习10之修改MovieLens来对movieLen中的100k数据进行预测

bob601450868·2016-05-17 21:00

SVD建模

madman188·2016-04-25 11:00

NMF 非负矩阵分解(Non-negative Matrix Factorization)实践

qq_26225295·2016-04-16 01:28

利用Python进行数据分析---ch02《MovieLens 1M数据集(下)》读书笔记

page：30-39页#coding=UTF-8importpandasaspd'''利用python的切片语法，通过查看每个DataFrame的前几行验证一下数据加载工作是否一切顺利'''unames=['user_id','gender','age','occupation','zip']users=pd.read_table('c:/pytm/ch02/ml-1m/users.dat',se

Txiaomiao·2016-03-11 09:48

利用Python进行数据分析---ch02《MovieLens 1M数据集(上)》读书笔记

Page：21-29页#coding=UTF-8importjsonfromcollectionsimportdefaultdictfromcollectionsimportCounterfrompandasimportDataFrame,Seriesimportpandasaspdimportnumpyasnpfrommatplotlibimportpylab,mlab,pyplotfrompy

Txiaomiao·2016-03-08 21:45

Top-N Recommendation——基于电影（Item）的推荐

注:1.数据集来源MovieLens2.源代码在末尾附上一、Introduction无论是在实体商店还是在网络上，都会有Top-N推荐的情况。基于客户或者基于商品做出推荐。

woshimalingyi·2016-03-04 12:00

Top-N Recommendation——基于用户的推荐实验

注：1.数据集来源MovieLens2.源代码在末尾附上一、Introduction大家无论是在实体商店还是在网络上，都会有Top-N推荐的情况。基于客户或者基于商品做出推荐。

woshimalingyi·2016-03-04 12:00

Rating Prediction——评分预测小结

注：1.数据集合来源自MovieLens2.末尾附上源代码一、Introduction现在，各大网络购物平台的购物都会有评分机制，商家要给用户推荐其满意的商品，就需要了解用户的行为，基于用户行为进行分析

woshimalingyi·2016-03-04 11:00

Spark机器学习读书笔记-CH03

3.1.获取数据:wgethttp://files.grouplens.org/datasets/movielens/ml-100k.zip 3.2.探索与可视化数据:In[3]: user_data=

littlesuccess·2016-01-24 17:00

SparkR数据分析

(如果你在终端输入sparkR运行成功的话就证明你成功了)如果还没有配置成功的话,参考这里,安装SPARK只需三步1.下载示例数据MovieLens100k数据集它包含了用户和电影信息,以及10万次用户对电影的评价

a358463121·2016-01-20 16:00

使用Python找出历史上5星好评数最多的50部电影，基于MovieLens20M数据集

shihui512·2016-01-18 20:00

协同过滤算法python实现简单入门详细注释

基于Python2.7数据集为MovieLens100k数据集 #-*-coding=utf-8-*- importsys importmath fromtexttableimportTexttable

shihui512·2016-01-18 19:00

用Python计算MovieLens 100k数据集中男性女性用户评分的标准差

要求：计算MovieLens100k数据集中男性女性用户评分的标准差并输出。

然后咧·2015-12-18 17:04

Spark机器学习3

3.Spark上数据的获取、处理与准备3.1获取公开数据集MovieLens数据集：包含表示多个用户对多部电影的10万次评级数据，也包含电影元数据和用户属性信息。

jjfnjit·2015-11-18 17:00

·2015-11-12 23:51

协同过滤算法 R/mapreduce/spark mllib多语言实现

用户电影评分数据集下载http://grouplens.org/datasets/movielens/1)Item-Based,非个性化的，每个人看到的都一样2)User-Based，个性化的，每个人看到的不一样对用户的行为分析得到用户的喜好后

jethai·2015-11-05 15:07

协同过滤算法 R/mapreduce/spark mllib多语言实现

用户电影评分数据集下载http://grouplens.org/datasets/movielens/1)Item-Based,非个性化的，每个人看到的都一样2)User-Based，个性化的，每个人看到的不一样对用户的行为分析得到用户的喜好后

jethai·2015-11-05 15:07

周涛：利用协同标签，解决冷启动问题

例如，用户在美味书签（Del.icio.us）上使用的标签表示了用户对收藏书签的喜好程度；在电影评分网站(MovieLens.

·2015-10-21 11:46

kaggle-电影评分预测从零开始

reallocing1·2015-07-11 18:00

acdreamers·2015-06-03 18:30

电影数据集总结：Netflix、MovieLens、LDOS-CoMoDa、AdomMovie

数据集：1.Netflix描述：包含Netflix上48万多个随机选取的匿名用户，对于1万7千多部电影的1兆多个电影评分时间：1988.10~2005.11内容：包括trainingset，movietitles，probeset，qualifyingset等文件。Trainningset包含4个特征值：电影ID、用户ID、评分（1~5）、日期；Movietitles包含3个特征值：电影ID、上映

icbc_zackchan·2015-03-10 18:48

从item-base到svd再到rbm，多种Collaborative Filtering(协同过滤算法)从原理到实现

（本文所用测试数据是movielens100k）本文采用的评测标准是RMSE，数值越小算法越好，

wenyusuran·2014-10-31 10:00

hive查询导出到hdfs，hive，file

.; insert overwrite [local] directory '/data/movielens/100k/output/

blackproof·2014-10-28 20:00

hive查询导出到hdfs，hive，file

.; insert overwrite [local] directory '/data/movielens/100k/output/

blackproof·2014-10-28 20:00

[Hadoop]使用Hadoop进行ReduceSideJoin

这是基于老的API的实现，这种方法并不高效简洁数据：（原始数据可以从movielens-1m里面去要，这里将原始数据进行了简单的修改方便演示与

RangerWolf·2014-09-24 17:00

[Mahout] 第一个小实验：使用GroupLens进行推荐模型的检验

注：内容参考至《Mahout实战》根据mahout实战里面的内容，接下来将使用grouplens提供的movielens-1m的数据进行推荐。

RangerWolf·2014-07-06 15:00

跳舞的驴子·2014-06-03 16:24

推荐频道

movielens

RDD转换为DataFrame

采用亲和性分析方法推荐电影

基于用户的协同过滤算法原理分析及代码实现

推荐系统系列---基于movielens数据集的KNN算法与矩阵分解算法比较

推荐系统研究常用数据库

Spark ALS推荐系统简单例子(python)

用pandas探索Movielens数据集

Matlab以特殊分隔符写入txt（dlmwrite）

用pandas分析百万电影数据

我来做数据--如何对数据进行处理以满足机器学习技术(一)：MovieLens数据

我来做数据--如何对数据进行处理以满足机器学习技术(一)：MovieLens数据

推荐系统实践学习笔记（二）：代码实现

推荐系统实践学习笔记（二）：代码实现

最简单的推荐系统实践

学习python出现的问题_读取表格分界符不对

用pandas分析百万电影数据

用 Mahout 和 Elasticsearch 实现推荐系统

用 Mahout 和 Elasticsearch 实现推荐系统

Spark中组件Mllib的学习11之使用ALS对movieLens中一百万条（1M）数据集进行训练，并对输入的新用户数据进行电影推荐

Spark中组件Mllib的学习11之使用ALS对movieLens中一百万条（1M）数据集进行训练，并对输入的新用户数据进行电影推荐

Spark中组件Mllib的学习10之修改MovieLens来对movieLen中的100k数据进行预测

Spark中组件Mllib的学习10之修改MovieLens来对movieLen中的100k数据进行预测

SVD建模

NMF 非负矩阵分解(Non-negative Matrix Factorization)实践

推荐系统学习06-LensKit

利用Python进行数据分析---ch02《MovieLens 1M数据集(下)》读书笔记

利用Python进行数据分析---ch02《MovieLens 1M数据集(上)》读书笔记

Top-N Recommendation——基于电影（Item）的推荐

Top-N Recommendation——基于用户的推荐实验

Rating Prediction——评分预测小结

推荐系统个人理解（实践部分）

Spark机器学习读书笔记-CH03

SparkR数据分析

使用Python找出历史上5星好评数最多的50部电影，基于MovieLens20M数据集

协同过滤算法python实现简单入门详细注释

用Python计算MovieLens 100k数据集中男性女性用户评分的标准差

Spark机器学习3

各个领域著名的推荐系统

协同过滤算法 R/mapreduce/spark mllib多语言实现

协同过滤算法 R/mapreduce/spark mllib多语言实现

周涛：利用协同标签，解决冷启动问题

kaggle-电影评分预测从零开始

SlopOne推荐算法

电影数据集总结：Netflix、MovieLens、LDOS-CoMoDa、AdomMovie

从item-base到svd再到rbm，多种Collaborative Filtering(协同过滤算法)从原理到实现

hive查询导出到hdfs，hive，file

hive查询导出到hdfs，hive，file

[Hadoop]使用Hadoop进行ReduceSideJoin

[Mahout] 第一个小实验：使用GroupLens进行推荐模型的检验

电影推荐系统的建模