E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
movielens
RDD转换为DataFrame
RDD转换为DataFrame今天在使用spark处理
movielens
数据集时,由于要在数据集中添加一列,所以不能直接读取数据集生成DataFrame,需要在生成DataFrame之前预处理一下数据集添加一列
Dillon2015
·
2017-03-29 19:22
机器学习
spark
采用亲和性分析方法推荐电影
5.在http://grouplens.org/datasets/
movielens
/获取100万数据的
Movielens
数据集。6.利用pandas加载数据加载数据7.稀疏数据格
羽恒
·
2017-02-26 18:54
基于用户的协同过滤算法原理分析及代码实现
我所采用的数据集:
MovieLens
数据集ml-100k。先进行原理分析,再讲代码实现。
Flying_sfeng
·
2017-02-18 15:14
Python
推荐系统
推荐系统系列---基于
movielens
数据集的KNN算法与矩阵分解算法比较
理论部分1.隐因子模型的推荐算法:使用奇异值分解或者随机梯度下降等方法将用户的评分矩阵分解为用户和产品的特征矩阵;2.提出一种对推荐效果新的评估方法:3.
Movielens
数据集:(1)100k,包括1000
hehuanlin123
·
2017-02-14 10:49
推荐系统
推荐系统研究常用数据库
推荐系统学术研究常用的数据集包括:
MovieLens
,
MovieLens
数据集中,用户对自己看过的电影进行评分,分值为1~5。
MovieLens
包括两个不同大小的库,适用于不同规模的算法。
baoyan2015
·
2016-12-05 17:30
Spark ALS推荐系统简单例子(python)
采用
MovieLens
100k数据集http://files.grouplens.org/datasets/
movielens
/ml-100k.zip#-*-coding:utf-8-*-#spark-submitmovie_rec.pyfrompysparkimportSparkConf
walk walk
·
2016-11-30 10:53
数据挖掘
python
spark
用pandas探索
Movielens
数据集
数据集:本文用的是Movielensml-100k.zip本文为译文,原文链接:Let’sbegin1.数据集情况,#u.user文件中为user_id,age,occupation,zip_code,格式如下:#u.data文件中为user_id,movie_id,rating,unix_timestamp,格式如下:#u.item文件中为movie_id,title,release_date,
蓁蓁尔
·
2016-11-21 21:52
python相关
Matlab以特殊分隔符写入txt(dlmwrite)
clcclearallload('E:\RSWeb\mahoyt数据集\
movielens
\u.data');dlmwrite('E:\RSWeb\mahoyt数据集\
movielens
\newdata.txt
weixin_34202952
·
2016-11-14 11:00
matlab
用pandas分析百万电影数据
numpy、matplotlib.安装pandas(Linux,Mac,Windows皆同):pipinstallpandas电影数据来源:http://grouplens.org/datasets/
movielens
xiaopihaierletian
·
2016-11-03 20:20
python
我来做数据--如何对数据进行处理以满足机器学习技术(一):
MovieLens
数据
标签(空格分隔):数据分析python数据挖掘
MovieLens
1M数据集一组从20世纪90年末到21世纪初由
MovieLens
用户提供的电影评分数据。
我是小居居
·
2016-10-29 21:20
我来做数据--如何对数据进行处理以满足机器学习技术(一):
MovieLens
数据
标签(空格分隔):数据分析python数据挖掘
MovieLens
1M数据集一组从20世纪90年末到21世纪初由
MovieLens
用户提供的电影评分数据。
我是小居居
·
2016-10-29 21:20
推荐系统实践学习笔记(二):代码实现
写在前面:今天基于
Movielens
数据集把《推荐系统实践》上的部分算法实现了一下,顺便巩固python和pandas库的使用,发现书本上的代码有很多不靠谱之处(也许是我水平不够),所以基本都是自己写的
Cherrie3
·
2016-10-08 15:39
数据挖掘
推荐系统实践学习笔记(二):代码实现
写在前面:今天基于
Movielens
数据集把《推荐系统实践》上的部分算法实现了一下,顺便巩固python和pandas库的使用,发现书本上的代码有很多不靠谱之处(也许是我水平不够),所以基本都是自己写的
Cherrie3
·
2016-10-08 15:39
数据挖掘
最简单的推荐系统实践
我们将使用
MovieLens
数据集,它是在实现和测试推荐引擎时所使用的最常见的数据集之一,包含来自943个用户以及精选的1682部电影的评分。
bitcarmanlee
·
2016-09-27 21:30
ml
algorithm
学习python出现的问题_读取表格分界符不对
这是做的O’Relly的一个开篇练习,尝试利用http://grouplens.org/datasets/
movielens
/上的关于影评数据的dataset做的一个分析。
Aukuno
·
2016-06-14 13:46
python
DataAnaly
用pandas分析百万电影数据
numpy、matplotlib.安装pandas(Linux,Mac,Windows皆同):pipinstallpandas电影数据来源:http://grouplens.org/datasets/
movielens
Royecode
·
2016-05-29 17:00
数据分析
python
pandas
用 Mahout 和 Elasticsearch 实现推荐系统
Thistutorialwillgivestep-by-stepinstructionsonhowto:使用的电影评分数据位于http://grouplens.org/datasets/
movielens
船长&CAP
·
2016-05-24 10:00
用 Mahout 和 Elasticsearch 实现推荐系统
Thistutorialwillgivestep-by-stepinstructionsonhowto:使用的电影评分数据位于http://grouplens.org/datasets/
movielens
船长&CAP
·
2016-05-24 10:00
Spark中组件Mllib的学习11之使用ALS对
movieLens
中一百万条(1M)数据集进行训练,并对输入的新用户数据进行电影推荐
更多代码请见:https://github.com/xubo245/SparkLearning1解释spark-1.5.2数据集:http://grouplens.org/datasets/
movielens
KeepLearningBigData
·
2016-05-17 22:48
MLlib
Spark中组件Mllib的学习11之使用ALS对
movieLens
中一百万条(1M)数据集进行训练,并对输入的新用户数据进行电影推荐
更多代码请见:https://github.com/xubo245/SparkLearning1解释spark-1.5.2数据集:http://grouplens.org/datasets/
movielens
bob601450868
·
2016-05-17 22:00
spark
movielen
Spark中组件Mllib的学习10之修改
MovieLens
来对movieLen中的100k数据进行预测
更多代码请见:https://github.com/xubo245/SparkLearning1解释数据下载:http://files.grouplens.org/datasets/
movielens
/
KeepLearningBigData
·
2016-05-17 21:19
MLlib
Spark中组件Mllib的学习10之修改
MovieLens
来对movieLen中的100k数据进行预测
更多代码请见:https://github.com/xubo245/SparkLearning1解释数据下载:http://files.grouplens.org/datasets/
movielens
/
bob601450868
·
2016-05-17 21:00
SVD建模
以
MovieLens
电影推荐为例,SVD(SingularValueDecomposition)的想法是根据已有的评分情况,分析出评分者对各个因子的喜好程度以及电影包含各个因子的程度,最后再反过来根据分析结果
madman188
·
2016-04-25 11:00
SVD
NMF 非负矩阵分解(Non-negative Matrix Factorization)实践
1.NMF-based推荐算法在例如Netflix或
MovieLens
这样的推荐系统中,有用户和电影两个集合。
qq_26225295
·
2016-04-16 01:28
NMF
非负矩阵分解
推荐算法
机器学习
推荐系统学习06-LensKit
介绍 LensKit是协同过滤算法的一个实现和一组校准它们的工具,开发者是明尼苏达大学的,推荐领域著名的
MovieLens
也是出自他们之手。详细信息请去LenSkit官方网站或者wiki查阅。
chenKFKevin
·
2016-04-10 15:00
利用Python进行数据分析---ch02《
MovieLens
1M数据集(下)》读书笔记
page:30-39页#coding=UTF-8importpandasaspd'''利用python的切片语法,通过查看每个DataFrame的前几行验证一下数据加载工作是否一切顺利'''unames=['user_id','gender','age','occupation','zip']users=pd.read_table('c:/pytm/ch02/ml-1m/users.dat',se
Txiaomiao
·
2016-03-11 09:48
利用Python进行数据分析---ch02《
MovieLens
1M数据集(上)》读书笔记
Page:21-29页#coding=UTF-8importjsonfromcollectionsimportdefaultdictfromcollectionsimportCounterfrompandasimportDataFrame,Seriesimportpandasaspdimportnumpyasnpfrommatplotlibimportpylab,mlab,pyplotfrompy
Txiaomiao
·
2016-03-08 21:45
数据挖掘
Top-N Recommendation——基于电影(Item)的推荐
注:1.数据集来源
MovieLens
2.源代码在末尾附上一、Introduction无论是在实体商店还是在网络上,都会有Top-N推荐的情况。基于客户或者基于商品做出推荐。
woshimalingyi
·
2016-03-04 12:00
C++
算法
Top-N
基于Item推荐
Top-N Recommendation——基于用户的推荐实验
注:1.数据集来源
MovieLens
2.源代码在末尾附上一、Introduction大家无论是在实体商店还是在网络上,都会有Top-N推荐的情况。基于客户或者基于商品做出推荐。
woshimalingyi
·
2016-03-04 12:00
C++
算法
topN
基于用户推荐
Rating Prediction——评分预测小结
注:1.数据集合来源自
MovieLens
2.末尾附上源代码一、Introduction现在,各大网络购物平台的购物都会有评分机制,商家要给用户推荐其满意的商品,就需要了解用户的行为,基于用户行为进行分析
woshimalingyi
·
2016-03-04 11:00
C++
算法
预测
阿里推荐
评分预测
推荐系统个人理解(实践部分)
本来最开始打算用
movielens
的电影数据来做推荐,数据集下载地址如下,http://grouplens.org/datasets/
movielens
/,我下的是1m左右的数据,用户6040个,电影3952
vs412237401
·
2016-01-27 14:00
movielens
Spark机器学习读书笔记-CH03
3.1.获取数据:wgethttp://files.grouplens.org/datasets/
movielens
/ml-100k.zip 3.2.探索与可视化数据:In[3]: user_data=
littlesuccess
·
2016-01-24 17:00
SparkR数据分析
(如果你在终端输入sparkR运行成功的话就证明你成功了)如果还没有配置成功的话,参考这里,安装SPARK只需三步1.下载示例数据
MovieLens
100k数据集它包含了用户和电影信息,以及10万次用户对电影的评价
a358463121
·
2016-01-20 16:00
数据分析
spark
R语言
sparkr
使用Python找出历史上5星好评数最多的50部电影,基于
MovieLens
20M数据集
第1名:"ShawshankRedemptionThe(1994)" 类型:Crime|Drama 5星好评次数:31896第2名:PulpFiction(1994) 类型:Comedy|Crime|Drama|Thriller 5星好评次数:27762第3名:"SilenceoftheLambsThe(1991)" 类型:Crime|Horror|Thriller 5星好评次数:22513第4名
shihui512
·
2016-01-18 20:00
协同过滤算法python实现简单入门详细注释
基于Python2.7数据集为
MovieLens
100k数据集 #-*-coding=utf-8-*- importsys importmath fromtexttableimportTexttable
shihui512
·
2016-01-18 19:00
用Python计算
MovieLens
100k数据集中男性女性用户评分的标准差
要求:计算
MovieLens
100k数据集中男性女性用户评分的标准差并输出。
然后咧
·
2015-12-18 17:04
python
Spark机器学习3
3.Spark上数据的获取、处理与准备3.1获取公开数据集
MovieLens
数据集:包含表示多个用户对多部电影的10万次评级数据,也包含电影元数据和用户属性信息。
jjfnjit
·
2015-11-18 17:00
spark
数据
机器学习
各个领域著名的推荐系统
Amazon 豆瓣读书 当当网 新闻 google news Genieo 电影 Netflix Jinni
MovieLens
·
2015-11-12 23:51
推荐系统
协同过滤算法 R/mapreduce/spark mllib多语言实现
用户电影评分数据集下载http://grouplens.org/datasets/
movielens
/1)Item-Based,非个性化的,每个人看到的都一样2)User-Based,个性化的,每个人看到的不一样对用户的行为分析得到用户的喜好后
jethai
·
2015-11-05 15:07
协同过滤
推荐系统
数据结构与算法
协同过滤算法 R/mapreduce/spark mllib多语言实现
用户电影评分数据集下载http://grouplens.org/datasets/
movielens
/1)Item-Based,非个性化的,每个人看到的都一样2)User-Based,个性化的,每个人看到的不一样对用户的行为分析得到用户的喜好后
jethai
·
2015-11-05 15:07
推荐系统
协同过滤
周涛:利用协同标签,解决冷启动问题
例如,用户在美味书签(Del.icio.us)上使用的标签表示了用户对收藏书签的喜好程度;在电影评分网站(
MovieLens
.
·
2015-10-21 11:46
标签
kaggle-电影评分预测从零开始
Hadoop构建电影推荐系统使用python的pandas来处理MovielensPythonForDataAnalysis’sdocumentationDataprocessingbypython:
MovieLens
1Mdataset
reallocing1
·
2015-07-11 18:00
数据
python
Kaggle
SlopOne推荐算法
使用
movielens
的数据,代码如下代码#coding:utf-8importreimportmath#读取数据,并生成矩阵defgetMatrix():mat={}f=open("u.data","
acdreamers
·
2015-06-03 18:30
人工智能
电影数据集总结:Netflix、
MovieLens
、LDOS-CoMoDa、AdomMovie
数据集:1.Netflix描述:包含Netflix上48万多个随机选取的匿名用户,对于1万7千多部电影的1兆多个电影评分时间:1988.10~2005.11内容:包括trainingset,movietitles,probeset,qualifyingset等文件。Trainningset包含4个特征值:电影ID、用户ID、评分(1~5)、日期;Movietitles包含3个特征值:电影ID、上映
icbc_zackchan
·
2015-03-10 18:48
从item-base到svd再到rbm,多种Collaborative Filtering(协同过滤算法)从原理到实现
(本文所用测试数据是
movielens
100k) 本文采用的评测标准是RMSE,数值越小算法越好,
wenyusuran
·
2014-10-31 10:00
hive查询导出到hdfs,hive,file
.; insert overwrite [local] directory '/data/
movielens
/100k/output/
blackproof
·
2014-10-28 20:00
hive
hive查询导出到hdfs,hive,file
.; insert overwrite [local] directory '/data/
movielens
/100k/output/
blackproof
·
2014-10-28 20:00
hive
[Hadoop]使用Hadoop进行ReduceSideJoin
这是基于老的API的实现,这种方法并不高效简洁 数据:(原始数据可以从
movielens
-1m里面去要,这里将原始数据进行了简单的修改方便演示与
RangerWolf
·
2014-09-24 17:00
hadoop
[Mahout] 第一个小实验:使用GroupLens进行推荐模型的检验
注: 内容参考至《Mahout实战》 根据mahout实战里面的内容,接下来将使用grouplens提供的
movielens
-1m的数据进行推荐。
RangerWolf
·
2014-07-06 15:00
Mahout
电影推荐系统的建模
11336241叶均明一、概述由
MovieLens
评分数据集作为训练集(含943名用户对1682部电影的评分),根据用户信息和过往打分进行电影推荐,即允许用户对自己所看过的电影进行打分,并且根据用户历史的打分信息
跳舞的驴子
·
2014-06-03 16:24
大数据
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他