E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Mahout
Mahout
的taste推荐系统里的几种Recommender分析
Taste简介看自:http://blog.csdn.net/zhoubl668/article/details/13297583
Mahout
是apache下的一个java语言的开源大数据机器学习项目,
mrwang
·
2020-09-16 20:11
mahout
mahout
0.7 使用 JDBCDataModel
首先创建在mysql中创建库以及对应的表mysql>createdatabase
mahout
;QueryOK,1rowaffected(0.00sec)mysql>use
mahout
;Databasechangedmysql
mrwang
·
2020-09-16 20:11
mahout
Mahout
数据承载
转自:http://blog.csdn.net/zhoubl668/article/details/13508417推荐数据的处理是大规模的,在集群环境下一次要处理的数据可能是数GB,所以
Mahout
针对推荐数据进行了优化
mrwang
·
2020-09-16 20:11
mahout
Mahout
中相似度计算方法介绍
在现实中广泛使用的推荐系统一般都是基于协同过滤算法的,这类算法通常都需要计算用户与用户或者项目与项目之间的相似度,对于数据量以及数据类型不同的数据源,需要不同的相似度计算方法来提高推荐性能,在
mahout
mrwang
·
2020-09-16 20:11
mahout
mahout
所实现的算法
https://cwiki.apache.org/confluence/display/
MAHOUT
/Algorithms列出
mahout
所实现或正在实现的一些算法ClassificationLogisticRegression
mrwang
·
2020-09-16 20:11
mahout
大数据推荐系统(8)分布式数据收集和存储
大数据推荐系统算法(1)大数据框架介绍大数据推荐系统算法(2)lambda架构大数据推荐系统算法(3)用户画像大数据推荐系统(4)推荐算法大数据推荐系统(5)
Mahout
大数据推荐系统(6)Spark大数据推荐系统
礼拜天吃芋圆
·
2020-09-15 15:14
大数据推荐算法
hadoop SequenceFileOutputFormat与LzopCodec压缩问题
用
mahout
库做推荐系统,
mahout
的默认输出格式是SequenceFileOutputFormat,然后对输出进行压缩,集群配置的默认压缩方式是LzopCodec。
pan12jian
·
2020-09-15 14:32
hadoop
mahout
做推荐时uid,pid为string类型
mahout
做推荐的输入只能是long类型,但在某些网站中,存储的数据不是long类型,是string类型。现在的手机APP,每个手机都有其device_id,也是string类型。
pan12jian
·
2020-09-15 14:32
mahout
Spark系列(1)—Spark单机安装与测试
Spark作为最有可能代替mapreduce的分布式计算框架,当前非常火,本人也开始关注Spark并试着从hadoop+
mahout
转向Spark。
pan12jian
·
2020-09-15 13:41
spark
maven打成可执行jar包和添加自定义jar包
mahout
项目是采用maven进行管理的,maven和ant一样都是项目管理的工具,它的特点在与对于第三方jar包的管理。
mypop
·
2020-09-15 08:08
jar
maven
assembly
junit
plugins
archive
Mahout
聚类分析
查看原文聚类分析什么是聚类分析?聚类(Clustering)就是将数据对象分组成为多个类或者簇(Cluster),它的目标是:在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。所以,在很多应用中,一个簇中的数据对象可以被作为一个整体来对待,从而减少计算量或者提高计算质量。其实聚类是一个人们日常生活的常见行为,即所谓“物以类聚,人以群分”,核心的思想也就是聚类。人们总是不断地改进下意
azhao_dn
·
2020-09-14 18:42
hadoop
mahout
算法
vector
output
apple
path
hadoop
Hadoop应用开发实战案例视频教程
课程目录│├─作业│作业.rar11KB│├─第10周聚类算法应用,分析优质客户(Map-Reduce,
Mahout
)│hadoop_dev_10.rar114.26MB│Hadoop_dev_10.zip1.79MB
weixin_46240970
·
2020-09-13 13:45
基于Hadoop2.6.0的
Mahout
0.12.1的配置与使用
一.
Mahout
的安装1.下载在http://mirror.bit.edu.cn/apache/
mahout
/0.12.1/下载地址中下载apache-
mahout
-distribution-0.12.1
是可大吖哈
·
2020-09-13 06:27
Hadoop
大数据系列文章汇总 - 更新到15篇----------IT十年
YARN大数据(四)-MapReduce大数据(五)-HBase大数据(六)-ZooKeeper大数据(七)-Flume大数据(八)-Sqoop大数据(九)-Hive大数据(十)-Pig大数据(十一)-
Mahout
iFTY_Rostiute
·
2020-09-12 23:40
ZZZ
大数据备赛资料暂存
伪分布式hadoop+
mahout
部署及20newsgroups经典算法测试
--------------------------------------------------------------------------第一阶段:hadoop的伪分布式安装第二阶段:
mahout
weixin_30800807
·
2020-09-12 17:28
对数似然比相似度
最近在看
mahout
的相似性度量时,对其中的对数似然比相似度颇为好奇,由于书本上完全没有涉及到对数似然比相似度的计算原理,只是提供了一个函数接口,因此决定深入了解一下这个对数似然比相似度。
xidianycy
·
2020-09-12 12:58
推荐系统
经典Hadoop家族系列文章
经典Hadoop家族系列文章一学习路线图Hadoop家族学习路线图开篇必读Hive学习路线图学习hadoop到上手工作线路指导(中级篇)零基础学习hadoop到上手工作线路指导(编程篇)
Mahout
学习路线图二编程实践
Thomas-yang
·
2020-09-11 15:28
云计算
Hadoop
大数据
hadoop
Oozie、Flume、
Mahout
配置与应用
-------------------------Oozie--------------------【一、部署】1)部署Oozie服务端[root@cMaster~]#sudoyuminstalloozie#cMaster上以root权限执行,部署Oozie服务端2)部署Oozie客户端[root@iClient~]f#sudoyuminstalloozie-client【二、配置文件】3)修改/
weixin_30480583
·
2020-09-11 04:46
用MapReduce实现矩阵乘法
Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop,Hive,Pig,HBase,Sqoop,
Mahout
,Zookeeper,Avro,Ambari,Chukwa,新增加的项目包括
Fens
·
2020-09-11 01:16
推荐引擎初探
同时在理论讲解的基础上,还会结合Apache
Mahout
介绍如何在大规模数据上实现各种推荐策略,进行策略优化,构建高效的推荐引擎的方法。
yoqulin
·
2020-09-10 17:36
推荐引擎
java
个性化推荐
推荐引擎
大数据分析技术研究报告(四)
作者:朱赛凡四大数据背景下数据分析挖掘技术介绍1
Mahout
与MLlib项目数据分析挖掘主要涉及两个方面:一是数据预处理;二是数据挖掘。
njpjsoftdev
·
2020-08-25 03:11
大数据分析
Mahout
学习系列之推荐算法
/blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer参考:从源代码剖析
Mahout
weixin_33725272
·
2020-08-24 17:44
Mahout
对推荐数据的抽象表示(下部分)
这篇博客是延续上部分的补充:
Mahout
对推荐数据的抽象表示(上部分)处理无Preferencevalues数据下面都是围绕
Mahout
对没有Preferencevalues的数据的推荐。
weixin_30414635
·
2020-08-24 16:50
mahout
基于用户的协同过滤-userCF
首先参考文章用Maven构建
Mahout
项目:http://blog.fens.me/hadoop-
mahout
-maven-eclipse/完成了利用maven搭建的
mahout
推荐项目。
tonylee1219
·
2020-08-24 16:46
【
mahout
笔记】初步理解itemCF(基于物品的推荐算法)在
mahout
的实现
之前分析了基于用户的CF的原理。今天尝试调试一下基于物品的CF算法。再次声明,本文部分内容是参考:https://blog.csdn.net/wolvesqun/article/details/52757772感谢大佬的整理为我指明方向。基于物品的CF的原理和基于用户的CF类似,只是在计算邻居时采用物品本身,而不是从用户的角度,即基于用户对物品的偏好找到相似的物品,然后根据用户的历史偏好,推荐相似
猫球球
·
2020-08-24 16:43
学习笔记
机器学习
实践
Mahout
之推荐算法基本实例
Mahout
中主要核心的三大算法为推荐,聚类及分类算法,今天就最基本的推荐算法做总结,推荐中常用的两个推荐算法是”user_based”和”item_based”,前者主要通过和你兴趣相似的人来发现新的你感兴趣的东西
Running_you
·
2020-08-24 16:11
mahout
算法
基于
mahout
的推荐系统 下
3.代码实现3.1数据准备创建商品表CREATETABLE`tb_item`(`pid`bigint(11)NOTNULLAUTO_INCREMENT,`name`varchar(2000)CHARACTERSETlatin1DEFAULTNULL,`types`varchar(2000)CHARACTERSETlatin1DEFAULTNULL,PRIMARYKEY(`pid`))ENGINE=
我是楠楠
·
2020-08-24 15:31
技术文章
用Hadoop构建电影推荐系统
Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop,Hive,Pig,HBase,Sqoop,
Mahout
,Zookeeper,Avro,Ambari,Chukwa,新增加的项目包括
Fens
·
2020-08-24 14:17
java
数据结构与算法
系统架构
用R解析
Mahout
用户推荐协同过滤算法(UserCF)
RHadoop实践系列文章,包含了R语言与Hadoop结合进行海量数据分析。Hadoop主要用来存储海量数据,R语言完成MapReduce算法,用来替代Java的MapReduce实现。有了RHadoop可以让广大的R语言爱好者,有更强大的工具处理大数据1G,10G,100G,TB,PB。由于大数据所带来的单机性能问题,可能会一去不复返了。RHadoop实践是一套系列文章,主要包括”Hadoop环
Fens
·
2020-08-24 14:17
Some Libraries For Machine Learning And Computer Vision
主要是参考以下网址的,有兴趣的可以去看看:http://mloss.org/software/jmlr/Approach
Mahout
:java库。需要Maven编译。
H349117102
·
2020-08-24 13:44
library
Mahout
实例(UserCF,ItermCF,SlopOne)
自己也尝试了自己动手实现一下,但是比起
Mahout
开源项目中的算法效率,我写的效率很低,所以就决定使用
Mahout
了,虽然
Mahout
只是封装了一些基本
kyrin_云中鹤
·
2020-08-24 12:00
推荐系统
mahout
学习(1)userCF+itemCF
主要参考文档
mahout
-in-action中的第二章【推荐】对于userCF,要先获取评分数据存于DataModel中,定义用户间相似度的计算方法Similarity,可利用一定方法如KNN来求相似用户
YYlxid
·
2020-08-24 12:51
coding
way
mahout
推荐系统
Hadoop的理解
——资源及数据管理层,YARN以及Sentry等上层——MapReduce、Impala、Spark等计算引擎顶层——基于MapReduce、Spark等计算引擎的高级封装及工具,如Hive、Pig、
Mahout
沒
·
2020-08-24 11:06
Hadoop
Mahout
bayes分类器
实现包括三部分:TheTrainer(训练器)、TheModel(模型)、TheClassifier(分类器)1、训练首先,要对输入数据进行预处理,转化成BayesM/Rjob读入数据要求的格式,即训练器输入的数据是KeyValueTextInputFormat格式,第一个字符是类标签,剩余的是特征属性(即单词)。以20个新闻的例子来说,从官网上下载的原始数据是一个分类目录,下面每个文件夹名就是类
TheAlgorithmArt
·
2020-08-24 07:01
Mahout
ALS算法解析
同样是大规模计算平台,Hadoop中的机器学习算法库
Mahout
就集成了多种推荐算法,不但有user-cf和item-cf这种经典算法,还有KNN、SVD,Slopeone这些,可谓随意挑选,简繁由君。
公众号:JavaEdge
·
2020-08-24 01:35
机器学习
使用
mahout
进行k-means聚类[翻译]
http://
mahout
.apache.org/users/clustering/k-means-clustering.htmlk-Meansisasimplebutwell-knownalgorithmforgroupingobjects
阳春是你
·
2020-08-23 03:59
mahout
推荐引擎总结
GenericUserBasedRecommender和GenericItemBasedRecommender处理有偏好值的数据。GenericBooleanPrefUserBasedRecommender:处理偏好值为布尔类型或没有偏好值的数据。SlopeOneRecommender:基于新物品与用户评估过的物品之间平均偏好值差异来预测用户对新物品的偏好值。处理有偏好值的数据实验性质的推荐算法基
重拾梦想
·
2020-08-22 17:16
mahout
基于hadoop的社交网络的分析
首先说一下项目流程,用mapreduce对数据进行预处理,然后用
mahout
中的聚类算法(kmeans)对数据进行处理,最后用peoplerank对数据进行处理。
a296777513
·
2020-08-22 12:34
hadoop
hadoop
Hadoop生态圈中存在的Apache顶级项目
2010年5月,
Mahout
脱离Hadoop项目,成为Apache顶级项目。2010年9月,Hive(Facebook)脱离Hadoop,成
cdf861015
·
2020-08-21 13:04
hadoop
mahout
推荐算法——协同过滤推荐算法(java代码实现)
什么是协同过滤协同过滤是利用集体智慧的一个典型方法。要理解什么是协同过滤(CollaborativeFiltering,简称CF),首先想一个简单的问题,如果你现在想看个电影,但你不知道具体看哪部,你会怎么做?大部分的人会问问周围的朋友,看看最近有什么好看的电影推荐,而我们一般更倾向于从口味比较类似的朋友那里得到推荐。这就是协同过滤的核心思想。协同过滤一般是在海量的用户中发掘出一小部分和你品位比较
爱篮球爱IT
·
2020-08-21 07:19
数据挖掘
mahout
安装配置
1.下载
mahout
下载地址:http://
mahout
.apache.org我下载的最新版:
mahout
-distribution-0.92.把
mahout
解压到你想存放的文档,我是放在/Users/
weixin_30764883
·
2020-08-20 19:33
单机环境及分布式环境下K-Means聚类算法的运行实例
单机环境下的K-Means聚类算法运行实例参考书籍《
Mahout
inAction》:要资源的可以找我~(中英文都有)在eclipse平台上实现K-Means实例代码如下:packagekmeans;importjava.io.File
sunny_yeah_
·
2020-08-20 06:25
Mahout
maven打包hadoop项目(含第三方jar)
2
mahout
中itembased算法,将uid从string映射为long。我这里实现的具体功能是:
Mahout
的itembased算法的数据格式是:uid,vid,score。
lingerlanlan
·
2020-08-19 10:30
Hadoop
大数据学习路线(自己制定的,从零开始)
Linux(shell,高并发架构,lucene,solr)Hadoop(Hadoop,HDFS,Mapreduce,yarn,hive,hbase,sqoop,zookeeper,flume)机器学习(R,
mahout
weixin_34318956
·
2020-08-18 17:47
Haddoop大数据教程笔记_02_Hadoop生态圈简介
Hadoop生态圈简介目录Hadoop生态圈简介Hadoop生态圈:(一)Hdfs(二)Mapreduce(三)Hive(四)Hbase(五)Zookeeper(六)Sqoop(七)Pig(八)
Mahout
Snowing_inhope
·
2020-08-18 10:58
大数据Hadoop教程
mahout
常见机器学习算法及分类
一直没有梳理接触到的东西,常见算法分类:推荐系统(推荐引擎):基于用户的协同过滤算法UserCF近邻算法,容易实现基于物品的协同过滤算法ItemCF速度快,容易实现分布式计算SlopeOne算法@Deprecatedat
mahout
0.8KNNLinearinterpolationitem–based
weixin_34347651
·
2020-08-16 21:28
相似度计算方式的总结:java或python实现代码
比较推荐列表中出现的我随机删除了的本来就被用户收藏了的歌曲的数量肯定有一种相似度计算公式最优根据原理分析为什么这种相似度方案最优即可产生理论,有了论据所以,现在我目标是总结常见的几种相似度计算方式的原理,并且利用
mahout
silent狼
·
2020-08-16 10:45
机器学习
eclipse 下导入
mahout
1,先装maven2,再装
mahout
----------------注意下载的是不是src源码的,如果是,还要通过里面的redeme.txt,按照命令操作编译建议下载压缩版的distrbuition版本
玉青戈
·
2020-08-16 10:48
JAVA学习
大数据工程师学习大纲汇总
大数据工程师技能图谱大数据通用处理平台SparkFlinkHadoop分布式存储HDFS资源调度YarnMesos机器学习工具
Mahout
SparkMlibTensorFlow(Google系)AmazonMachineLearningDMTK
silentanytime
·
2020-08-16 08:47
hadoop
大数据技术图谱
Yarn(资源管理平台)a.https://www.iteblog.com/archives/1755.htmlPig(piglatin语句到mapreduce的映射)Hive(数据仓库,提供SQL)
Mahout
TonyShu^_^
·
2020-08-13 19:54
日志
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他