E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
MAHOUT
、简单分析基于物品的 CF(Item CF)推荐算法
参考:https://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy2/http://blog.fens.me/
mahout
-recommendation-api
Primal
·
2020-07-10 23:56
推荐系统
008-Ambari二次开发之添加自定义组件Redis(一)
HDFS、YARN、HBase、Hive、Pig、ZooKeeper、Sqoop、Storm、Flume、Tez、Oozie、Falcon、Storm、Altas、Knox、Spark、Ranger、
Mahout
zhangiongcolin
·
2020-07-10 20:30
Ambari系列
海量Web日志分析 用Hadoop提取KPI统计指标
Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop,Hive,Pig,HBase,Sqoop,
Mahout
,Zookeeper,Avro,Ambari,Chukwa,新增加的项目包括
Fens
·
2020-07-10 16:24
Hadoop生态圈
文章目录一、Hadoop三、Mapreduce四、HBASE五、Zookeeper六、HIVE七、Pig八、Sqoop九、Flume十、
Mahout
十一、Oozie十二、Yarn十三、Mesos十四、Tachyon
_梓杰_
·
2020-07-10 15:35
大数据
推荐系统深入研究
还是针对这两个:easyRec和
Mahout
。1.
Mahout
Mahout
是基于Hadoop的机器学习和数据挖掘的一个分布式框架。
Hell_Angel_
·
2020-07-10 14:02
推荐系统
mahout
easyrec
基于 Apache
Mahout
构建社会化推荐引擎【转】
推荐引擎简介推荐引擎利用特殊的信息过滤(IF,InformationFiltering)技术,将不同的内容(例如电影、音乐、书籍、新闻、图片、网页等)推荐给可能感兴趣的用户。通常情况下,推荐引擎的实现是通过将用户的个人喜好与特定的参考特征进行比较,并试图预测用户对一些未评分项目的喜好程度。参考特征的选取可能是从项目本身的信息中提取的,或是基于用户所在的社会或社团环境。根据如何抽取参考特征,我们可以
yangfuchao418
·
2020-07-10 13:42
搜索与爬虫
Apache
Mahout
中的机器学习算法集【转】
Apache
Mahout
是ApacheSoftwareFoundation(ASF)旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序,并且,
yangfuchao418
·
2020-07-10 13:11
搜索与爬虫
mahout
如何使用随机森林测试数据集
开源项目
mahout
实现了大多数经典的机器学习算法,里面也提供了很多处理数据,提取特征,训练算法模型的类和方法,但是貌似国内用这个开源项目的人并不多,因为网上关于具体如何使用
mahout
算法的资料廖若晨星
代码裤
·
2020-07-10 03:57
机器学习
mahout
入门指南之
mahout
单机版推荐算法
mahout
入门指南之
mahout
单机版推荐算法鄙人最近在研究
mahout
,网上找了一些入门资料来看,发现都整理的比较乱。折腾了一番,终于搞清楚了。
lingerlanlan
·
2020-07-09 19:18
机器学习
Mahout
Spectral聚类
谱聚类(SpectralClustering)这名字看着就比Canopy、K-means来得高端大气上档次,事实上它确实是一种比较现代化的聚类方法,并且极具工程应用价值。谱聚类算法声称对样本空间的形状无限制,并能收敛于全局最优解。什么意思呢?我们知道,K-means聚类要求样本来自欧氏空间,从而可以计算欧氏距离,进而根据欧氏距离来决定一个样本点归属于哪个类。但现实总是残酷的,我们的研究对象往往并非
Chungtow-Leo
·
2020-07-09 02:42
Hadoop技术
Mahout
0.8维护笔记
(0)类:org.apache.
mahout
.clustering.spectral.common.VectorMatrixMultiplicationJob方法:publicstaticDistributedRowMatrixrunJob
Chungtow-Leo
·
2020-07-09 02:11
Hadoop技术
Mahout
K-means聚类
在实际工作中,我们很少有完整的时间段能够仔细研透一门学问。因此针对一门新学问、一套新知识、一种新方法,我们追求的是,先把它用起来,让其有实际的产出,尔后如有必要再慢慢研究其内在机理,以逐渐达到熟练自如地应用的境地。为了快速掌握一种方法的使用,我们要搞清楚的无外乎以下几个问题:这个方法是做什么的?我该准备些什么数据?我该如何将该方法用于已准备好的数据?该方法的输出结果如何使用?以上是小小的感悟。在本
Chungtow-Leo
·
2020-07-09 02:11
Hadoop技术
Failed to load class "org.slf4j.impl.StaticLoggerBinder问题故障的解决
运行
mahout
例程出现的问题,从网上看到的解决方法,很管用。
宁云子
·
2020-07-08 12:59
平台
Hadoop—
Mahout
部署及进行20newsgroup数据分析例子---练习10
1运行环境说明1.1硬软件环境l主机操作系统:Windows64bit,双核4线程,主频2.2G,6G内存l虚拟软件:VMware®Workstation9.0.0build-812388l虚拟机操作系统:CentOS64位,单核,1G内存lJDK:1.7.0_5564bitlHadoop:1.1.21.2机器网络环境集群包含三个节点:1个namenode、2个datanode,其中节点之间可以相
下雨天uu
·
2020-07-08 10:52
hadoop
_00004 Hadoop NameNode源码浅析(RPC是基础)
博文作者:妳那伊抹微笑个性签名:世界上最遥远的距离不是天涯,也不是海角,而是我站在妳的面前,妳却感觉不到我的存在技术方向:Flume+Kafka+Storm+Redis/Hbase+Hadoop+Hive+
Mahout
那伊抹微笑
·
2020-07-08 09:52
hadoop
源码分析
hadoop
linux使用IDEA进行
Mahout
配置
在网上找了很多关于IDEA上利用maven配置
mahout
开发环境的,但都是使用pom.xml进行配置,其实不需要这么麻烦,如果在linux上已经安装配置好了本地的
mahout
,直接导入jar包即可。
里皮同学
·
2020-07-07 19:37
《
Mahout
实战》
Referfromhttp://www.52ml.net/tags/
mahout
本书附带的语音讲解可以直接在此网页http://www.ituring.com.cn/article/74754观看,图灵教育为这些视频配上了中文字幕
CV_2013
·
2020-07-07 12:41
Hadoop解析序列文件并可视化输出
在进行
mahout
算法分析的时候有时会遇到算法最后的输出文件是序列文件的情况下,这样就不能直接通过HDFS文件系统看到最终的结果了(乱码,因为是序列文件)。
fansy1990
·
2020-07-07 07:30
hadoop
序列文件
利用LDA进行文本聚类(hadoop,
mahout
)
项目原理概述利用sqoop将数据从MySQL导入到HDFS中,利用
mahout
的LDA的cvb实现对输入数据进行聚类,并将结果更新到数据库中。
Ehome_Shasha
·
2020-07-07 07:14
机器学习算法研究
mahout
推荐引擎
mahout
基本结构package:org.apache.
mahout
.cf.tastecommon:公共类包括,异常,数据刷新接口,权重常量eval:定义构造器接口,类似于工厂模式model:定义数据模型接口
破晓追风
·
2020-07-06 17:54
Mahout
推荐算法API详解
前言用
Mahout
来构建推荐系统,是一件既简单又困难的事情。
beck_zhou
·
2020-07-06 12:37
算法研究(数据挖掘
机器学习
自然语言
深度学习
搜索引擎)
大数据学习路线(完整详细版)
Linux(shell,高并发架构,lucene,solr)Hadoop(Hadoop,HDFS,Mapreduce,yarn,hive,hbase,sqoop,zookeeper,flume)机器学习(R,
mahout
xinyuan_java
·
2020-07-06 09:26
summary
mahout
0.6基于Item的CF代码分析
phase1:convertitemstoaninternalindex这步主要是将itemId转成一个int。input:用户评分文件(这也是我们最原始的输入了),格式一般为:userId\titemId\tscore。map:(index,itemId)reduce:(index,itemId)phase2:convertuserpreferencesintoavectorperuser计算一
xhjx2618
·
2020-07-06 08:25
Hadoop
Mahout
Mahout
之k-means算法源码分析
org.apache.
mahout
.clustering.syntheticcontrol.kmeans.run(Configurationconf,Pathinput,Pathoutput,DistanceMeasuremeasure
xhjx2618
·
2020-07-06 08:25
Hadoop
Mahout
Mahout
中基于项目的CF主要步骤
这里只是记录整个算法的主要流程,中间没有涉及到具体的细节。假设原始的数据集的格式如下:第一步:生成用户向量(user-vector),最终输出结果为,这个vector记录了这个userId打过分的所有项目的打分值。第二步:生成项目向量(item-vector),map的输入为第一步的输出,这一步最后的输出为,这个vector记录了所有对这个itemId打过分的userId,以及对应的打分值。第三步
xhjx2618
·
2020-07-06 08:25
Mahout
深度:Hadoop对Spark五大维度正面比拼报告!
如果想要进行机器学习和预测建模,
Mahout
或MLLib会更好地满足您的需求吗?为了增加混淆,Spar
weixin_34403693
·
2020-07-06 01:32
分享:五个最给力的Hadoop项目
2.
Mahout
:
Mahout
是一个基于Hadoop实现各种机器学习与数据挖掘算法库。被
weixin_30505751
·
2020-07-05 21:33
大数据技术总结
HDFSHBaseKudu3.分布式协调与资源管理ZookeeperYarn4.数据计算MapReduceSparkImpala/PrestoStormFlink5.数据分析HivePigSparkSQL
Mahout
Lonwayne
·
2020-07-05 16:36
云计算
欢迎使用CSDN-markdown编辑器
(理论部分)统计学线性代数微积分算法和数据结构机器学习模型特征工程自然语言处理分布式计算外功:(工具部分)C/C++/JavaPython/R/MatlabHadoop/HiveSpark/MLlib
Mahout
tylglpc
·
2020-07-05 15:33
机器学习
pyspark_juypter环境
确保安装juypter和spark.bashrc增加环境变量exportSPARK_HOME=/xxx/hadoop-
mahout
-maven/spark/spark-2.3.0-bin-hadoop2.7exportPYSPARK_DRIVER_PYTHON
cotecc
·
2020-07-05 11:51
Hadoop家族学习路线图
//blog.fens.me/hadoop-family-roadmap/Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop,Hive,Pig,HBase,Sqoop,
Mahout
qq361301276
·
2020-07-05 02:49
云计算
hadoop
hadoop
云计算
Hadoop+hive+zookeeper+hbase+spark+kylin+
mahout
集群搭建
引言:之前大四的时候觉得大数据很火,就尝试搭建了一个单节点的hadoop玩过,最近工作慢慢有点空闲就开始搭建3节点的大数据平台,现在整个大数据的生态圈已经完善了很多了,花了一个星期终于搭建好了,各种组件玩起来简直不要太爽。大数据集群配置.png一、装虚拟机vm,集群初始配置1、下载vm和ubuntu镜像,然后复制两份ubuntu,每台ubuntu都创建一个hadoop用户sudouseradd-m
Jason____
·
2020-07-05 00:24
mahout
算法源码分析之Collaborative Filtering with ALS-WR (二)splitDataset 和parallelALS
Mahout
版本:0.7,hadoop版本:1.0.4,jdk:1.7.0_2564bit。
iteye_12675
·
2020-07-04 18:13
Hadoop实战(全面讲解Hadoop以及Hive、HBase、
Mahout
、Pig、ZooKeeper、Avro、Chukwa等相关技术)...
Hadoop实战(全面讲解Hadoop以及Hive、HBase、
Mahout
、Pig、ZooKeeper、Avro、Chukwa等相关技术)基本信息作者:陆嘉恒[作译者介绍]出版社:机械工业出版社ISBN
iteye_11539
·
2020-07-04 18:04
Mahout
线性回归算法源码分析(1)--实战
转载地址:http://blog.csdn.net/fansy1990/article/details/23766523版本:
mahout
0.9
Mahout
里面使用逻辑回归(logisticregression
hechenghai
·
2020-07-04 17:39
机器学习实战
Python海量数据处理之_Hadoop家族
Mahout
是基于集群的数据挖掘工具。 Zookeeper是集群管理工具,比如配置一些备用服务器,当重要的服务宕机时,及时补救。
xieyan0811
·
2020-07-04 11:45
【大数据工程师】学习路径
点击这里就可以查看了~文章主要把【大数据工程师】学习路径搬运到这里来,希望对广大想入门大数据的小伙伴来说有所帮助~【大数据工程师】学习路径中会学习并实践Java、Scala、Hadoop、HBase、
Mahout
实验楼
·
2020-07-04 10:51
mahout
中k-means算法运行与查看
bin/hadoopfs-mkdirtestdata并将该文件放入改文件夹下面$HADOOP_HOME/bin/hadoopfs-putsynthetic_control.datatestdata运行
mahout
小亚文
·
2020-07-02 17:53
mahout
聚类
hadoop
【好书推荐】机器学习书单
今天推荐的图书专注机器学习主题,一共7本,都是经过实践检验的好书——《机器学习》《图解机器学习》《机器学习实战》《机器学习系统设计》《Spark机器学习》《
Mahout
实战》《机器学习实践:测试驱动的开发方法
图灵教育
·
2020-07-02 13:06
推荐系统中协同过滤算法实现分析(重要两个图!!)
最近研究
Mahout
比较多,特别是里面协同过滤算法;于是把协同过滤算法的这个实现思路与数据流程,总结了一下,以便以后对系统做优化时,有个清晰的思路,这样才能知道该如何优化且优化后数据亦能正确。
mousever
·
2020-07-02 12:43
DM
机器学习
Mahout
构建图书推荐系统
前言本文是
Mahout
实现推荐系统的又一案例,用
Mahout
构建图书推荐系统。与之前的两篇文章,思路上面类似,侧重点在于图书的属性如何利用。本文的数据在自于Amazon网站,由爬虫抓取获得。
追寻北极
·
2020-07-02 06:17
mahout
【译】
mahout
in action 2.5 评估GroupLens数据集合
用这些在进行中的工具,我们将可能不仅讨论速度,也讨论我们创造和修改的推荐引擎的质量。虽然大量真实数据的例子仍然要过几章才能讲到,我们将花一些时间在一个小型数据集合上去快速评估性能。[size=large]2.5.1提取推荐器输入数据[/size]GroupLens(http://grouplens.org/)是一个研究项目,它提供几个不同型号的数据集合,每一个都来自于真实的用户对电影的评分。这是几
iteye_14058
·
2020-07-02 04:01
Mahout
in
action
Mahout
初体验——配置+HelloWorld
最近在看机器学习方面的内容,不过一直在看理论方面未免略枯燥,正好发现了一个Apache下的开源项目——
Mahout
,是一个Java的机器学习算法库,遂看之。
Sky_Money
·
2020-07-01 13:13
机器学习&数据挖掘
slf4j
myeclipse
maven
hadoop
exception
import
mahout
源代码阅读之CF--DataModel
从上一篇文章
mahout
入门之推荐系统,可以看出
mahout
的CF主要有如下几个模块(说是模块也不一定准确,但是
mahout
CF的代码框架是架构在这几个接口上面的)。
RFC2008
·
2020-07-01 12:17
mahout
推荐系统
源代码阅读
在GitHub上面创建一个自己的repository
今天在GitHub上面创建了一个自己的repository:
mahout
.programming。以后会把相应的代码存放到其上面。
LiuQiYun
·
2020-07-01 04:56
github
git
git
github
TOP 10 开源的推荐系统简介
最近这两年推荐系统特别火,本文搜集整理了一些比较好的开源推荐系统,即有轻量级的适用于做研究的SVDFeature、LibMF、LibFM等,也有重量级的适用于工业系统的
Mahout
、Oryx、EasyRecd
君子于役
·
2020-06-30 17:37
Eclipse 下
mahout
的配置与使用
mahout
是一个开源的旨在为实际问题提供可伸缩性算法的软件。
zhzhl202
·
2020-06-30 17:17
ML
问题解决
学习笔记
[job]数据挖掘招聘-拉勾网
负责利用大数据相关技术对业务进行数据分析,挖掘产品特征、用户行为特征,推荐系统,构建用户精准运营的指标体系的算法研究和实现;负责Hadoop/spark平台下的数据算法研究和实现,包括数据抓取系统的使用和研发,在
Mahout
葡萄喃喃呓语
·
2020-06-30 14:22
基于
Mahout
构建推荐引擎
什么是
Mahout
?
Jiayuan96
·
2020-06-30 13:06
后端
Mahout
基本原理
Point1:什么是
Mahout
?
Mahout
是Apache的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。
Star-Technology
·
2020-06-30 08:03
数据挖掘
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他