E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
mahout
python实现Canopy算法
序前两个月在做项目突然发现Canopy算法发现网上直接用python实现的不多,因为
Mahout
已经包含了这个算法,需要使用的时候仅需要执行
Mahout
几条命令即可,并且多数和MapReduce以及Hadoop
AlanConstantineLau
·
2017-09-09 10:42
python
数据挖掘
数据可视化
机器学习
python
算法
clustering
HADOOP生态圈以及各组成部分的简介
分布式文件系统MAPREDUCE:分布式运算程序开发框架HIVE:基于大数据技术(文件系统+运算框架)的SQL数据仓库工具HBASE:基于HADOOP的分布式海量数据库ZOOKEEPER:分布式协调服务基础组件
Mahout
乐搏学院Learnbo
·
2017-07-26 17:03
hadoop体系的简单学习笔记
Mahout
mahout
:运行在hadoop集群上的机器学习库使用
mahout
:下载,解压安装包设置环境变量,编译配置文件键入
mahout
--help命令,检查
Mahout
是否安装完好在hdfs的目标目录中
Lokvahkoor
·
2017-07-18 10:19
Mahout
机器学习的基本原理
Mahout
和Hadoop:机器学习的基本原理这可能是现在收益最高,也是最受欢迎的一项技术之一。毫无疑问——作为开发人员,机器学习是一个能够大展身手的舞台。
我不是九爷
·
2017-07-14 11:47
基本原理
机器学习
Mahout
Mahout
部署安装
Mahout
一、
Mahout
简介
Mahout
是ApacheSoftwareFoundation(ASF)旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序
我不是九爷
·
2017-07-07 14:21
部署
Mahout
Mahout
Hadoop家族简介
主要介绍Hadoop家族产品,常用的项目包括Hadoop,Hive,Pig,HBase,Sqoop,
Mahout
,Zookeeper,Avro,Ambari,Chukwa,新增加的项目包括,YARN,Hcatalog
断崖修竹
·
2017-07-07 14:44
Hadoop
开源框架
Mahout
配置
开源框架
Mahout
配置机器学习这两年特别火,ATB使劲开百万到几百万年薪招美国牛校的机器学习方向博士,作为一个技术控,也得折腾下,就这样来初步折腾下
Mahout
这个机器学习的主流开源框架。
我不是九爷
·
2017-06-08 10:44
配置
开源框架
Mahout
CloudStack
用通俗易懂的大白话讲解Map/Reduce原理
云计算系统的开源系统,包括并行计算模型Map/Reduce,分布式文件系统HDFS,以及分布式数据库Hbase,同时Hadoop的相关项目也很丰富,包括ZooKeeper,Pig,Chukwa,Hive,Hbase,
Mahout
看穿数据之美
·
2017-06-06 16:34
大数据
【10大开源的推荐系统简介】
最近这两年推荐系统特别火,本文搜集整理了一些比较好的开源推荐系统,即有轻量级的适用于做研究的SVDFeature、LibMF、LibFM等,也有重量级的适用于工业系统的
Mahout
、Oryx、EasyRecd
gaojingsong
·
2017-05-29 20:00
10大开源的推荐系统简介
工作职位推荐系统的算法与架构
在这篇文章里,我们将描述我们的推荐引擎是如何演化的,如何从最初的基于Apache
Mahout
建立的最简化可用行产品,到一个在线离线混合的成熟产品管道。
·
2017-05-18 00:00
BigData
Hadoop家族学习路线图
主要介绍Hadoop家族产品,常用的项目包括Hadoop,Hive,Pig,HBase,Sqoop,
Mahout
,Zookeeper,Avro,Ambari,Chukwa,新增加的项目包括,YARN,Hcatalog
csy_insist
·
2017-03-24 13:27
大数据
hadoop
Hadoop
大数据学习路线(自己制定的,从零开始)
Linux(shell,高并发架构,lucene,solr)Hadoop(Hadoop,HDFS,Mapreduce,yarn,hive,hbase,sqoop,zookeeper,flume)机器学习(R,
mahout
小飞侠-2
·
2017-02-20 09:15
cdh
Apache
Mahout
的协同过滤算法分析
Apache
Mahout
协同过滤中,构建UserSimilarity接口使用到的方法如下:一、基于皮尔逊相关系数算法皮尔逊相关系数是一个介于1和-1之间的数,它度量两个一一对应的数列之间的线性相关程度。
叫我致远
·
2017-02-17 16:59
机器学习
Mahout
学习之
Mahout
简介、安装、配置、入门程序测试
一、
Mahout
简介查了
Mahout
的中文意思——驭象的人,再看看
Mahout
的logo,好吧,想和小黄象happy地玩耍,得顺便陪陪这位驭象人耍耍了...附logo:(就是他,骑在象头上的那个
Mahout
doitmyway
·
2017-02-08 10:54
机器学习&数据挖掘
[机器学习]主流深度学习框架和通用机器学习框架对比
#目录#深度学习框架1.Theano&Ecosystem2.TorchTensorflowCaffeCNTK6.DSSTNE7.Speed#机器学习框架1.sci-kitlearn2.Apache
Mahout
3
刘玉刚
·
2017-01-17 09:40
1.机器学习与算法笔记
Zookeeper、Hadoop、Sqoop、
Mahout
、HBase整合安装
环境说明系统CentOS7.2用户root用户hadoop服务器3台IP:10.1.5.51(master),10.1.5.52(slave1),10.1.5.53(slave2)JAVA1.7.XZookeeper版本:3.4.9Hadoop版本:2.7.3Sqoop版本:1.99.7Spark版本:2.0.2HBase版本:1.2.4风.fox其他设置防火墙systemctlstopfirew
风.foxwho
·
2016-11-29 12:04
大数据相关
Spark MLlib RandomForest(随机森林)建模与预测
我要做的是发现异常用户,而我们之前没有已经打上异常不异常标签的样本,所以对原始数据进行清洗、特征工程、降维后用
Mahout
/R做的聚类,打上了标签,本来打算继续用
Mahout
/R做分类,
Mahout
太慢
光于前裕于后
·
2016-11-21 12:57
Spark
大数据动物园
数据挖掘
R
Spark MLlib RandomForest(随机森林)建模与预测
我要做的是发现异常用户,而我们之前没有已经打上异常不异常标签的样本,所以对原始数据进行清洗、特征工程、降维后用
Mahout
/R做的聚类,打上了标签,本来打算继续用
Mahout
/R做分类,
Mahout
太慢
光于前裕于后
·
2016-11-21 12:57
Spark
大数据动物园
数据挖掘
R
TOP 10 开源的推荐系统简介
details/44623703最近这两年推荐系统特别火,本文搜集整理了一些比较好的开源推荐系统,即有轻量级的适用于做研究的SVDFeature、LibMF、LibFM等,也有重量级的适用于工业系统的
Mahout
葡萄喃喃呓语
·
2016-10-25 19:59
Mahout
K-Means输出结果解析
怎么使用
Mahout
做聚类有空我会专门写的,这篇博客主要为了讲一下
Mahout
处理的结果。
Mahout
版本为0.9,数据没做归一化、标准化,只是为了测试。
光于前裕于后
·
2016-10-19 17:09
大数据动物园
数据挖掘
Mahout
hadoop+zookeeper+hbase+hive+
mahout
整合配置
整体的配置表如下:机器是从仓库里整理出来的箱底机器,已经属于淘汰货了。总体说下,将198号机器为主机(master.hadoop),其它的主机全部当做从机(slaver1-slaver5.hadoop)。设置每台机器的BIOS的电源管理,将其全部设置为上电开机。操作系统采用的是centos6.532bit软件的版本如下:jdk1.8.0_45hadoop-2.2.0zookeeper-3.4.5h
Leekwen
·
2016-10-13 15:29
centos系统应用
Mahout
聚类分析
转自:http://www.cnblogs.com/jerome-rong/archive/2012/05/22/2513262.html另外推荐一本书:《
Mahout
inAction》聚类分析什么是聚类分析
光于前裕于后
·
2016-10-09 14:35
大数据动物园
数据挖掘
Mahout
大数据技术原理——Hive
1.png(2)Hive与传统数据库的区别Hive不支持数据的更新,,也不支持事务和索引,只能只读不能秒级响应,只能分钟级响应;2.png(3)Hive在企业分析平台中的应用Hive一般用于报表中心;
Mahout
是蓝先生
·
2016-09-20 20:00
Hadoop之生态系统
HadoopHDFS和HadoopMapReduce三个子项目,但是和Hadoop核心密切相关的还包括Avro、Zookeeper、Hive、Pig和Hbase等等项目,构建在这些项目之上的,面向具体领域、应用的
Mahout
wangwei4078
·
2016-08-18 12:32
常用工具
工作流
生态
Hadoop
Mahout
算法集
Apache
Mahout
是ApacheSoftwareFoundation(ASF)旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序,并且,
arrow8071
·
2016-08-15 14:00
算法
机器学习
Mahout
文本聚类学习之DocumentProcessor类
做为文本聚类实现的第一步对语料分词是必须的,而documentprocessor类提供了一个基于mapreduce对大量数据集分词的高效灵活的实现。高效是其基于mapreduce分布式计算框架,灵活是其提供了可扩展的分词接口可以对多种语言分词的支持。下面就要深入一下类内部的流程进行学习:documentprocessor类,它只提供了一个静态方法tokenizeddocuments(
arrow8071
·
2016-08-10 11:00
Hadoop家族学习路线图
[+]主要介绍Hadoop家族产品,常用的项目包括Hadoop,Hive,Pig,HBase,Sqoop,
Mahout
,Zookeeper,Avro,Ambari,Chukwa,新增加的项目包括,YARN
_Mr_Computer_
·
2016-07-13 17:23
文章
中国
产品
BigdataCloudAnn
Mahout
Naive Bayes中文新闻分类示例
转载原文:http://www.cnblogs.com/panweishadow/p/4320720.html一、简介关于
Mahout
的介绍,请看这里:http://
mahout
.apache.org/
--__2__--
·
2016-07-10 14:08
Mahout
JAVA
JAVA
机器学习与数据挖掘
以后坚持用java
2.研究lucene,hadoop.
mahout
,和日后用的自然语言分析lingpipe.3.对于数据挖掘方向,专注与weka的学习,同时注意机器学习并行化学习。
hansongjiang
·
2016-07-08 17:00
mahout
之推荐系统源码笔记(4) ---总结
mahout
之推荐系统源码笔记(4)—总结花了几天的时间阅读分析了
mahout
推荐系统中基于java单机和基于hadoop的分布式mapreduce源码。
Utopia_1919
·
2016-07-08 13:00
mapreduce
源码
hadoop
Mahout
mahout
之推荐系统源码笔记(2) ---相似度计算之RowSimilarityJob
mahout
之推荐系统源码笔记(2)—相似度计算之RowSimilarityJob本笔记承接笔记一。
Utopia_1919
·
2016-07-07 15:00
源码
hadoop
Mahout
推荐系统
Hadoop生态系统简介
Hadoop生态系统主要包括:Hive、HBase、Pig、Sqoop、Flume、ZooKeeper、
Mahout
、Spark、Storm、Shark、Phoenix、Tez、Ambari。
学战到底
·
2016-07-06 20:58
大数据
hadoop
mahout
之推荐系统源码笔记(3) ---执行推荐之RecommenderJob
mahout
之推荐系统源码笔记(3)—执行推荐之RecommenderJob本笔记承接笔记二。
Utopia_1919
·
2016-07-06 10:00
java
源码
hadoop
Mahout
推荐系统
mahout
之推荐系统源码笔记(3) ---执行推荐之RecommenderJob
mahout
之推荐系统源码笔记(3)—执行推荐之RecommenderJob本笔记承接笔记二。
Utopia_1919
·
2016-07-06 10:00
java
源码
hadoop
Mahout
推荐系统
mahout
之推荐系统源码笔记(1) ---预处理之PreparePreferenceMatrixJob
mahout
之推荐系统源码笔记(1)—预处理之PreparePreferenceMatrixJobhadoop篇:因为时间原因首先更新分布式hadoop上的推荐系统源码的阅读。
Utopia_1919
·
2016-07-05 16:00
源码
hadoop
分布式
Mahout
Taste
mahout
之推荐系统源码笔记(1) ---预处理之PreparePreferenceMatrixJob
mahout
之推荐系统源码笔记(1)—预处理之PreparePreferenceMatrixJobhadoop篇:因为时间原因首先更新分布式hadoop上的推荐系统源码的阅读。
Utopia_1919
·
2016-07-05 16:00
源码
hadoop
分布式
Mahout
Taste
Hadoop家族系列文章
发现一个学习Hadoop的文章...学习Hadoop的同学可以看看...主要介绍Hadoop家族产品,常用的项目包括Hadoop,Hive,Pig,HBase,Sqoop,
Mahout
,Zookeeper
happyduoduo1
·
2016-07-02 10:00
hadoop
开源
数据
大数据
开发人员
mahout
应用kmeans进行文本聚类——实例分析
输入分析:
mahout
下处理的文件必须是SequenceFile格式的,所以需要把txtfile转换成sequenceFile,而聚类必须是向量格式的,
mahout
提供下面两个命令来将文本转成向量形式1
arrow8071
·
2016-05-27 11:00
算法
机器学习
mahout
源码目录说明(转)
mahout
项目是由多个子项目组成的,各子项目分别位于源码的不同目录下,下面对
mahout
的组成进行介绍:1、
mahout
-core:核心程序模块,位于/core目录下;2、
mahout
-math:在核心程序中使用的一些数据通用计算模块
arrow8071
·
2016-05-27 11:00
算法
机器学习
hadoop +
mahout
安装配置
最近一直捣鼓
Mahout
,终于在Hadoop下成功跑起来了。由于涉及的点比较多,这里先记录整理一下,做参考备忘使用。
arrow8071
·
2016-05-25 20:00
hadoop
算法
机器学习
Hadoop生态系统
如:HDFS、MapReduce、Yarn、Zookeeper、Hive、HBase、Oozie、
Mahout
、Pig、Flume、Sqoop。
沐茈静
·
2016-05-24 20:58
hadoop
(转)
Mahout
使用入门
一、简介
Mahout
是ApacheSoftwareFoundation(ASF)旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。
arrow8071
·
2016-05-24 11:00
hadoop
算法
机器学习
用
Mahout
和 Elasticsearch 实现推荐系统
原文地址本文内容软件步骤控制相关性总结参考资料本文介绍如何用带Apache
Mahout
的MapRSandboxforHadoop和Elasticsearch搭建推荐引擎,只需要很少的代码。
船长&CAP
·
2016-05-24 10:00
用
Mahout
和 Elasticsearch 实现推荐系统
原文地址本文内容软件步骤控制相关性总结参考资料本文介绍如何用带Apache
Mahout
的MapRSandboxforHadoop和Elasticsearch搭建推荐引擎,只需要很少的代码。
船长&CAP
·
2016-05-24 10:00
第103课动手实战联合使用Spark Streaming、Broadcast、Accumulaor
以下代码实现在本机9999端口监听,并向连接上的客户端发送单词,其中包含黑名单的单词Hadoop,
Mahout
和Hive。packageorg.scala.optimportjava.io
葛晨鑫
·
2016-05-13 20:00
Mahout
的相似性度量(相似度算法)
UserCF和ItemCF都依赖于相似度的计算,因为只有通过衡量用户之间或物品之间的相似度,才能找到用户的“邻居”,才能完成推荐。上文简单的介绍了相似性的计算,但不完全,下面就对常用的相似度计算方法进行详细的介绍:1.基于皮尔森相关性的相似度——Pearsoncorrelation-basedsimilarity皮尔森相关系数反应了两个变量之间的线性相关程度,它的取值在[-1,1]之间。当两个变量
qq_14926159
·
2016-05-10 14:00
Mahout
推荐引擎
Mahout
in Action 学习---基于物品的分布式推荐算法(Wikipedia数据集)
文字总结自《
Mahout
inAction》中文版第六章的内容1.1数据集介绍Wikipedia数据集:一篇文章到另外一篇文章的链接。可以将文章看作是用户,将该文章指向的文章视为该源文章所喜欢的物品。
qq_17116557
·
2016-05-10 11:00
Mahout
基于 Apache
Mahout
构建社会化推荐引擎
推荐引擎简介推荐引擎利用特殊的信息过滤(IF,InformationFiltering)技术,将不同的内容(例如电影、音乐、书籍、新闻、图片、网页等)推荐给可能感兴趣的用户。通常情况下,推荐引擎的实现是通过将用户的个人喜好与特定的参考特征进行比较,并试图预测用户对一些未评分项目的喜好程度。参考特征的选取可能是从项目本身的信息中提取的,或是基于用户所在的社会或社团环境。根据如何抽取参考特征,我们可以
qq_14926159
·
2016-05-03 23:00
推荐引擎
推荐系统:协同过滤算法简介
同时在理论讲解的基础上,还会结合Apache
Mahout
介绍如何在大规模数据上实现各种推荐策略,进行策略优化,构建高效的推荐引擎的方法。
suibianshen2012
·
2016-04-28 15:00
数据挖掘
机器学习
推荐系统
基于用户的协同过滤算法
基于内容的协同过滤算法
mahout
分类学习和遇到的问题总结
这段时间学习
Mahout
有喜有悲。在这里首先感谢樊哲老师的指导。以下列出关于这次
Mahout
分类的学习和遇到的问题,还请大家多多提出建议:(全部文件操作都使用是在hdfs上边进行的)。
phlsheji
·
2016-04-20 10:00
上一页
6
7
8
9
10
11
12
13
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他