E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
MAHOUT
数据挖掘-
Mahout
-Canopy聚类实践
1、原理解释(1)原始数据集合List按照一定的规则进行排序,初始距离阈值设置为T1、T2,T1>T2。(2)在List中随机挑选一个数据向量A,使用一个粗糙距离计算方式计算A与List中其它样本数据向量之间的距离d。(3)根据2中的距离d,把d小于T1的样本数据向量划到一个canopy中,同时把d小于T2的样本数据向量从List中移除。(4)重复2、3,直至List为空2、下载测试数据cd/tm
刀刀_高扬
·
2015-10-22 20:38
hadoop
大数据
Mahout
聚类
CANOPY
数据挖掘-
Mahout
-Canopy聚类实践
1、原理解释(1)原始数据集合List按照一定的规则进行排序,初始距离阈值设置为T1、T2,T1>T2。(2)在List中随机挑选一个数据向量A,使用一个粗糙距离计算方式计算A与List中其它样本数据向量之间的距离d。(3)根据2中的距离d,把d小于T1的样本数据向量划到一个canopy中,同时把d小于T2的样本数据向量从List中移除。(4)重复2、3,直至List为空2、下载测试数据cd/tm
刀刀_高扬
·
2015-10-22 20:38
hadoop
大数据
Mahout
聚类
CANOPY
数据挖掘-
Mahout
-Canopy聚类实践
1、原理解释(1)原始数据集合List按照一定的规则进行排序,初始距离阈值设置为T1、T2,T1>T2。(2)在List中随机挑选一个数据向量A,使用一个粗糙距离计算方式计算A与List中其它样本数据向量之间的距离d。(3)根据2中的距离d,把d小于T1的样本数据向量划到一个canopy中,同时把d小于T2的样本数据向量从List中移除。(4)重复2、3,直至List为空2、下载测试数据cd/tm
刀刀_高扬
·
2015-10-22 20:38
mahout
hadoop
canopy
大数据
安装
Mahout
1、下载
Mahout
cd/tmpwgethttp://mirrors.cnnic.cn/apache/
mahout
/0.11.0/apache-
mahout
-distribution-0.11.0.tar.gz2
刀刀_高扬
·
2015-10-22 10:24
hadoop
安装
数据挖掘
Mahout
安装
Mahout
1、下载
Mahout
cd/tmpwgethttp://mirrors.cnnic.cn/apache/
mahout
/0.11.0/apache-
mahout
-distribution-0.11.0.tar.gz2
刀刀_高扬
·
2015-10-22 10:24
hadoop
安装
数据挖掘
Mahout
安装
Mahout
1、下载
Mahout
cd/tmpwgethttp://mirrors.cnnic.cn/apache/
mahout
/0.11.0/apache-
mahout
-distribution-0.11.0.tar.gz2
刀刀_高扬
·
2015-10-22 10:24
安装
mahout
hadoop
数据挖
大数据
mahout
一、
mahout
简介
mahout
是ApacheSoftWareFoundation旗下的一个开源项目,提供一些可扩展的机器学习领域的经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。
u013360022
·
2015-10-21 21:00
hadoop
Mahout
分类
聚类
MapReduce的应用场景
MapReduce的典型应用场景中,目前日志分析用的比较多,还有做搜素的索引,机器学习算法包
mahout
也是之一,当然它能做的东西还有很多,比如数据挖掘、信息提取。
·
2015-10-21 12:22
mapreduce
Mahout
源码目录说明
mahout
项目是由多个子项目组成的,各子项目分别位于源码的不同目录下,下面对
mahout
的组成进行介绍: 1、
mahout
-core:核心程序模块,位于/core目录下; 2、
mahout
-math
·
2015-10-21 12:25
Mahout
学习
Mahout
(四)
在
Mahout
学习(三)中,我贴了example的代码,里面生成向量文件的代码: InputDriver.runJob(input, directoryContainingConvertedInput
·
2015-10-21 12:37
Mahout
学习
Mahout
(三)
开发+运行第一个
Mahout
的程序 代码: /** * Licensed to the Apache Software Foundation (ASF) under one or more
·
2015-10-21 12:36
Mahout
学习
Mahout
(二)
这篇博客介绍如何跑一下
mahout
自带的Hello world程序 我将
mahout
安装在/opt/hadoop/
mahout
-distribution-0.9 cd /opt/hadoop/
mahout
-distribution
·
2015-10-21 12:35
Mahout
学习
Mahout
(一)
Mahout
官方下载地址:http://apache.fayea.com/apache-mirror/
mahout
/ 环境ubuntu 12.04, hadoop1.2.1 ,
mahout
0.9
·
2015-10-21 12:34
Mahout
mahout
的安装、配置及运行java程序
一、下载安装包:http://
mahout
.apache.org/general/downloads.html二、解压:将下载的安装包解压到需要的目录下三、配置环境变量:export
MAHOUT
_HOME
Iris ^
·
2015-10-16 15:00
mac 下maven的安装
最近在学习
mahout
,这些安装相关软件的步骤先记下来,避免以后忘记。
Iris ^
·
2015-10-15 17:00
Mahout
学习路线图
Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop,Hive,Pig,HBase,Sqoop,
Mahout
,Zookeeper,Avro,Ambari,Chukwa,新增加的项目包括
kexinmei
·
2015-10-13 18:00
大数据
Mahout
【用户行为分析】【
Mahout
】调研学习之一:分析算法简要总结
引言:
Mahout
是什么
Mahout
是Hadoop家族中与众不同的一个成员,是基于一个Hadoop的机器学习和数据挖掘的分布式计算框架。
昕玫
·
2015-10-13 17:44
hadoop
大数据
Mahout
用户行为分析
大数据分析
【用户行为分析】【
Mahout
】调研学习之一:分析算法简要总结
引言:
Mahout
是什么
Mahout
是Hadoop家族中与众不同的一个成员,是基于一个Hadoop的机器学习和数据挖掘的分布式计算框架。
kexinmei
·
2015-10-13 17:00
hadoop
大数据
Mahout
用户行为分析
Mahout
算法解析与案例实战 笔记目录
Mahout
简介第一章
Mahout
简介
Mahout
安装配置聚类算法分类算法系统过滤算法模式挖掘算法
Mahout
中的其它算法FriendFind系统WineIdentification系统DatingRecommender
u011414200
·
2015-10-12 10:00
[置顶] 读书笔记——总体架构目录
引用块内容IT项目管理《构建之法》——邹欣Hadoop
Mahout
《
Mahout
算法解析与案例实战》——樊哲SparkScala
u011414200
·
2015-10-12 10:00
第一章
Mahout
简介
笔记内容援引《
Mahout
算法解析与案例实战》Mathout简介
Mahout
应用背景”云计算“是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需提供给计算机和其他设备,这样可以最大限度
u011414200
·
2015-10-12 10:00
Mahout
学习之命令行创建序列文件
一:命令行转换创建新的工作目录mkdirlastfmmkdir./lastfm/originalexportWORK_DIR=/home/thinkgamer/document/lastfmcd$WORK_DIR自己准备一个数据集放在original文件夹下,例如将点击打开链接下边的数据保存在synthetic_control.data中进行转换,首先将其放在origiinal文件夹中进入maho
Gamer_gyt
·
2015-10-11 14:00
hadoop
Mahout
创建序列文件
Mahout
学习之运行canopy算法错误及解决办法
中运行编译打包好的jar程序,可能会报下面的错误: Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/
mahout
Gamer_gyt
·
2015-10-11 13:00
File
Mahout
机器学习
squence
AbstractJob
canopy算法
[原]
Mahout
对推荐数据的抽象表示(下部分)
这篇博客是延续上部分的补充:
Mahout
对推荐数据的抽象表示(上部分)处理无Preferencevalues数据下面都是围绕
Mahout
对没有Preferencevalues的数据的推荐。
huruzun
·
2015-10-11 06:00
Mahout
聚类算法学习之Canopy算法的分析与实现
3.1Canopy算法3.1.1Canopy算法简介 Canopy算法的主要思想是把聚类分为两个阶段:阶段一,通过使用一个简单、快捷的距离计算方法把数据分为可重叠的子集,称为“canopy”;阶段二,通过使用一个精准、严密的距离计算方法来计算出现在阶段一中同一个canopy的所有数据向量的距离。这种方式和之前的聚类方式不同的地方在于使用了两种距离计算方式,同时因为只计算了重叠部分的数据向量,所
Gamer_gyt
·
2015-10-09 16:00
hadoop
Mahout
机器学习
canopy算法
[原]
Mahout
对推荐数据的抽象表示(上部分)
学习
Mahout
推荐相关算法前,我们必须先要理解
Mahout
如何对推荐数据进行抽象表示。
huruzun
·
2015-10-09 05:00
[algorithm][Reprint&summary]随机梯度下降法
新项目要用到多元线性回归,1、http://m.blog.csdn.net/blog/fansy1990/23766523提到实现算法在
mahout
中的位置,2、查询
mahout
-core的api,发现其实现方法为随机梯度下降法
xia4820723
·
2015-09-28 09:00
算法
Mahout
Hadoop 2.6.0+Hbase1.12+
mahout
0.9 集群搭建
建议配置1台,克隆两台,修改/etc/hostname即可创建hadoop用户组和用户创建用户组 sudo addgroup hadoop创建用户sudo adduser -ingroup hadoop hadoop给hadoop用户添加权限,打开/etc/sudoers文件sudo gedit /etc/sudoers在root ALL=(ALL)ALL行下添加ALL=(ALL:ALL)
u014028392
·
2015-09-24 00:00
hadoop
大数据
Mahout
hbase
Mahout
学习之
Mahout
简介、安装、配置、入门程序测试
一、
Mahout
简介查了
Mahout
的中文意思——驭象的人,再看看
Mahout
的logo,好吧,想和小黄象happy地玩耍,得顺便陪陪这位驭象人耍耍了...附logo:(就是他,骑在象头上的那个
Mahout
Gamer_gyt
·
2015-09-20 12:00
hadoop
Mahout安装
Apache分支
Mahout
推荐的简单实现
由于courseproject需要,我最近看了一下
Mahout
的推荐实现。最初看到的是这篇文章。里面的代码毫无问题,不过引包的时候错误重重。因此重新写一下,希望能帮助到有同样问题的同学。
glgjssy
·
2015-09-20 04:59
Mahout
Mahout
推荐的简单实现
由于courseproject需要,我最近看了一下
Mahout
的推荐实现。最初看到的是这篇文章。里面的代码毫无问题,不过引包的时候错误重重。因此重新写一下,希望能帮助到有同样问题的同学。
glgjssy
·
2015-09-20 04:59
Mahout
用户体验我有话说
偶是一名码农,毕业至今工作四年,第一年主要做偏底层的东西(
Mahout
和Storm),由于没有什么前线的业务场景,对用户体验这种东西感受不深。
昨日西风紧
·
2015-09-18 14:39
用户体验
Elasticsearch:Elasticsearch基础上构建推荐引擎 资料收集
1.深入了解推荐引擎组件(基于Apache
Mahout
和Elasticsearch)http://www.csdn.net/article/2015-05-14/2824676ES+
mahout
机器学习做用户筛选
kexinmei
·
2015-09-15 10:00
elasticsearch
推荐系统
mahout
学习之二——
mahout
0.9kmeans聚类实例
最近学习《
Mahout
实战》,但是书中的代码是实用
mahout
0.5版本,很多地方在
mahout
0.9版本中已经改头换面了,经调试,阅读
mahout
0.9api,运行结果如图:修改代码如下:packagecn.kelaile.hadooptest
u010910436
·
2015-09-12 15:00
Mahout
kmeans
Mahout
简介
Mahout
简介
Mahout
是ApacheSoftwareFoundation(ASF)旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。
u011414200
·
2015-09-11 09:00
非常好的协同过滤入门文章
同时在理论讲解的基础上,还会结合Apache
Mahout
介绍如何在大规模数据上实现各种推荐策略,进行策略优化,构建高效的推荐引擎的方法。
jzwong
·
2015-09-05 20:00
Mahout
搭建开发环境 + 实现项目示例
背景介绍笔者我此时是一个完全没用过
Mahout
的门外汉,对Hadoop也没有实际使用经验,算是真正的零基础。
u011414200
·
2015-09-04 12:00
Hadoop里的数据挖掘应用-
Mahout
——学习笔记<三>
这是小象学院hadoop2.X的笔记 由于平时对数据挖掘做的比较多,所以优先看
Mahout
方向视频。
尾巴AR
·
2015-08-28 23:00
Mahout
安装与配置
Mahout
是Hadoop的一种高级应用。运行
Mahout
需要提前安装好Hadoop。Hadoop的安装网上很多,并不复杂,这里不再讲述,接下来阐述怎么安装
Mahout
。1:下载二进制解压安装。
余财源
·
2015-08-22 23:44
安装
Mahout
伪分布式
Mahout
安装与配置
Mahout
是Hadoop的一种高级应用。运行
Mahout
需要提前安装好Hadoop。Hadoop的安装网上很多,并不复杂,这里不再讲述,接下来阐述怎么安装
Mahout
。1:下载二进制解压安装。
余财源
·
2015-08-22 23:44
mahout
伪分布式
安装
Hadoop
Centos6.5 + Hadoop2.2.0 +
Mahout
安装(Maven & 发布版安装)
Mahout
简介
Mahout
是ApacheSoftwareFoundation(ASF)旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。
u011414200
·
2015-08-22 13:00
Hadoop Web项目--
Mahout
0.10 MR算法集锦
Myeclipse2014,JDK1.8,Hadoop2.6,MySQL5.6,EasyUI1.3.6,jQuery2.0,Spring4.1.3,Hibernate4.3.1,Struts2.3.1,Maven3.2.1,
Mahout
0.10
fansy1990
·
2015-08-18 17:00
开发
Mahout
MapReduc监控
hadoop-web
mahout调用
mahout
环境搭建
环境:操作系统:ubuntu12.04JDK:1.6maven:3.2.5
mahout
:0.7eclipse:4.2.21、因为
mahout
是基于maven搭建的,所以第一步需要安装maven参考这篇文章
lfdanding
·
2015-08-12 19:00
maven
Mahout
探索推荐引擎内部的秘密,第 1 部分: 推荐引擎初探
同时在理论讲解的基础上,还会结合Apache
Mahout
介绍如何在大规模数据上实现各种推荐策略,进行策略优化,构建高效的推荐引擎的方法。
Endeavour
·
2015-08-12 17:00
Mahout
推荐系统引擎RecommenderEvaluator源码解析
在http://blog.csdn.net/jianjian1992/article/details/47304337里边有关于推荐系统的完整代码,其中有一个评价器RecommenderEvaluator用来评价推荐器的好坏。RecommenderEvaluatorevalutor=newAverageAbsoluteDifferenceRecommenderEvaluator(); System
jianjian1992
·
2015-08-11 20:00
Mahout
Evaluator
Recommende
Mahout
推荐系统引擎UserCF中的IRStats部分源码解析
Mahout
提供推荐系统引擎是模块化的,分为5个主要部分组成:1.数据模型2.相似度算法3.近邻算法4.推荐算法5.算法评分器今天好好看了看关于推荐算法以及算法评分部分的源码。
jianjian1992
·
2015-08-07 11:00
Mahout
IRStatics
Mahout
安装与第一次使用--用户协同过滤
1.下载
Mahout
http://archive.apache.org/dist/
mahout
/因为我用的是Ubuntu,所以下载的是2.解压缩下载之后存在/home/user/Downloads目录下
jianjian1992
·
2015-08-05 17:00
maven
Mahout
Hadoop入门进阶课程9--
Mahout
介绍、安装与应用案例
1搭建环境部署节点操作系统为CentOS,防火墙和SElinux禁用,创建了一个shiyanlou用户并在系统根目录下创建/app目录,用于存放Hadoop等组件运行包。因为该目录用于安装hadoop等组件程序,用户对shiyanlou必须赋予rwx权限(一般做法是root用户在根目录下创建/app目录,并修改该目录拥有者为shiyanlou(chown–Rshiyanlou:shiyanlou/
yirenboy
·
2015-08-03 15:00
hadoop
大数据
进阶
[error handle][
mahout
] 由于空字符串错误导致model创建失败
REASON图书馆项目,今天想测试下
mahout
的图书推荐算法。借阅数据有30多万条,用kettle处理过后是这样long,long,flout型,用逗号隔开,符合要求。
xia4820723
·
2015-07-30 16:00
Mahout
让
mahout
0.7在hadoop2.0环境下运行
由于官方打的jar包是用1.0环境下的,所以要想在2.0下运行,必须重新打包,重新打包前修改几个pom文件就可以,现已经测试通过:1、根pom文件修改如下:2.5.0 org.apache.hadoop hadoop-core ${hadoop.version} net.sf.kosmosfs kfs org.mortbay.jetty jetty org.mortbay.jet
zyj8170
·
2015-07-27 15:00
上一页
12
13
14
15
16
17
18
19
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他