E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
MAHOUT
Mahout
: CVB
When run cvb, there is a error org.apache.hadoop.io.Text cannot be cast to org.apache.hadoop.io.IntWritable Solution: the new LDA requires SequenceFile<IntWritable, VectorWritable> as input
ylzhj02
·
2014-06-19 18:00
Mahout
Twenty Newsgroups Classification任务之二seq2sparse(1)
seq2sparse对应于
mahout
中的org.apache.
mahout
.vectorizer.SparseVectorsFromSequenceFiles,从昨天跑的算法中的任务监控界面可以看到这一步包含了
wbj0110
·
2014-06-19 11:00
Mahout
Twenty Newsgroups Classification任务之二seq2sparse(1)
seq2sparse对应于
mahout
中的org.apache.
mahout
.vectorizer.SparseVectorsFromSequenceFiles,从昨天跑的算法中的任务监控界面可以看到这一步包含了
wbj0110
·
2014-06-19 11:00
Mahout
Twenty Newsgroups Classification任务之二seq2sparse(1)
seq2sparse对应于
mahout
中的org.apache.
mahout
.vectorizer.SparseVectorsFromSequenceFiles,从昨天跑的算法中的任务监控界面可以看到这一步包含了
wbj0110
·
2014-06-19 11:00
Mahout
mahout
之TrainNaiveBayesJob源码分析
mahout
的trainnb调用的是TrainNaiveBayesJob完成训练模型任务。
wbj0110
·
2014-06-19 10:00
Mahout
mahout
之TrainNaiveBayesJob源码分析
mahout
的trainnb调用的是TrainNaiveBayesJob完成训练模型任务。
wbj0110
·
2014-06-19 10:00
Mahout
mahout
之TrainNaiveBayesJob源码分析
mahout
的trainnb调用的是TrainNaiveBayesJob完成训练模型任务。
wbj0110
·
2014-06-19 10:00
Mahout
mahout
之TestNaiveBayesDriver源码分析
有个参数sequential决定是否本地执行,这里只讲MapReduce执行。源代码如下, 1 2 3 4 5 6 7 8 9 10 11 12 private boolean runMapReduce (Map < string , List < String
wbj0110
·
2014-06-19 10:00
Mahout
mahout
之TestNaiveBayesDriver源码分析
有个参数sequential决定是否本地执行,这里只讲MapReduce执行。源代码如下, 1 2 3 4 5 6 7 8 9 10 11 12 private boolean runMapReduce (Map < string , List < String
wbj0110
·
2014-06-19 10:00
Mahout
mahout
之TestNaiveBayesDriver源码分析
有个参数sequential决定是否本地执行,这里只讲MapReduce执行。源代码如下, 1 2 3 4 5 6 7 8 9 10 11 12 private boolean runMapReduce (Map < string , List < String
wbj0110
·
2014-06-19 10:00
Mahout
Mahout
学习之
Mahout
简介、安装、配置、入门程序测试
原文地址:http://blog.csdn.net/aaronhadoop/article/details/24577221一、
Mahout
简介查了
Mahout
的中文意思——驭象的人,再看看
Mahout
gshengod
·
2014-06-19 10:00
数据挖掘
Mahout
Mahout
之SparseVectorsFromSequenceFiles源码分析
一系列添加选项的操作:包括minSupport,analyzerName,chunkSize,weight,minDF等等。123456789101112 Option chunkSizeOpt = obuilder.withLongName("chunkSize").withArgument(abuilder.withName("chunkSize").withMinimum(1).with
wbj0110
·
2014-06-19 10:00
Mahout
Mahout
之SparseVectorsFromSequenceFiles源码分析
一系列添加选项的操作:包括minSupport,analyzerName,chunkSize,weight,minDF等等。123456789101112 Option chunkSizeOpt = obuilder.withLongName("chunkSize").withArgument(abuilder.withName("chunkSize").withMinimum(1).with
wbj0110
·
2014-06-19 10:00
Mahout
Mahout
之SparseVectorsFromSequenceFiles源码分析
一系列添加选项的操作:包括minSupport,analyzerName,chunkSize,weight,minDF等等。123456789101112 Option chunkSizeOpt = obuilder.withLongName("chunkSize").withArgument(abuilder.withName("chunkSize").withMinimum(1).with
wbj0110
·
2014-06-19 10:00
Mahout
Hadoop学习路线图
Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop,
Mahout
, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN
niukor
·
2014-06-18 14:00
apache
mapreduce
hadoop hbase
关联规则二项集hadoop实现
近期看
mahout
的关联规则源码,颇为头痛,本来打算写一个系列分析关联规则的源码的,但是后面看到有点乱了,可能是稍微有点复杂吧,所以就打算先实现最简单的二项集关联规则。
wbj0110
·
2014-06-18 12:00
机器学习
关联规则二项集hadoop实现
近期看
mahout
的关联规则源码,颇为头痛,本来打算写一个系列分析关联规则的源码的,但是后面看到有点乱了,可能是稍微有点复杂吧,所以就打算先实现最简单的二项集关联规则。
wbj0110
·
2014-06-18 12:00
机器学习
关联规则二项集hadoop实现
近期看
mahout
的关联规则源码,颇为头痛,本来打算写一个系列分析关联规则的源码的,但是后面看到有点乱了,可能是稍微有点复杂吧,所以就打算先实现最简单的二项集关联规则。
wbj0110
·
2014-06-18 12:00
机器学习
Hadoop生态系统学习路线
主要介绍Hadoop家族产品,常用的项目包括Hadoop,Hive,Pig,HBase,Sqoop,
Mahout
,Zookeeper,Avro,Ambari,Chukwa,新增加的项目包括,YARN,Hcatalog
lwfcgz
·
2014-06-17 20:00
【甘道夫】并行化频繁模式挖掘算法FP Growth及其在
Mahout
下的命令使用
今天调研了并行化频繁模式挖掘算法PFPGrowth及其在
Mahout
下的命令使用,简单记录下试验结果,供以后查阅:环境:Jdk1.7+ Hadoop2.2.0单机伪集群+
Mahout
0.6(0.8
u010967382
·
2014-06-17 18:00
Mahout
: Integerate jcseg with
mahout
seq2parse
Google global sites url https://github.com/justjavac/Google-IPs JCSEG http://www.oschina.net/p/jcseg MMSEG http://technology.chtsai.org/mmseg/ //convert maven project to eclipse
ylzhj02
·
2014-06-16 18:00
Integer
hadoop2.2+
mahout
0.9实战
版本:hadoop2.2.0,
mahout
0.9。使用
mahout
的org.apache.
mahout
.cf.taste.hadoop.item.RecommenderJob进行测试。
wbj0110
·
2014-06-16 11:00
hadoop
Mahout
hadoop2.2+
mahout
0.9实战
版本:hadoop2.2.0,
mahout
0.9。使用
mahout
的org.apache.
mahout
.cf.taste.hadoop.item.RecommenderJob进行测试。
wbj0110
·
2014-06-16 11:00
hadoop
Mahout
hadoop2.2+
mahout
0.9实战
版本:hadoop2.2.0,
mahout
0.9。使用
mahout
的org.apache.
mahout
.cf.taste.hadoop.item.RecommenderJob进行测试。
wbj0110
·
2014-06-16 11:00
hadoop
Mahout
一个简单的在线推荐系统的实现
Mahout
,是一个可扩展的机器学习库,可用于单机,也可用于Hadoop。
ozhaohuafei
·
2014-06-15 11:00
Mahout
机器学习
推荐系统
Mahout
算法集
Apache
Mahout
是ApacheSoftwareFoundation(ASF)旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序
0-1
·
2014-06-13 16:00
Mahout
数据挖掘笔记-聚类-Canopy-并行处理分析
Canopy并行化处理在
Mahout
里面有很好的实现,网上有很多人都做过相关的分析,有的写的很详细,本来只想看看
Mahout
Canopy源码就好了,但还是觉得自己记录下也好。
wulinshishen
·
2014-06-13 12:00
mapreduce
数据挖掘
Mahout
聚类
CANOPY
数据挖掘笔记-聚类-Canopy-2
Canopy并行化处理在
Mahout
里面有很好的实现,网上有很多人都做过相关的分析,有的写的很详细,本来只想看看
Mahout
Canopy源码就好了,但还是觉得自己记录下也好。
fighting_2013
·
2014-06-13 12:00
java
算法
数据挖掘
聚类
CANOPY
Mahout
算法中new Configuration问题
版本:hadoop2.4+
mahout
0.9在web程序中调用云平台
mahout
的算法时,有时会遇到找不到路径的问题,比如org.apache.
mahout
.clustering.classify.ClusterClassifier
fansy1990
·
2014-06-13 11:00
Mahout
: Batch and online clustering
OnlinenewsclusteringClusteronemillionarticles,asshowedbelow,andsavetheclustercentroidsforallclusters. Periodically,foreachnewarticle,usecanopyclusteringtoassignittotheclusterwhosecentroidisclosest,bas
ylzhj02
·
2014-06-13 10:00
cluster
Mahout
协同过滤框架Taste的源码分析
推荐过程主要分成了如下几步来完成推荐1.输入数据预处理2.获取评分矩阵3.计算物品相似度4.矩阵乘法5.数据过滤6.计算推荐测试数据user&item12345133320244400355503444414继续阅读→
Cloud&Matrix
·
2014-06-12 16:00
Mahout
:Topic modeling using latent Dirichlet allocation (LDA)
Introduction To find these topics in a particular set of documents,We’d modify our clustering code to work with word vectors instead of the document vectors we’ve been using so far. A word vector is
ylzhj02
·
2014-06-12 14:00
location
Mahout
: Dirichlet clustering
Dirichlet clustering starts with a data set of points and a ModelDistribution. Think of ModelDistribution as a class that generates different models. You create an empty model and try to assign points
ylzhj02
·
2014-06-12 14:00
cluster
Mahout
: Fuzzy k-means clustering
Asthenamesays,thefuzzyk-meansclusteringalgorithmdoesafuzzyformofk-meansclustering.Insteadoftheexclusiveclusteringink-means,fuzzyk-meanstriestogenerateoverlappingclustersfromthedataset.Intheacademiccom
ylzhj02
·
2014-06-12 11:00
cluster
Mahout
: An overview of clustering techniques
DifferentkindsofclusteringproblemsEXCLUSIVECLUSTERINGInexclusiveclustering,anitembelongsexclusivelytoonecluster,notseveral.OVERLAPPINGCLUSTERINGWhatifwewantedtodonon-exclusiveclustering;thatis,putHarr
ylzhj02
·
2014-06-12 10:00
cluster
Mahout
实践指南
Mahout
实践指南《
Mahout
实践指南》内容全面而深入,既展示
Mahout
的强大功能,又全方位讲解利用
Mahout
进行大数据分类、聚类和预测分析的各种技术细节、方法和最佳实践;实战性强,包含丰富案例
李航421
·
2014-06-12 09:00
Mahout
实践指南
Mahout
: K-means clustering
K-meansAlgorithmThek-meansalgorithmwillstartwithaninitialsetofkcentroidpoints.Thealgorithmdoesmultipleroundsofprocessingandrefinesthecentroidlocationsuntiltheiterationmax-limitcriterionisreachedorunti
ylzhj02
·
2014-06-11 16:00
cluster
Mahout
: Clustering - Representing data
TransformingdataintovectorsIn
Mahout
,vectorsareimplementedasthreedifferentclassesDenseVectorcanbethoughtofasanarrayofdoubles
ylzhj02
·
2014-06-11 11:00
cluster
mahout
源码分析之贝叶斯算法
整个流程包括数据处理部分和分类算法部分。数据处理部分对语料库进行处理生成算法能执行的标准格式。分类算法部分的实现被分作三个部分:训练器(The Trainer)、数据模型(The Model)、分类器(The Classifier)。 数据预处理 PrepareTwentyNewsgroups for(dir in categoryDirec
wbj0110
·
2014-06-11 09:00
机器学习
mahout
源码分析之贝叶斯算法
整个流程包括数据处理部分和分类算法部分。数据处理部分对语料库进行处理生成算法能执行的标准格式。分类算法部分的实现被分作三个部分:训练器(The Trainer)、数据模型(The Model)、分类器(The Classifier)。 数据预处理 PrepareTwentyNewsgroups for(dir in categoryDirec
wbj0110
·
2014-06-11 09:00
机器学习
mahout
源码分析之贝叶斯算法
整个流程包括数据处理部分和分类算法部分。数据处理部分对语料库进行处理生成算法能执行的标准格式。分类算法部分的实现被分作三个部分:训练器(The Trainer)、数据模型(The Model)、分类器(The Classifier)。 数据预处理 PrepareTwentyNewsgroups for(dir in categoryDirec
wbj0110
·
2014-06-11 09:00
机器学习
mahout
将数据集synthetic_control.data放到
MAHOUT
wbj0110
·
2014-06-10 10:00
机器学习
mahout
将数据集synthetic_control.data放到
MAHOUT
wbj0110
·
2014-06-10 10:00
机器学习
mahout
将数据集synthetic_control.data放到
MAHOUT
wbj0110
·
2014-06-10 10:00
机器学习
五个最给力的Hadoop项目
2.
Mahout
:
Mahout
是一个基于Hadoop实现各种机器学习与数据挖掘算法库。被
午火
·
2014-06-09 16:00
OnlineLogisticRegression
mahout
源码分析AdaptiveLogisticRegression.java实现了OnlineLearner接口。
Johnny_Lee
·
2014-06-05 14:00
Mahout
dw
hadoop2.x整合手册【4】---
mahout
0.9安装部署与测试
基本过程和0.8版本的安装http://blog.csdn.net/xqj198404/article/details/9619265的一致需要在bin目录下的
mahout
文件的头部添加如下环境变量HADOOP_CONF_DIR
xqj198404
·
2014-06-05 11:00
hadoop
内存
Mahout
Hello
Mahout
Hello
Mahout
1.新建javaproject测试代码:importorg.apache.
mahout
.cf.taste.impl.model.file.*; importorg.apache.
mahout
.cf.taste.impl.neighborhood
traceorigin
·
2014-06-02 00:00
Mahout
安装与配置笔记
Linuxubuntu-13.04-desktop-i386jdk安装版本:jdk-7u51-linux-i586Hadoop版本:Hadoop-1.1.1(一个Namenode,三个Datanode部署)二、安装步骤在
Mahout
kartik
·
2014-06-01 15:56
安装
配置
hadoop
Hadoop
Mahout
安装与配置笔记
Linuxubuntu-13.04-desktop-i386jdk安装版本:jdk-7u51-linux-i586Hadoop版本:Hadoop-1.1.1(一个Namenode,三个Datanode部署)二、安装步骤在
Mahout
kartik
·
2014-06-01 15:56
hadoop
安装
配置
Mahout
上一页
19
20
21
22
23
24
25
26
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他