Mahout 第3页

Madlib库

目前，适用于统计分析/机器学习的语言/库有很多，如专为数据分析用途而设计的R语言，Python语言的机器学习库Scikits，支持分布式环境扩展的有基于Map-Reduce实现的Mahout，以及分布式内存计算框架

tao_wei162·2020-09-16 23:15

Mahout的taste推荐系统里的几种Recommender分析

Taste简介看自:http://blog.csdn.net/zhoubl668/article/details/13297583Mahout是apache下的一个java语言的开源大数据机器学习项目，

mrwang·2020-09-16 20:11

mahout0.7 使用 JDBCDataModel

首先创建在mysql中创建库以及对应的表mysql>createdatabasemahout;QueryOK,1rowaffected(0.00sec)mysql>usemahout;Databasechangedmysql

mrwang·2020-09-16 20:11

Mahout数据承载

转自:http://blog.csdn.net/zhoubl668/article/details/13508417推荐数据的处理是大规模的，在集群环境下一次要处理的数据可能是数GB，所以Mahout针对推荐数据进行了优化

mrwang·2020-09-16 20:11

Mahout中相似度计算方法介绍

mrwang·2020-09-16 20:11

mahout所实现的算法

https://cwiki.apache.org/confluence/display/MAHOUT/Algorithms列出mahout所实现或正在实现的一些算法ClassificationLogisticRegression

mrwang·2020-09-16 20:11

大数据推荐系统（8）分布式数据收集和存储

礼拜天吃芋圆·2020-09-15 15:14

hadoop SequenceFileOutputFormat与LzopCodec压缩问题

pan12jian·2020-09-15 14:32

mahout做推荐时uid，pid为string类型

pan12jian·2020-09-15 14:32

Spark系列(1)—Spark单机安装与测试

Spark作为最有可能代替mapreduce的分布式计算框架，当前非常火，本人也开始关注Spark并试着从hadoop+mahout转向Spark。

pan12jian·2020-09-15 13:41

maven打成可执行jar包和添加自定义jar包

mahout项目是采用maven进行管理的，maven和ant一样都是项目管理的工具，它的特点在与对于第三方jar包的管理。

mypop·2020-09-15 08:08

Mahout聚类分析

查看原文聚类分析什么是聚类分析？聚类(Clustering)就是将数据对象分组成为多个类或者簇(Cluster)，它的目标是：在同一个簇中的对象之间具有较高的相似度，而不同簇中的对象差别较大。所以，在很多应用中，一个簇中的数据对象可以被作为一个整体来对待，从而减少计算量或者提高计算质量。其实聚类是一个人们日常生活的常见行为，即所谓“物以类聚，人以群分”，核心的思想也就是聚类。人们总是不断地改进下意

azhao_dn·2020-09-14 18:42

Hadoop应用开发实战案例视频教程

课程目录│├─作业│作业.rar11KB│├─第10周聚类算法应用，分析优质客户(Map-Reduce,Mahout)│hadoop_dev_10.rar114.26MB│Hadoop_dev_10.zip1.79MB

weixin_46240970·2020-09-13 13:45

基于Hadoop2.6.0的Mahout0.12.1的配置与使用

一.Mahout的安装1.下载在http://mirror.bit.edu.cn/apache/mahout/0.12.1/下载地址中下载apache-mahout-distribution-0.12.1

是可大吖哈·2020-09-13 06:27

大数据系列文章汇总 - 更新到15篇----------IT十年

YARN大数据(四)-MapReduce大数据(五)-HBase大数据(六)-ZooKeeper大数据(七)-Flume大数据(八)-Sqoop大数据(九)-Hive大数据(十)-Pig大数据(十一)-Mahout

iFTY_Rostiute·2020-09-12 23:40

伪分布式hadoop+mahout部署及20newsgroups经典算法测试

--------------------------------------------------------------------------第一阶段：hadoop的伪分布式安装第二阶段：mahout

weixin_30800807·2020-09-12 17:28

对数似然比相似度

最近在看mahout的相似性度量时，对其中的对数似然比相似度颇为好奇，由于书本上完全没有涉及到对数似然比相似度的计算原理，只是提供了一个函数接口，因此决定深入了解一下这个对数似然比相似度。

xidianycy·2020-09-12 12:58

经典Hadoop家族系列文章

经典Hadoop家族系列文章一学习路线图Hadoop家族学习路线图开篇必读Hive学习路线图学习hadoop到上手工作线路指导（中级篇）零基础学习hadoop到上手工作线路指导（编程篇）Mahout学习路线图二编程实践

Thomas-yang·2020-09-11 15:28

Oozie、Flume、Mahout配置与应用

-------------------------Oozie--------------------【一、部署】1）部署Oozie服务端[root@cMaster~]#sudoyuminstalloozie#cMaster上以root权限执行，部署Oozie服务端2）部署Oozie客户端[root@iClient~]f#sudoyuminstalloozie-client【二、配置文件】3）修改/

weixin_30480583·2020-09-11 04:46

用MapReduce实现矩阵乘法

Hadoop家族系列文章，主要介绍Hadoop家族产品，常用的项目包括Hadoop,Hive,Pig,HBase,Sqoop,Mahout,Zookeeper,Avro,Ambari,Chukwa，新增加的项目包括

Fens·2020-09-11 01:16

大数据分析技术研究报告(四)

作者：朱赛凡四大数据背景下数据分析挖掘技术介绍1Mahout与MLlib项目数据分析挖掘主要涉及两个方面：一是数据预处理；二是数据挖掘。

njpjsoftdev·2020-08-25 03:11

weixin_33725272·2020-08-24 17:44

Mahout 对推荐数据的抽象表示（下部分）

这篇博客是延续上部分的补充：Mahout对推荐数据的抽象表示（上部分）处理无Preferencevalues数据下面都是围绕Mahout对没有Preferencevalues的数据的推荐。

weixin_30414635·2020-08-24 16:50

mahout基于用户的协同过滤-userCF

首先参考文章用Maven构建Mahout项目：http://blog.fens.me/hadoop-mahout-maven-eclipse/完成了利用maven搭建的mahout推荐项目。

tonylee1219·2020-08-24 16:46

【mahout笔记】初步理解itemCF（基于物品的推荐算法）在mahout的实现

之前分析了基于用户的CF的原理。今天尝试调试一下基于物品的CF算法。再次声明，本文部分内容是参考：https：//blog.csdn.net/wolvesqun/article/details/52757772感谢大佬的整理为我指明方向。基于物品的CF的原理和基于用户的CF类似，只是在计算邻居时采用物品本身，而不是从用户的角度，即基于用户对物品的偏好找到相似的物品，然后根据用户的历史偏好，推荐相似

猫球球·2020-08-24 16:43

Running_you·2020-08-24 16:11

我是楠楠·2020-08-24 15:31

Fens·2020-08-24 14:17

用R解析Mahout用户推荐协同过滤算法(UserCF)

RHadoop实践系列文章，包含了R语言与Hadoop结合进行海量数据分析。Hadoop主要用来存储海量数据，R语言完成MapReduce算法，用来替代Java的MapReduce实现。有了RHadoop可以让广大的R语言爱好者，有更强大的工具处理大数据1G,10G,100G,TB,PB。由于大数据所带来的单机性能问题，可能会一去不复返了。RHadoop实践是一套系列文章，主要包括”Hadoop环

Fens·2020-08-24 14:17

Some Libraries For Machine Learning And Computer Vision

主要是参考以下网址的，有兴趣的可以去看看：http://mloss.org/software/jmlr/ApproachMahout：java库。需要Maven编译。

H349117102·2020-08-24 13:44

Mahout实例（UserCF,ItermCF,SlopOne）

自己也尝试了自己动手实现一下，但是比起Mahout开源项目中的算法效率，我写的效率很低，所以就决定使用Mahout了，虽然Mahout只是封装了一些基本

kyrin_云中鹤·2020-08-24 12:00

mahout学习（1）userCF+itemCF

主要参考文档mahout-in-action中的第二章【推荐】对于userCF，要先获取评分数据存于DataModel中，定义用户间相似度的计算方法Similarity，可利用一定方法如KNN来求相似用户

YYlxid·2020-08-24 12:51

Hadoop的理解

——资源及数据管理层，YARN以及Sentry等上层——MapReduce、Impala、Spark等计算引擎顶层——基于MapReduce、Spark等计算引擎的高级封装及工具，如Hive、Pig、Mahout

沒·2020-08-24 11:06

Mahout bayes分类器

实现包括三部分：TheTrainer（训练器）、TheModel（模型）、TheClassifier（分类器）1、训练首先，要对输入数据进行预处理，转化成BayesM/Rjob读入数据要求的格式，即训练器输入的数据是KeyValueTextInputFormat格式，第一个字符是类标签，剩余的是特征属性（即单词）。以20个新闻的例子来说，从官网上下载的原始数据是一个分类目录，下面每个文件夹名就是类

TheAlgorithmArt·2020-08-24 07:01

ALS算法解析

同样是大规模计算平台，Hadoop中的机器学习算法库Mahout就集成了多种推荐算法，不但有user-cf和item-cf这种经典算法，还有KNN、SVD，Slopeone这些，可谓随意挑选，简繁由君。

公众号:JavaEdge·2020-08-24 01:35

使用mahout进行k-means聚类[翻译]

http://mahout.apache.org/users/clustering/k-means-clustering.htmlk-Meansisasimplebutwell-knownalgorithmforgroupingobjects

阳春是你·2020-08-23 03:59

重拾梦想·2020-08-22 17:16

基于hadoop的社交网络的分析

首先说一下项目流程，用mapreduce对数据进行预处理，然后用mahout中的聚类算法（kmeans）对数据进行处理，最后用peoplerank对数据进行处理。

a296777513·2020-08-22 12:34

Hadoop生态圈中存在的Apache顶级项目

2010年5月，Mahout脱离Hadoop项目，成为Apache顶级项目。2010年9月，Hive(Facebook)脱离Hadoop，成

cdf861015·2020-08-21 13:04

mahout推荐算法——协同过滤推荐算法（java代码实现）

什么是协同过滤协同过滤是利用集体智慧的一个典型方法。要理解什么是协同过滤(CollaborativeFiltering,简称CF)，首先想一个简单的问题，如果你现在想看个电影，但你不知道具体看哪部，你会怎么做？大部分的人会问问周围的朋友，看看最近有什么好看的电影推荐，而我们一般更倾向于从口味比较类似的朋友那里得到推荐。这就是协同过滤的核心思想。协同过滤一般是在海量的用户中发掘出一小部分和你品位比较

爱篮球爱IT·2020-08-21 07:19

mahout安装配置

1.下载mahout下载地址:http://mahout.apache.org我下载的最新版：mahout-distribution-0.92.把mahout解压到你想存放的文档，我是放在/Users/

weixin_30764883·2020-08-20 19:33

单机环境及分布式环境下K-Means聚类算法的运行实例

单机环境下的K-Means聚类算法运行实例参考书籍《MahoutinAction》：要资源的可以找我~（中英文都有）在eclipse平台上实现K-Means实例代码如下：packagekmeans;importjava.io.File

sunny_yeah_·2020-08-20 06:25

maven打包hadoop项目（含第三方jar）

2mahout中itembased算法，将uid从string映射为long。我这里实现的具体功能是：Mahout的itembased算法的数据格式是：uid,vid,score。

lingerlanlan·2020-08-19 10:30

大数据学习路线（自己制定的，从零开始）

Linux(shell,高并发架构,lucene,solr)Hadoop(Hadoop,HDFS,Mapreduce,yarn,hive,hbase,sqoop,zookeeper,flume)机器学习(R,mahout

weixin_34318956·2020-08-18 17:47

Haddoop大数据教程笔记_02_Hadoop生态圈简介

Hadoop生态圈简介目录Hadoop生态圈简介Hadoop生态圈：（一）Hdfs（二）Mapreduce（三）Hive（四）Hbase（五）Zookeeper（六）Sqoop（七）Pig（八）Mahout

Snowing_inhope·2020-08-18 10:58

mahout 常见机器学习算法及分类

一直没有梳理接触到的东西，常见算法分类：推荐系统（推荐引擎）：基于用户的协同过滤算法UserCF近邻算法，容易实现基于物品的协同过滤算法ItemCF速度快，容易实现分布式计算SlopeOne算法@Deprecatedatmahout0.8KNNLinearinterpolationitem–based

weixin_34347651·2020-08-16 21:28

相似度计算方式的总结：java或python实现代码

silent狼·2020-08-16 10:45

eclipse 下导入mahout

1，先装maven2，再装mahout----------------注意下载的是不是src源码的，如果是，还要通过里面的redeme.txt，按照命令操作编译建议下载压缩版的distrbuition版本

玉青戈·2020-08-16 10:48

大数据工程师学习大纲汇总

大数据工程师技能图谱大数据通用处理平台SparkFlinkHadoop分布式存储HDFS资源调度YarnMesos机器学习工具MahoutSparkMlibTensorFlow(Google系)AmazonMachineLearningDMTK

silentanytime·2020-08-16 08:47

推荐频道

Mahout

Madlib库

Mahout的taste推荐系统里的几种Recommender分析

mahout0.7 使用 JDBCDataModel

Mahout数据承载

Mahout中相似度计算方法介绍

mahout所实现的算法

大数据推荐系统（8）分布式数据收集和存储

hadoop SequenceFileOutputFormat与LzopCodec压缩问题

mahout做推荐时uid，pid为string类型

Spark系列(1)—Spark单机安装与测试

maven打成可执行jar包和添加自定义jar包

Mahout聚类分析

Hadoop应用开发实战案例视频教程

基于Hadoop2.6.0的Mahout0.12.1的配置与使用

大数据系列文章汇总 - 更新到15篇----------IT十年

伪分布式hadoop+mahout部署及20newsgroups经典算法测试

对数似然比相似度

经典Hadoop家族系列文章

Oozie、Flume、Mahout配置与应用

用MapReduce实现矩阵乘法

推荐引擎初探

大数据分析技术研究报告(四)

Mahout学习系列之推荐算法

Mahout 对推荐数据的抽象表示（下部分）

mahout基于用户的协同过滤-userCF

【mahout笔记】初步理解itemCF（基于物品的推荐算法）在mahout的实现

Mahout之推荐算法基本实例

基于mahout的推荐系统 下

用Hadoop构建电影推荐系统

用R解析Mahout用户推荐协同过滤算法(UserCF)

Some Libraries For Machine Learning And Computer Vision

Mahout实例（UserCF,ItermCF,SlopOne）

mahout学习（1）userCF+itemCF

Hadoop的理解

Mahout bayes分类器

ALS算法解析

使用mahout进行k-means聚类[翻译]

mahout推荐引擎总结

基于hadoop的社交网络的分析

Hadoop生态圈中存在的Apache顶级项目

mahout推荐算法——协同过滤推荐算法（java代码实现）

mahout安装配置

单机环境及分布式环境下K-Means聚类算法的运行实例

maven打包hadoop项目（含第三方jar）

大数据学习路线（自己制定的，从零开始）

Haddoop大数据教程笔记_02_Hadoop生态圈简介

mahout 常见机器学习算法及分类

相似度计算方式的总结：java或python实现代码

eclipse 下导入mahout

大数据工程师学习大纲汇总

基于mahout的推荐系统下