E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
MAHOUT
大数据hadoop培训总结
第四天:实现数据分析需求,ETL与数据展示模块;
Mahout
安装
SadOnMyOwn
·
2020-06-22 04:55
大数据
mahout
详解
前言用
Mahout
来构建推荐系统,是一件既简单又困难的事情。
首席撩妹指导官
·
2020-06-21 05:33
大数据
mahout
推荐介绍-2
转载自:http://hi.baidu.com/liujiekkk123/blog/item/d6c4541b06470fe6af5133fe.html什么是协同过滤协同过滤是利用集体智慧的一个典型方法。要理解什么是协同过滤(CollaborativeFiltering,简称CF),首先想一个简单的问题,如果你现在想看个电影,但你不知道具体看哪部,你会怎么做?大部分的人会问问周围的朋友,看看最近有
michzel
·
2020-06-21 03:12
MAHOUT
学习
大数据学习整理篇(一)windows下R以及RStudio乱码问题以及Ubuntu 16.04下
mahout
0.14.0 成功运行(成功版)
1.RStudio代码保存设置为UTF-82.打开Utf-8的文本验证下3.使用R语言的read.csv,要加上文本编码格式,比如:listing
mahout
seqdirectory-i输入目录-o输出目录
我还要去追逐我的梦
·
2020-06-17 18:51
大数据
《基于Spark的机器学习平台设计与实现》学习笔记
随后有人开发出了
Mahout
机器学习算法库。但是由于Spark的内存计算和SparkStreaming对流数据的处理,MapReduce并不是那么完美。
Tanglement
·
2020-06-16 10:00
基于Hadoop和
Mahout
的K_Means算法设计与实现
基于Hadoop和
Mahout
的K_Means算法设计与实现_王继重.caj2.3.2数据挖掘的方法分类数据挖掘常用的方法有多种多样,它们从不同的方面、不同的角度对数据进行挖掘分析。
葡萄喃喃呓语
·
2020-04-12 00:36
python实现Canopy算法
Canopy聚类序前两个月在做项目突然发现Canopy算法发现网上直接用python实现的不多,因为
Mahout
已经包含了这个算法,需要使用的时候仅需要执行
Mahout
几条命令即可,并且多数和MapReduce
AlanLau
·
2020-04-08 08:59
Win7下
Mahout
单机开发环境搭建
一、软硬件环境操作系统:Windows7IDE:IntellijIDEA社区版Java版本:JDK1.8
Mahout
版本:0.12.2二、搭建步骤安装JavaJDK,建议1.6以上;安装IDE,这里我选择
神奕
·
2020-04-06 12:24
Mahout
0.10.1安装
title:
Mahout
0.10.1安装date:2016-08-1520:00:16tags:
Mahout
categories:大数据解压安装包编辑环境变量sudovim/etc/profile#
MAHOUT
export
MAHOUT
_HOME
Skye_kh
·
2020-04-04 23:17
mahout
安装
#set
mahout
environmentexport
MAHOUT
_HOME=/yourdir/
mahout
/
mahout
-distribution-0.9export
MAHOUT
_CONF_DIR=$
苟雨
·
2020-03-25 18:54
Apache
Mahout
Buildforest(随机森林模型)
一、随机森林算法是如何工作的?在随机森林中,每一个决策树“种植”和“生长”的规则如下所示:1.假设我们设定训练集中的样本个数为N,然后通过有重置的重复多次抽样来获得这N个样本,这样的抽样结果将作为我们生成决策树的训练集;2.如果有M个输入变量,每个节点都将随机选择m(m
大鱼魔方
·
2020-03-21 18:39
数据科学家
1、编程和数据库一般来说,数据科学家大多要求具备编程、计算机科学相关的专业背景,掌握对处理大数据所必需的Hadoop、
Mahout
等大规模并行处理技术与机器学习相关的技能。
Taofca
·
2020-03-17 03:31
mahout
:贝叶斯算法应用--新闻分类示例
一、下载数据集,并上传到hdfsDownloadandextractthe20news-bydate.tar.gzfromthe20newsgroupsdatasettotheworkingdirectory.1.下载数据集wgethttp://101.96.10.65/people.csail.mit.edu/jrennie/20Newsgroups/20news-bydate.tar.gz2.
bigdatalgh
·
2020-03-16 21:12
基于hadoop的推荐算法-
mahout
版
基于hadoop的推荐算法-
mahout
版--ITeye技术网站http://blackproof.iteye.com/blog/2110877求项目相似矩阵是基于项目的协同过滤算法的核心公式有很多种,
葡萄喃喃呓语
·
2020-03-14 17:30
[概览]《Hadoop/Spark企业应用实战》 - 小象学院
《Hadoop/Spark企业应用实战》-小象学院-中国最专业的Hadoop,Spark大数据在线教育平台——权威课程:Hadoop培训,Spark培训,HBase培训,Hive培训,
Mahout
培训等
葡萄喃喃呓语
·
2020-03-11 01:26
Data Trip - 台灣 PM 2.5 最高與最低地區
生態圈己經發展了相當完整,列舉其中幾個項目,希望今年能夠熟悉他們並能應用在實際的資料上:基礎:Hadoop,HBase,ZooKeeper資料處理相關:Hive,Pig,Chukwa綜合及與ML相關:
Mahout
zach14c
·
2020-03-08 08:14
mahout
的安装及kmeans算法案例的测试
【前言】
Mahout
是一个很强大的数据挖掘工具,是一个分布式机器学习算法的集合,包括:被称为Taste的分布式协同过滤的实现、分类、聚类等。
先生_吕
·
2020-03-02 22:46
[算法]
Mahout
~机器学习领域经典算法提供可扩展的实现
基于Hadoop和
Mahout
的K_Means算法设计与实现_王继重.caj2.4
Mahout
2.4.1
Mahout
的介绍Apache
Mahout
是ApacheSoftwareFoundation
葡萄喃喃呓语
·
2020-02-28 03:42
####
Mahout
,Hadoop数据挖掘工具
Mahout
【图文】Hadoop数据挖掘工具
Mahout
_百度文库https://wenku.baidu.com/view/73725e49af45b307e8719787.htmlPaste_Image.pngPaste_Image.pngPaste_Image.pngPaste_Image.pngPaste_Image.png
葡萄喃喃呓语
·
2020-02-27 09:07
Machine Learning Skill Set
:@卢誉声|Autodesk软件研发工程师、@高扬|欢聚时代资深大数据技术专家、@罗远飞|第四范式机器学习工程师ToolboxC/C++VowpalWabbitMultiBoostShogunJava
Mahout
WekaMalletJSATPythonScikit-learnPyBrainnltkTheanoPylearn2MDPOra
luxc
·
2020-02-23 12:48
使用Spark DataFrame实现基于物品的协同过滤算法(ItemCF)
glassywing.github.io/2018/04/10/spark-itemcf/简介当前spark支持的协同过滤算法只有ALS(基于模型的协同过滤算法),但ALS算法对于某些特定的问题,效果并不理想,不像
mahout
manlier
·
2020-02-23 10:07
大数据 hadoop ------ pig 、hive、
Mahout
、hbase
pigPig最早是雅虎公司的一个基于Hadoop的并行处理架构,后来Yahoo将Pig捐献给Apache的一个项目,由Apache来负责维护,Pig是一个基于Hadoop的大规模数据分析平台。Pig为复杂的海量数据并行计算提供了一个简易的操作和编程接口,这一点和FaceBook开源的Hive一样简洁,清晰,易上手!Pig包括两部分1:用于描述数据流的语言,称为PigLatin(拉丁猪,个人翻译)2
菜菜920
·
2020-02-17 18:00
208个最新最全大数据/人工智能专有名词术语 中英对照A
Apache
Mahout
:
Mahout
提供了一个用于机器学习和数据挖掘的预制算法库,也可用作创建更多算法的环境。换句话说,机器学习极客的最佳环境。ApacheOozie:在任何编
Albert陈凯
·
2020-02-15 00:37
Hadoop家族学习路线图
http://blog.csdn.net/it_man/article/details/14899905主要介绍Hadoop家族产品,常用的项目包括Hadoop,Hive,Pig,HBase,Sqoop,
Mahout
dodonet
·
2020-02-07 20:57
深度:Hadoop对Spark五大维度正面比拼!
如果想要进行机器学习和预测建模,
Mahout
或MLLib会更好地满足您的需求吗?为了增加混淆,Spark和Hadoop经常与位于HDFS,Hadoop文件系
Alukar
·
2020-02-01 16:54
Mahout
Item-based推荐的分布式实现
title:
Mahout
Item-based推荐的分布式实现date:2016/7/2516:02:36tags:
Mahout
推荐系统categories:大数据
Mahout
API地址:http://apache.github.io
Skye_kh
·
2020-01-05 07:54
HDFS/MapReduce及应用
Hadoop家族HDFS海量分布式文件系统Map-Reduce数据计算RPC序列化,动态代理与反射Hive用SQL的形式来操作数据HBase实时(KV)存储Flume实时日志收集系统zookeeper
Mahout
千丈
·
2020-01-03 01:32
用通俗易懂的大白话讲解Map/Reduce原理
云计算系统的开源系统,包括并行计算模型Map/Reduce,分布式文件系统HDFS,以及分布式数据库Hbase,同时Hadoop的相关项目也很丰富,包括ZooKeeper,Pig,Chukwa,Hive,Hbase,
Mahout
永远的冷冽
·
2019-12-31 13:56
hadoop文件系统HDFS
Flume和
mahout
sqoop虽然不属于Hadoop家族,但是也很重要,也是必须的。
topwqp
·
2019-12-18 23:11
大数据应用场景-推荐系统
一.推荐系统主要分3个部分:1.offline部分-离线:采用的技术主要有MapReduce,spark,hive,
mahout
等.离线挖掘出来的有效数据,为了能够快速的提供服务,一般通过nosql非关系数据库
夏光辉
·
2019-12-14 09:17
转-SVD在推荐系统中的应用
http://blog.csdn.net/syani/article/details/52297093
mahout
中有SVD的推荐策略,今天查了一下资料了解了一下算法原理,本质上是使用SVD方法做特征降维
起个名字真的好难啊哈哈
·
2019-12-01 01:18
mapreduce
云计算系统的开源系统,包括并行计算模型Map/Reduce,分布式文件系统HDFS,以及分布式数据库Hbase,同时Hadoop的相关项目也很丰富,包括ZooKeeper,Pig,Chukwa,Hive,Hbase,
Mahout
5a4982b9b5fe
·
2019-11-29 19:57
大数据从入门到入土
shell,高并发架构,lucene,solr)框架学习:Hadoop(Hadoop,HDFS,Mapreduce,yarn,hive,hbase,sqoop,zookeeper,flume)机器学习(R,
mahout
asade12345
·
2019-11-16 16:05
《基于
mahout
on spark + elastic search搭建item推荐系统》
项目的背景推荐系统可以在用户没有明确表述需求的情况下,给出准确的,甚至超出预期的建议结果,以提升用户满意度和GMV。典型的推荐场景如下:电商,根据商品推荐商品用户点击的详情页商品推荐商品列表根据推荐位置划分合适的推荐算法推荐算法有很多种,但是在互联网行业使用较多实现效率高的算是“协同过滤”。但是根据不同的位置用户接受程度的不同,又有所区分。推荐算法的分类,可以参考这篇博文(http://www.i
skywalker
·
2019-11-08 06:38
大数据学习路线(完整详细版)
Linux(shell,高并发架构,lucene,solr)Hadoop(Hadoop,HDFS,Mapreduce,yarn,hive,hbase,sqoop,zookeeper,flume)机器学习(R,
mahout
花半唐
·
2019-11-03 03:15
“一日一电影,一岁一枯荣。”#028 - 论不死杯具
说实话其实今天是想要说这部动画短剧的:大魔法峠Dai
MahouT
ouge(2006)估计诸位第一眼看到其画风基本上会提不起兴趣,但确实很贱。中间还有段食材的报恩感觉是香肠派对的灵感来源。
BartNie
·
2019-11-02 06:28
StuQ 大数据工程师技能图谱
大数据工程师技能图谱大数据通用处理平台SparkFlinkHadoop分布式存储HDFS资源调度YarnMesos机器学习工具
Mahout
SparkMlibTensorFlow
Albert陈凯
·
2019-10-31 07:57
大数据之路【第十四篇】:数据挖掘--推荐算法(
Mahout
工具)
数据挖掘---推荐算法(
Mahout
工具)一、简介Apache顶级项目(2010.4)Hadoop上的开源机器学习库可伸缩扩展的Java库推荐引擎(协同过滤)、聚类和分类二、机器学习介绍通常问题都归为这几类问题分类问题回归问题聚类问题推荐问题三
Simon92
·
2019-09-07 12:00
AI的10个开源工具/框架
目录TensorFlow有用的链接ApacheSystemML有用的链接CaffeCaffe的优点有用的链接Apache
Mahout
功能/应用有用的链接OpenNN数据集数学模型数据集和数学模型有用的链接
boonya
·
2019-08-14 10:00
AI人工智能
k-means聚类对评价内容进行归类
应用场景有很多评价内容,对评价内容进行聚类,得到每个类别的关键词可以用python的scikit-learn或者
mahout
,得到聚类结果,都只能作为参考,最终结果仍然用人工定义聚类将已有的样本分类,构建
项哥
·
2019-08-08 18:20
java
python
算法
2019-08-02 下半年目标
推荐学习(离线推荐,就每天收集,每天更新)java代码熟悉(收集行为,处理行为,合并行为->推荐行为)
mahout
必备环境(linux,hadoop)
mahout
推荐算法持久化->cache(redis
光彩影
·
2019-08-02 11:19
Mahout
| 贝叶斯算法
贝叶斯基本思想已知类条件概率密度参数表达式和先验概率利用贝叶斯公式转换成后验概率根据后验概率大小进行决策分类实例/usr/local/
mahout
/examples/bin/classify-20newsgroups.shif
icebreakeros
·
2019-07-02 13:44
Oozie、Flume、
Mahout
配置与应用
-------------------------Oozie--------------------【一、部署】1)部署Oozie服务端[root@cMaster~]#sudoyuminstalloozie#cMaster上以root权限执行,部署Oozie服务端2)部署Oozie客户端[root@iClient~]f#sudoyuminstalloozie-client【二、配置文件】3)修改/
王者★孤傲
·
2019-06-19 18:00
HADOOP生态圈以及各组成部分的简介
分布式文件系统MAPREDUCE:分布式运算程序开发框架HIVE:基于大数据技术(文件系统+运算框架)的SQL数据仓库工具HBASE:基于HADOOP的分布式海量数据库ZOOKEEPER:分布式协调服务基础组件
Mahout
wzl
·
2019-05-20 15:45
HADOOP
学习
大数据未来发展方向的九大真理
总会时不时沉浸在对大数据原则的思索当中,这里讨论的并不是Hadoop与关系数据库或者
Mahout
与Weka的对抗,而是更具根源性的智慧——将数据作为“新时代货币”的思维方式。
大数据和云计算
·
2019-05-12 12:14
大数据
java
python
前端
数据分析
it资讯
用通俗易懂的大白话讲解Map/Reduce原理
云计算系统的开源系统,包括并行计算模型Map/Reduce,分布式文件系统HDFS,以及分布式数据库Hbase,同时Hadoop的相关项目也很丰富,包括ZooKeeper,Pig,Chukwa,Hive,Hbase,
Mahout
暴走的二萌
·
2019-05-01 15:18
mahout
实现基于物品的协同过滤算法(单机版)
参考:https://www.imooc.com/video/15792https://blog.csdn.net/greenhandzhang/article/details/18369697https://www.cnblogs.com/cjsblog/p/8177065.htmlhttps://blog.csdn.net/zll441488958/article/details/789236
yolanda9222
·
2019-04-25 10:35
大数据
mahout
mahout
大数据学习路线(完整详细版)
Linux(shell,高并发架构,lucene,solr)Hadoop(Hadoop,HDFS,Mapreduce,yarn,hive,hbase,sqoop,zookeeper,flume)机器学习(R,
mahout
qq_25889465
·
2019-04-08 23:16
基于用户的协同过滤代码具体实现细节
一、在上一篇博客中,我们已经安装配置成功Maven,并且建立一个基于Maven的web项目,并且导入
mahout
依赖。
lili安
·
2019-04-03 19:54
大数据工程师学习路线_大数据工程师初级到高级
大数据工程师大数据学习路径中会学习并实践Java、Scala、Hadoop、HBase、
Mahout
、Sqoop及Spark等大数据技术,本路径通过大量的动手实验,在实验数据集上实践各种大数据工具,帮助你成长为具备动手能力的大数据工程师
铁拳虎
·
2019-03-23 16:31
大数据学习
大数据
大数据开发
大数据技术
大数据入门
人工智能
数据分析
spark
Hadoop
Linux
Kafka
上一页
4
5
6
7
8
9
10
11
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他