概述:
1、Mahout是Apache的一个开源项目。
2、提供了机器学习的若干经典算法。比如基于用户的推荐、基于内容的推荐算法。
3、它是Hadoop家族中的一员,非常重要的一员。
参考文章:
1、 零基础学习Hadoop
https://www.zhihu.com/question/19795366/answer/24524910
2、 Hadoop家族学习路线图
http://blog.fens.me/hadoop-family-roadmap/
3、 Mahout学习路线图
http://blog.fens.me/hadoop-mahout-roadmap/
4、 Mahout推荐算法API详解(编程实践类)
http://blog.fens.me/mahout-recommendation-api/
5、 用Maven构建Mahout项目(比较费劲,需要输入命令)
http://blog.fens.me/hadoop-mahout-maven-eclipse/
6、 零基础学习Mahout:单机环境搭建,程序及运行实例。(比较简单,基于单机的编程环境构建)
http://www.tuicool.com/articles/rmiEz2
7、 使用Mahout搭建推荐系统——Mahout源码初探
http://f.dataguru.cn/thread-248282-1-1.html
基本概念:
1、 Hadoop是一个分布式的开源计算框架。
2、 Mahout是基于Hadoop的一个机器学习和数据挖掘的分布式计算框架。
3、 Mahout可以单机运行;也可以分布式运行。
案例分析:
1、用Hadoop和Mahout构建电影推荐系统案例
http://blog.fens.me/hadoop-mapreduce-recommend/
2、用Hadoop和Mahout构建职位推荐系统
http://blog.fens.me/hadoop-mahout-recommend-job/
注意事项:
1、可以用maven命令行的方式建立Hadoop项目和Mahout项目。
2、Hadoop、Mahout项目好像不需要配置环境变量。