推荐一些Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr, Flume, Bigtop, Crunch, Hue等。

一、学习路线图
● Hadoop家族学习路线图 开篇必读
● Hive学习路线图
● Mahout学习路线图
二、编程实践
● Hadoop历史版本安装
● 用Maven构建Hadoop项目
● Hadoop编程调用HDFS
● 用Maven构建Mahout项目
● Mahout推荐算法API详解
● 用MapReduce实现矩阵乘法
● 从源代码剖析Mahout推荐引擎
● Mahout分步式程序开发 基于物品的协同过滤ItemCF
● Mahout分步式程序开发 聚类Kmeans
● PageRank算法并行实现
三、案例分析
● 海量Web日志分析 用Hadoop提取KPI统计指标
● 用Hadoop构建电影推荐系统
● 用Mahout构建职位推荐引擎
● Mahout构建图书推荐系统
● PeopleRank从社交网络中发现个体价值

有道云笔记地址:http://note.youdao.com/noteshare?id=4e6bee3b8162b16072f7f73c50ba341a&sub=3760ED107ECE4080BC54B7BB3A1B3131