两本关于Hadoop的书

昨天刚从同事那拿到两本关于hadoop的书。

 

一本是hadoop的committer Tom White的大作《hadoop_The_definitive_guide》,大致看了下前言和目录,非常

 

详细的介绍了hadoop的各个方面。

 

另一本《Data-Intensive Text Processing with MapReduce》貌似还没有正式出版,介绍了如何用MapReduce设计一

 

些算法的技巧,包括常见的连接多个表,Inverted Indexing的实现,包括宽度优先、PageRank等图相关算法,以及

 

EM、HMM等机器学习算法是现实,总之感觉是本非常棒且实用。

 

不敢独享,拿出来与大家share.

你可能感兴趣的:(mapreduce,hadoop,算法,出版)