本文介绍Hadoop Core(MapReduce和HDFS)相关的书籍和网络资源。
【Hadoop书籍】
这些书均可以从 http://ishare.iask.sina.com.cn/上下载电子版,有些书籍是作者主动开源的,另外一些是不劳而获者上传的,可用于学习,但不要盗印。
(1) Hadoop: The Definitive Guide
http://book.douban.com/subject/3220004/
Hadoop权威指南,涉及知识面非常全面的一本书,介绍了Hadoop生态系统中的各个软件,包括HDFS,MapReduce,Hive,Hbase等。截至2013年1月,该书已经出了第三版,在该版本中,添加了少量的YARN相关内容。
(2)Hadoop Operations
http://book.douban.com/subject/17458570/
这是一本Hadoop运维方面的书籍,由Cloudera员工操手,介绍了Hadoop集群从硬件选型到软件配置等方面需考虑的因素,这本书不仅介绍了Hadoop 1.0的安装和部署方法,也介绍而来最新的YARN和HDFS Federation的部署方法。个人认为,这本书是运维人员必看的书籍。
(3) Hadoop in Action
http://book.douban.com/subject/4049942/
该书属于MapReduce应用程序开发类书籍,它介绍了几种MapReduce应用程序开发方法,包括Java、Hadoop Streaming和Hadoop pipes,此外,还介绍了面向SQL和脚本语言的Hive和Pig。
(4)Pro Hadoop
http://book.douban.com/subject/3529886/
该书与Hadoop In Action类似,但涉及内容更全面,更详细,它不仅介绍了MapReduce应用程序开发方法,还给出了各种应用实例,详细介绍了各种调试方法,HDFS使用和运维等知识等。
(5)Hadoop in Practice
http://book.douban.com/subject/10748575/
该书籍是一线工程师编写的,出发点与以上几本书不同,它重在解决更加实际的问题,比如如何将数据移入或者移出HDFS,如果利用MapReduce思想解决各种问题等。
(6)MapReduce Design Patterns
http://book.douban.com/subject/11229683/
MapReduce设计模式,将MapReduce运算符抽象成设计模式,以便能够重用。
如果你想更准确地学习Hadoop知识,请一定要阅读英文原著,国内翻译的Hadoop图书是一塌糊涂。另外,国内也有人写了一些Hadoop书籍,比如《实战Hadoop:开启通向云计算的捷径》,《高可用性的HDFS:Hadoop分布式文件系统深度实践(配光盘)》,《Hadoop实战》等,这些书均可以在京东、当当、亚马逊等网站上买到,有兴趣的读者可以阅读一下。
【Hadoop网络资源】
(1)Cloudera Blog: http://blog.cloudera.com/
(2)Hortonworks Blog: http://hortonworks.com/blog/
(3)Apache Hadoop: http://hadoop.apache.org/
(4)Hadoop jira: https://issues.apache.org/jira/browse/YARN
https://issues.apache.org/jira/browse/HADOOP
https://issues.apache.org/jira/browse/HDFS
https://issues.apache.org/jira/browse/MAPREDUCE
(5) Hadoop wiki: http://wiki.apache.org/hadoop/
原创文章,转载请注明: 转载自 董的博客
本文链接地址: http://dongxicheng.org/mapreduce/hadoop-books/
作者: Dong,作者介绍: http://dongxicheng.org/about/
Copyright © 2012