关于hadoop的入门和进阶文章收录

1  Hadoop    http://hadoop.apache.org

 

 

 

 

 

 

2 文章收录

 

网上比较权威和受欢迎的大部分是来自 IBM DW 的文章,尤其是那两个经典系列的文章,此外还有一些案例型和实践型的文章与指南,这里集中收录如下:

 

 

首先是两篇云计算理论与概念的入门文章(教程):

 

 

云计算:基础

概念、优势、挑战和向云计算过渡需要考虑的事情

发布日期: 2012 年 2 月 13 日 (最初发布 2011 年 3 月 18 日)  

级别:初级 选择了四星  (14 个评分)

 

http://www.ibm.com/developerworks/cn/training/kp/cl-kp-cloudfundamentals/

 

 

云计算新手?

http://www.ibm.com/developerworks/cn/cloud/newto.html

 

 

 

关于 hadoop:

 

 

用 Linux 和 Apache Hadoop 进行云计算

发布日期: 2009 年 11 月 19 日 

级别: 初级

 

http://www.ibm.com/developerworks/cn/aix/library/au-cloud_apache/

 

 

使用 Linux 和 Hadoop 进行分布式计算(简介)

http://www.ibm.com/developerworks/cn/linux/l-hadoop/

 

系列文章1:

 

    用 Hadoop 进行分布式并行编程, 第 1 部分

    http://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop1/index.html

 

    用 Hadoop 进行分布式并行编程, 第 2 部分

    http://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop2/index.html

 

    用 Hadoop 进行分布式并行编程, 第 3 部分

    http://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop3

 

 

系列文章2:

 

   用 Hadoop 进行分布式数据处理,第 1 部分: 入门

    http://www.ibm.com/developerworks/cn/linux/l-hadoop-1

 

    用 Hadoop 进行分布式数据处理,第 2 部分: 进阶

    http://www.ibm.com/developerworks/cn/linux/l-hadoop-2

 

    用 Hadoop 进行分布式数据处理,第 3 部分: 应用程序开发

    http://www.ibm.com/developerworks/cn/linux/l-hadoop-3

 

 

hadoop@yahoo

http://developer.yahoo.com/hadoop/ 

 

The hadoop distributed file system 

http://developer.yahoo.com/hadoop/tutorial/module2.html

 

 

CSDN Hadoop专题

http://subject.csdn.net/hadoop/

 

iteye hadoop 讨论组

http://hadoop.group.iteye.com/

 

开源中国 hadoop 频道

http://www.oschina.net/search?q=hadoop&scope=project

 

 

 

stackoverflow 上的hadoop问答

http://stackoverflow.com/search?q=hadoop

 

 

 

另外,看到其他网友推荐的文章:

 

 

Michael G. Noll

http://www.michael-noll.com/tutorials/running-hadoop-on-ubuntu-linux-single-node-cluster/

http://www.michael-noll.com/tutorials/running-hadoop-on-ubuntu-linux-multi-node-cluster/

 

 

 

分布式文件系统 
http://www.cnblogs.com/duguguiyu/archive/2009/02/22/1396034.html 

分布式计算(Map/Reduce) 
http://www.cnblogs.com/duguguiyu/archive/2009/02/28/1400278.html 

 

 

 

hadoop安装

http://www.cnblogs.com/wayne1017/archive/2007/03/20/678724.html 

 

http://blog.sina.com.cn/s/blog_62186b4601011c6a.html

 

http://blog.chinaunix.net/uid-128922-id-289987.html

 

 

hadoop教程

http://naojuan.com/ 

 

hadoop笔记

http://www.cnblogs.com/Dreama/category/307220.html

 

 

 

hadoop安装/开发/部署过程中的错误与排除:

 

http://www.linuxidc.com/Linux/2011-12/50362.htm

 

http://hadoop.nchc.org.tw/phpbb/viewtopic.php?f=4&t=49&start=10&st=0&sk=t&sd=a

 

ps: 

台湾的这个 hadoop社区不错,http://hadoop.nchc.org.tw

 

 

ps:

我最早是在09年底了解和安装过hadoop,当时正好有庞大的cluster资源可用,可惜只是局限于学习,没有在正式项目中使用。  如今随着nosql的发展,以及ssd硬件发展,一种使用ssd硬盘+大内存+nosql+hadoop平台的基因组序列分析套件成为可能性! 希望有人已经开发出了产品吧。 

 

你可能感兴趣的:(hadoop,开源,分布式,云计算,cloud)