Hadoop历史

Hadoop之父Doug Cutting

Apache Lucene
1、全球第一个开源的全文搜索引擎工具包
2、完整的查询引擎和索引引擎
3、部分文本分析引擎
4、开发人员可以在此基础上建立起完整的全文检索引擎

Nutch
1、开源的基于Lucene的网页搜索引擎
2、加入了网页抓取、解析等功能
3、类似于Google等商业搜索引擎

Google的两篇重要论文
Google File System
MapReduce:Simplified Data Proocessing on Large Clusters

Hadoop官网:http://hadoop.apache.org/

Hadoop大事记
Hadoop历史_第1张图片

你可能感兴趣的:(Hadoop)