Nutch的发展历程

Nutch的创始人是Doug Cutting,他同时也是Lucene、Hadoop和Avro开源项目的创始人

 

下面是Nutch的发展历程:

 

20028Doug Cutting发起,托管于Sourceforge,之后发布了0.40.50.6三个版本

2004年9月Oregon State University俄勒冈州立大学)采用Nutch

2004年9月Creative Commons(知识共享)推出基于Nutch的搜索服务

20051加入Apache的孵化器

2005年6月孵化结束成为Lucene的子项目

20058月发布版本0.7Apache Lucene sub-project

2005年10月发布版本0.7.1

2006年3月发布版本0.7.2

2006年7月发布版本0.8全新的架构,基于Hadoop0.4 Hadoop诞生

2006年9月发布版本0.8.1

2007年4月发布版本0.9

2009年3月发布版本1.0Tika诞生,0.1-incubating

2010年4月Nutch成为Apache顶级项目

2010年6月发布版本1.1

2010年9月发布版本1.2

2011年6月发布版本1.3从搜索引擎到网络爬虫

2011年11发布版本1.4

2012年6月发布版本1.5

2012年7月发布版本2.02.X  Gora诞生,table-based architecture

2012年7月发布版本1.5.1

2012年8月Nutch诞生十周年

201210月发布版本2.1 2.X开始支持elastic search

2012年12发布版本1.6

2013年6月发布版本2.2crawler-commons 诞生

2013年6月发布版本1.7crawler-commons 诞生

2013年7发布版本2.2.1

2014年3月发布版本1.8

2014年8月发布版本1.9

2015年1月发布版本2.3

 

 

 

 

 

 

 

 

 

你可能感兴趣的:(hadoop,搜索引擎,大数据,Nutch,网络爬虫)