nutch 1.2 学习

现在开始对它进行研究和应用,有兴趣的可以加q:15541307 一起討論。

 

研究目的:

1.海量数据情况下hadoop的继续深入

2.分布式下爬虫和搜索的探索

3.pagerank的实际分析

4.对开源架构的学习

 

 

references:

eclipse上布置(是java project而不是web project)

 

应用心得]nutch1.2 的eclipse windows 集成

 

网络爬虫调研报告

Nutch架构

 

你可能感兴趣的:(eclipse,Web,hadoop,windows,网络应用)