(2)Nutch1.0 浅析

关于Nutch1.0 导入Eclipse http://www.iteye.com/topic/525839   给了详细具体的说明

 

1  Nutch1.0 抓取类package org.apache.nutch.fetcher.Fetcher;

src\java\org\apache\nutch\fetcher\Fetcher.java

它有6个内部类,其中FetcherThread.run() 负责抓取

2  nutch-1.0.job  因为它的原因,Nutch 要在Cygwin 下运行.和Nutch-1.0.jar没有直接关系.nutch-1.0.job 是通过 build.xml 文件获得的

    <touch datetime="01/25/1971 2:00 pm">
      <fileset dir="${conf.dir}" includes="**/*.template"/>
    </touch>

 这里有错,注释掉就可以build了.

你可能感兴趣的:(java,apache,eclipse,xml)