nutch2.1 index with solr 4.0

首先修改ivy/ivy.xml,使其对应的solr库为4.0.0:

 

    <dependency org="org.apache.solr" name="solr-solrj" rev="4.0.0"
      conf="*->default" />


在配置solr 4.0时,主要的一点是要使用这个schema.xml:

http://nlp.solutions.asia/wp-content/uploads/2012/08/schema.xml

命令使用:

bin/nutch inject urls

bin/nutch generate -topN 100

bin/nutch fetch -all

bin/nutch parse -all

bin/nutch updatedb

bin/nutch solrindex http://yourhost/solr/nutch -reindex

你可能感兴趣的:(nutch2.1 index with solr 4.0)