nutch2.2.1与solr4.5.1的整合

前言

这是看到nutch可以跑起来的最后一步,加油!

solr的下载

本来我还是想上传CSDN的,但是看了看100多M,还是算了吧。

运行solr

解压solr后,进入${SOLR_HOME}/example,运行start.jar

java -jar start.jar

验证solr是否启动成功

进入java http://localhost:8983/solr,看到如下页面说明启动成功

nutch2.2.1与solr4.5.1的整合_第1张图片
截图

nutch整合solr

将${NUTCH_DIR}/conf/schema-solr4.xml拷贝到${SOLR_DIR}/example/solr/collection1/conf/并重命名为schema.xml,在fields域里最后添加一行


重启solr

关闭solr的终端,重新打开一个终端,运行java java -jar start.jar

验证nutch

创建urls/seed.txt,seed.txt里应该写点啥自便吧,运行java ./nutch inject urls/seed.txt

预告

下一篇nutch2.2.1与hbase1.1.1的坑爹版本问题

你可能感兴趣的:(nutch2.2.1与solr4.5.1的整合)