solr+tomcat+nutch 整合

进入hadoop目录,拷贝apache-solr-4.8.1.tgz,解压缩

tar-zxvf apache-solr-4.8.1.tgz

mv apache-solr-4.8.1 solr

cp -rf /home/hadoop/solr/dist/solr-4.8.1.war /usr/local/tomcat/webapps

mv solr-4.8.1.war solr.war

#启动tomcat自动解压

mkdir /home/hadoop/solr/solrhome

mkdir /home/hadoop/solr/solrindex

cp -rf  /home/hadoop/solr/example/solr/*  /home/hadoop/solr/solrhome

vim /home/hadoop/solr/solrhome/collection1/conf/solrconfig.xml

把这几个配置注释掉,暂时用过不到。      

<!--

  <lib dir="../../../contrib/extraction/lib" regex=".*\.jar" />

  <lib dir="../../../dist/" regex="solr-cell-\d.*\.jar" />

 

  <lib dir="../../../contrib/clustering/lib/" regex=".*\.jar" />

  <lib dir="../../../dist/" regex="solr-clustering-\d.*\.jar" />

 

  <lib dir="../../../contrib/langid/lib/" regex=".*\.jar" />

  <lib dir="../../../dist/" regex="solr-langid-\d.*\.jar" />

 

  <lib dir="../../../contrib/velocity/lib" regex=".*\.jar" />

  <lib dir="../../../dist/" regex="solr-velocity-\d.*\.jar" />

-->


同样是这个文件指定你的索引文件存在什么地方的  

<dataDir>${solr.data.dir:}</dataDir>

/home/hadoop/solr/solrindex           #我的索引目录

<dataDir>${solr.data.dir:/home/hadoop/solr/solrindex}</dataDir> 


vim /usr/local/tomcat/conf/Catalina/localhost/solr.xml

没有手工创建创建solr.xml文件,文件内容如下:

<Context docBase="/usr/local/tomcat/webapps/solr.war" debug="0" crossContext="true" >

<Environment name="solr/home" type="java.lang.String" value="/home/hadoop/solr/solrhome" override="true" />

</Context>


vim /usr/local/tomcat/conf/server.xml

添加编码方式,修改后如下<Connector port="8080" URIEncoding="UTF-8" #其它不变

 

启动tomcat解压solr.war 生成solr文件

vim /usr/local/tomcat/webapps/solr/WEB-INF/web.xml


<env-entry>

       <env-entry-name>solr/home</env-entry-name>

       <env-entry-value>/home/hadoop/solr/solrhome</env-entry-value>

       <env-entry-type>java.lang.String</env-entry-type>

    </env-entry>


这时候我们启动会报错,说找不到一些类,这些类是log4j相关的,记日志用的。

需要的jar包如下:

从/solr-4.7.0/example/lib/ext复制所有的jar到tomcat/lib下,并复制solr-4.7.0\example\resources\log4j.properties到tomcat/lib下

重新启动tomcat,浏览器进入:http://localhost:8080/solr,便进入了solr的管理界面了




nutch+solr

cp schema.xml /newzqpic1/nutch/solr/example/solr/collection1/conf

(1)覆盖solr的schema.xml文件。(对于solr4,应该使用schema-solr4.xml)


cp /usr/search/apache-nutch-2.3/conf/schema.xml /usr/search/solr-4.9.0/example/solr/collection1/conf/


(2)若使用solr3.6,则至此已经完成配置,但使用4.9,需要修改以下配置:【新版本已经不需要此步骤】


修改上述复制过来的schema.xml文件


删除:<filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt" /> 


增加:<field name="_version_" type="long" indexed="true" stored="true"/>


或者使用tomcat来运行solr







































你可能感兴趣的:(solr+tomcat+nutch 整合)