tomcat+solr3.60+mmseg4j1.85整合

下载地址:solr3.6.0

http://www.apache.org/dyn/closer.cgi/lucene/solr/3.6.0

http://mirror.bit.edu.cn/apache/lucene/solr/3.6.0/apache-solr-3.6.0.zip

中文分词器

http://code.google.com/p/mmseg4j/

http://mmseg4j.googlecode.com/files/mmseg4j-1.8.5.zip

 

配置步骤

1.将F:\dwSolr\solr3.6.0Test_20130105\apache-solr-3.6.0\example\solr下的文件拷贝到要作为服务器的位置(如:F:\dwSolr\solr3.6.0Test_20130105\home),可以删除data目录下的数据,保留data文件夹;


2.将F:\dwSolr\solr3.6.0Test_20130105\apache-solr-3.6.0\example\webapps中的solr.war程序也拷贝出来(F:\dwSolr\solr3.6.0Test_20130105\server);,并解压solr.war

3.打开F:\dwSolr\solr3.6.0Test_20130105\home文件夹中的conf (F:\dwSolr\solr3.6.0Test_20130105\home\config)下的solrconfig.xml, 配置<dataDir>${solr.data.dir:}</dataDir>为(这里指定data的路径)

<dataDir>${solr.data.dir:F:\dwSolr\solr3.6.0Test_20130105\home\data}</dataDir>


4.设置相应的tomcat中的server.xml的context,在<Host appBase="webapps" autoDeploy="true" name="localhost" unpackWARs="true" xmlNamespaceAware="false" xmlValidation="false">下面增加类似如下内容:

		<Context path="/solr" docBase="F:\dwSolr\solr3.6.0Test_20130105\server\solr" reloadable="false">
			<Environment name="solr/home" type="java.lang.String" value="F:\dwSolr\solr3.6.0Test_20130105\home" override="true"/>
		</Context>

5.启动tomcat,通过localhost:8080/solr验证配置,出现如下页面说明配置成功

 

6、mmseg4j分词配置

6.1、将mmseg4j-all-1.8.5-with-dic.jar文件放置到F:\dwSolr\solr3.6.0Test_20130105\server\solr\WEB-INF\lib中

6.2、在F:\dwSolr\solr3.6.0Test_20130105\home\conf\schema.xml文件中添加

   <fieldType name="text_cn" class="solr.TextField" positionIncrementGap="100">  
	<analyzer>  
		<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory"/>  
	</analyzer>  
   </fieldType>


7、测试

7.1、启动tomcat,输入 http://localhost:8080/solr/admin/analysis.jsp?highlight=on 出现如下页面

 

7.2、Field选择type 输入text_cn  ,Filed value(index) 输入“中华人民共和国” 如下图

成功!

你可能感兴趣的:(tomcat+solr3.60+mmseg4j1.85整合)