tomcat 集成solr+paoding or Ikanalyer

一.
1.        安装tomcat6.0

2.        下载apache-solr-3.1.0.zip

http://labs.xiaonei.com/apache-mirror/lucene/solr/3.1.0/



3.        解压后,打开apache-solr-3.1.0\dist目录,找到apache-solr-1.3.0.war,改名为solr.war(为了方便而已),然后把其考到tomcat的webapps目录下。

4.        运行tomcat后再webapps下会自动生成solr文件夹。

5.        在tomcat下的\conf\Catalina\localhost中加入solr.xml,内容如下:



<?xml version="1.0" encoding="UTF-8"?>



<Context reloadable="true" docBase="D:/solr/solr.war" > 

   <Environment name="solr/home" type="java.lang.String" value="D:/solr/solr" override="true" /> 

</Context>



其中docBase对应solr.war的路径,可以改动

    Value对应solr的home,可以改动



6.        把apache-solr-1.3.0\example\solr下的文件夹(包括bin,conf,data)考到solr的home目录下。

7.        重启tomcat,进行测试http://localhost:8080/solr/admin/analysis.jsp

二. solr集成paoding分词
1.设置环境变量PAODING_DIC_HOME;“变量值”为词库目录(dic),如 d:/solr/solr/dic

2. 修改paoding-dic-home.properties文件,添加宽paoding.dic.home指向词典目录,运行build.bat, 重新编译生成jar包
paoding.dic.home=D:\solr\dic

3.把paoding-analysis.jar放入到solr.war.lib目录下

4. 修改solr配置文件, solr.home/conf/schema.xml 修改或加 text fieldType 元素,如:
	<fieldType name="text" class="solr.TextField">
		<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer" />

		<analyzer type="index">
			<tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory"
				isMaxWordLength="false" />
			<filter class="solr.StopFilterFactory" ignoreCase="true"
				words="stopwords.txt" />
			<filter class="solr.WordDelimiterFilterFactory"
				generateWordParts="1" generateNumberParts="1" catenateWords="1"
				catenateNumbers="1" catenateAll="0" splitOnCaseChange="1" />
			<filter class="solr.LowerCaseFilterFactory" />
			<filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt" />
			<filter class="solr.RemoveDuplicatesTokenFilterFactory" />
		</analyzer>
		<analyzer type="query">
			<tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory"
				isMaxWordLength="true" />
			<filter class="solr.StopFilterFactory" ignoreCase="true"
				words="stopwords.txt" />
			<filter class="solr.WordDelimiterFilterFactory"
				generateWordParts="1" generateNumberParts="1" catenateWords="1"
				catenateNumbers="1" catenateAll="0" splitOnCaseChange="1" />
			<filter class="solr.LowerCaseFilterFactory" />
			<filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt" />
			<filter class="solr.RemoveDuplicatesTokenFilterFactory" />
		</analyzer>

	</fieldType>   


5.启动 tomcat 打开,http://localhost:8080/solr/admin/analysis.jsp,测试 paoding, 看是否正常工作


三. solr集成Ikanalyzer分词

...

本文转至 http://blog.chenlb.com/2009/06/use-paoding-chinese-segment-in-solr.html

你可能感兴趣的:(apache,tomcat,jsp,Solr,Lucene)