一.
1. 安装tomcat6.0
2. 下载apache-solr-3.1.0.zip
http://labs.xiaonei.com/apache-mirror/lucene/solr/3.1.0/
3. 解压后,打开apache-solr-3.1.0\dist目录,找到apache-solr-1.3.0.war,改名为solr.war(为了方便而已),然后把其考到tomcat的webapps目录下。
4. 运行tomcat后再webapps下会自动生成solr文件夹。
5. 在tomcat下的\conf\Catalina\localhost中加入solr.xml,内容如下:
<?xml version="1.0" encoding="UTF-8"?>
<Context reloadable="true" docBase="D:/solr/solr.war" >
<Environment name="solr/home" type="java.lang.String" value="D:/solr/solr" override="true" />
</Context>
其中docBase对应solr.war的路径,可以改动
Value对应solr的home,可以改动
6. 把apache-solr-1.3.0\example\solr下的文件夹(包括bin,conf,data)考到solr的home目录下。
7. 重启tomcat,进行测试http://localhost:8080/solr/admin/analysis.jsp
二. solr集成paoding分词
1.设置环境变量PAODING_DIC_HOME;“变量值”为词库目录(dic),如 d:/solr/solr/dic
2. 修改paoding-dic-home.properties文件,添加宽paoding.dic.home指向词典目录,运行build.bat, 重新编译生成jar包
paoding.dic.home=D:\solr\dic
3.把paoding-analysis.jar放入到solr.war.lib目录下
4. 修改solr配置文件, solr.home/conf/schema.xml 修改或加 text fieldType 元素,如:
<fieldType name="text" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer" />
<analyzer type="index">
<tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory"
isMaxWordLength="false" />
<filter class="solr.StopFilterFactory" ignoreCase="true"
words="stopwords.txt" />
<filter class="solr.WordDelimiterFilterFactory"
generateWordParts="1" generateNumberParts="1" catenateWords="1"
catenateNumbers="1" catenateAll="0" splitOnCaseChange="1" />
<filter class="solr.LowerCaseFilterFactory" />
<filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt" />
<filter class="solr.RemoveDuplicatesTokenFilterFactory" />
</analyzer>
<analyzer type="query">
<tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory"
isMaxWordLength="true" />
<filter class="solr.StopFilterFactory" ignoreCase="true"
words="stopwords.txt" />
<filter class="solr.WordDelimiterFilterFactory"
generateWordParts="1" generateNumberParts="1" catenateWords="1"
catenateNumbers="1" catenateAll="0" splitOnCaseChange="1" />
<filter class="solr.LowerCaseFilterFactory" />
<filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt" />
<filter class="solr.RemoveDuplicatesTokenFilterFactory" />
</analyzer>
</fieldType>
5.启动 tomcat 打开,http://localhost:8080/solr/admin/analysis.jsp,测试 paoding, 看是否正常工作
三. solr集成Ikanalyzer分词
...
本文转至
http://blog.chenlb.com/2009/06/use-paoding-chinese-segment-in-solr.html