下载地址:solr3.6.0
http://www.apache.org/dyn/closer.cgi/lucene/solr/3.6.0
http://mirror.bit.edu.cn/apache/lucene/solr/3.6.0/apache-solr-3.6.0.zip
中文分词器
http://code.google.com/p/mmseg4j/
http://mmseg4j.googlecode.com/files/mmseg4j-1.8.5.zip
配置步骤
1.将F:\dwSolr\solr3.6.0Test_20130105\apache-solr-3.6.0\example\solr下的文件拷贝到要作为服务器的位置(如:F:\dwSolr\solr3.6.0Test_20130105\home),可以删除data目录下的数据,保留data文件夹;
2.将F:\dwSolr\solr3.6.0Test_20130105\apache-solr-3.6.0\example\webapps中的solr.war程序也拷贝出来(F:\dwSolr\solr3.6.0Test_20130105\server);,并解压solr.war
3.打开F:\dwSolr\solr3.6.0Test_20130105\home文件夹中的conf (F:\dwSolr\solr3.6.0Test_20130105\home\config)下的solrconfig.xml, 配置<dataDir>${solr.data.dir:}</dataDir>为(这里指定data的路径)
<dataDir>${solr.data.dir:F:\dwSolr\solr3.6.0Test_20130105\home\data}</dataDir>
4.设置相应的tomcat中的server.xml的context,在<Host appBase="webapps" autoDeploy="true" name="localhost" unpackWARs="true" xmlNamespaceAware="false" xmlValidation="false">下面增加类似如下内容:
<Context path="/solr" docBase="F:\dwSolr\solr3.6.0Test_20130105\server\solr" reloadable="false"> <Environment name="solr/home" type="java.lang.String" value="F:\dwSolr\solr3.6.0Test_20130105\home" override="true"/> </Context>
5.启动tomcat,通过localhost:8080/solr验证配置,出现如下页面说明配置成功
6、mmseg4j分词配置
6.1、将mmseg4j-all-1.8.5-with-dic.jar文件放置到F:\dwSolr\solr3.6.0Test_20130105\server\solr\WEB-INF\lib中
6.2、在F:\dwSolr\solr3.6.0Test_20130105\home\conf\schema.xml文件中添加
<fieldType name="text_cn" class="solr.TextField" positionIncrementGap="100"> <analyzer> <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory"/> </analyzer> </fieldType>
7、测试
7.1、启动tomcat,输入 http://localhost:8080/solr/admin/analysis.jsp?highlight=on 出现如下页面
7.2、Field选择type 输入text_cn ,Filed value(index) 输入“中华人民共和国” 如下图
成功!