solr-4.10.0、tomcat7、IKAnalyzer2012FF_u1中文分词器相整合以及相关配置

 
 =============solr-4.10.0跟tomcat7整合以及相关配置=============

1、将solr文件中的example文件下的solr目录中所有文件拷贝到自己在磁盘中创建的文件夹中

(最好创建成 盘符:\solr\home文件下)


2、将solr文件中的example文件下的webapps目录中solr.war文件拷贝到自己在磁盘中创建的盘符:\solr\server文件下(可以将solr.war解压出来会有个solr的文件夹)

3、将盘符:solr\home\collection1\conf文件下的solrconfig.xml中的索引库存储地址改成 

<dataDir>${solr.data.dir:盘符:\solr\home\collection1\data}</dataDir>


4、配置solr服务器在tomcat的server.xml中

<Host name="localhost"  appBase="webapps"
            unpackWARs="true" autoDeploy="true">
       配置slor服务器的地址(注意:如果你将solr.war解压出来了,下面的地址得配置成 盘符:\solr\server\solr)
       <Context path="/solr" docBase="盘符:\solr\server\solr.war" reloadale="false"></Context>
        <!-- SingleSignOn valve, share authentication between web applications
             Documentation at: /docs/config/valve.html -->
        <!--
        <Valve className="org.apache.catalina.authenticator.SingleSignOn" />
        -->
        <!-- Access log processes all example.
             Documentation at: /docs/config/valve.html
             Note: The pattern used is equivalent to using pattern="common" -->
        <Valve className="org.apache.catalina.valves.AccessLogValve" directory="logs"
               prefix="localhost_access_log." suffix=".txt"
               pattern="%h %l %u %t &quot;%r&quot; %s %b" />


</Host>
5、为tomcat设置相应的环境变量,设置solr主目录的地址
 <Context path="/solr" docBase="盘符:\solr\server" reloadale="false">
     
 <Environment name="solr/home" type="java.lang.String" value="盘符:\solr\home" override="true"></Environment>
  
</Context>



6、将解压的solr文件下的example下的lib下的etc下的所有jar包全部拷贝到tomcat的lib下(如果报Failed to initialize Apache Solr: Could not find necessary SLF4j logging jars. If using Jetty....是因为关于slf4j的所有jar包没有拷贝到tomcat下的lib中)


7、可以通过tomcat去访问solr  http://localhost:8080/solr/


=============IK Analyzer 2012FF_hf1中文分词配置=============

1、将IKAnalyzer2012FF_u1.jar导入 盘符:\solr\server\solr\WEB-INF\lib中

(并且要有commons-io-2.3.jar,commons-logging-1.1.1.jar两个jar)



2、将IKAnalyzer.cfg.xml、stopword.dic拷贝到需要使用分词器的core的conf(盘符:\solr\server\solr\WEB-INF\classes)下面(注意:如果没有classe文件夹自己创建一个classes文件夹,方便配置自己的定义的词库)

3、在 盘符:\solr\home\collection1\conf\schema.xml中配置以下配置
<fieldType name="text_ik" class="solr.TextField">   

       <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>  


       <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>  


</fieldType>


=============IK Analyzer 2012FF_hf1配置自定义词库=============


1、修改 盘符:\solr\server\solr\WEB-INF\classes文件夹的IKAnalyzer.cfg.xml配置文件如下 将自己定义的词库文件放入 盘符:\solr\server\solr\WEB-INF\classes下和IKAnalyzer.cfg.xml在一个目录中

(注意:ext.dic的编码必须是Encode in UTF-8 without BOM,否则自定义的词库不会被识别如果想配置多个自定义词库,可以<entry key="ext_dict">ext.dic;mydic.dic</entry>用分号(;)隔开 )


<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">  
<properties>  
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典 -->
<entry key="ext_dict">ext.dic;</entry> 

<!--用户可以在这里配置自己的扩展停止词字典-->
<entry key="ext_stopwords">stopword.dic;</entry> 
</properties>


 

你可能感兴趣的:(Solr,ik中文分词器)