solr 中文分词器IK分词器的配置

Solr加入中文分词器

solrconfig.xml这个配置文件可以在你下载solr包的安装解压目录的例如: /opt/solr/example/solr/collection1/conf

首先在solrconfig.xml中加一句一下内容。这样我们自己加入的分词器才会引到的solr中.

<lib dir="../../../contrib/analysis-extras/lib" regex=".*\.jar" />

. IK 分词器的安装

首选要去下载IKAnalyzer的发行包.下载地址: http://ik-analyzer.googlecode.com/files/IK%20Analyzer%202012FF_hf1.zip.

下载后解压出来文件中的三个复制到/opt/solr/contrib/analysis-extras/lib目录中.

IKAnalyzer2012FF_u1.jar      分词器jar包

IKAnalyzer.cfg.xml         分词器配置文件,可以自己添加字典

Stopword.dic                分词器停词字典

<fieldType name="analyzer_ik" class="solr.TextField">

         <analyzer type="index" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
         <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>

</fieldType>

<field name ="name_ik" type ="analyzer_ik" indexed ="true" stored ="false" multiValued ="true"/>

   到http://localhost:8080/solr地址进行测试一下刚加入的中文分词器.在首页的Core Selector中选择你配置的core后点击下面的Analysis,在AnalyseFieldname / FieldType里选择你刚才设置的字段名称或是分词器类型,在Field Value(index)中输入:上海人在海上,点击右面的分词就行了.

 

你可能感兴趣的:(tomcat,Solr,IKAnalyzer,中文分词)