Solr5.2.1搜索服务部署——整合mmseg4j2.3.0


目录

tomcat安装
solr安装
整合mmseg4j2.3.0
关联mysql
增量索引
检索多字段

1. 软件版本

Solr5.2.1

mmseg4j2.3.0

2. mmseg4j配置

   下载地址

http://pan.baidu.com/s/1qWJY3gC

    下载完成上传至服务器

# unzip mmseg4j-solr-2.3.0-with-mmseg4j-core.zip -d mmseg4j
# cp mmseg4j/*.jar /usr/local/tomcat/webapps/solr/WEB-INF/lib

    配置分词类型

# vim /usr/local/solr/server/solr/core0/conf/schema.xml

    加入如下内容于schema标签内

<fieldtype name="textComplex" class="solr.TextField" positionIncrementGap="100">
<analyzer>
    <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex"/>
    <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
</analyzer>
</fieldtype>
<fieldtype name="textMaxWord" class="solr.TextField" positionIncrementGap="100">
<analyzer>
    <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" />
    <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
</analyzer>
</fieldtype>
<fieldtype name="textSimple" class="solr.TextField" positionIncrementGap="100">
<analyzer>
    <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="my-ext-dic" />
    <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
</analyzer>
</fieldtype>

     <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />中的stopwords.txt为忽略分词

    dicPath为自定义分词目录,放于solr/home目录下,比如当前指定的“my-ext-dic”,其位置在“/usr/local/solr/server/solr/core0/my-ext-dic”,分词文件名以words开头.dic为后缀,形如:“words-my.dic”,内容一行一词即可

地址访问http://localhost:8983/solr/core0/analysis/field?wt=json&analysis.showmatch=true&analysis.fieldvalue=试试分词&analysis.fieldtype=textSimple


你可能感兴趣的:(Solr5.2.1搜索服务部署——整合mmseg4j2.3.0)