第二章:基于IK的智能分词、细粒度分词、同义词、停用词

1.  下载IKAnalyzer2012FF_u1_完整版,http://download.csdn.net/detail/insist211314/9263965

2.  将文件放入solr.war的WEB-INF/lib下

3.  将IKAnalyzer.cfg.xml、ext.dic、stopword.dic放到WEB-INF/classes目录下,注意:classes目录没有,需要手动创建

4.  配置同义词与停用词


  
  
	IK Analyzer 扩展配置
	 
	ext.dic; 
	
	stopword.dic; 
	

5.  配置schema.xml
  
     
         
         
     
     
              
         
         
     

      注意:isMaxWordLength为true表示进行智能分词,相反为细粒度分词

6.  测试,搜索关键词“一台笔记本”
ext.dic文件内容

一台
笔记本

stopword.dic文件内容

synonyms.txt文件内容

笔记本 => 笔记本电脑 超薄笔记本

7.  使用solr admin进行测试,搜索关键词“一台笔记本”

第二章:基于IK的智能分词、细粒度分词、同义词、停用词_第1张图片

IKT:使用IK的Tokenizer进行解析的结果

ST:使用StandardTokenizer解析的结果

LCF:使用LowercaseFilter解析的结果


参考资料:

http://blog.csdn.net/clj198606061111/article/details/21289897

http://onlyonetoone.iteye.com/blog/2155740


你可能感兴趣的:(Solr)