springboot集成IKAnalyer分词工具

  1. 什么是IKAnalyer

IK Analyzer是一个很轻量的中文分词工具,是基于java开发的轻量级的中文分词工具包。它是以开源项目Luence为主体的,结合词典分词和文法分析算法的中文分词组件

  1. 集成到springboot

  • 在pom.xml中添加IKAnalyer依赖
		
        
            com.janeluo
            ikanalyzer
            2012_u6
            
                
                    org.apache.lucene
                    lucene-core
                
                
                    org.apache.lucene
                    lucene-queryparser
                
                
                    org.apache.lucene
                    lucene-analyzers-common
                
            
        

        
        
            org.apache.lucene
            lucene-queryparser
        
  • 编写Ik工具类
package com.byyj.exorcist.util;

import com.github.pagehelper.util.StringUtil;
import org.assertj.core.util.Lists;
import org.springframework.stereotype.Component;
import org.wltea.analyzer.core.IKSegmenter;
import org.wltea.analyzer.core.Lexeme;


import java.io.StringReader;
import java.util.ArrayList;
import java.util.List;

/**
 * @ClassName: IKAnalyzerSupport
 * @Auther: wuhao
 * @Date: 2021/2/24 16:45
 * @Description:分词工具类
 */
@Component
public class IKAnalyzerSupport {
    public List iKSegmenterToList(String string){
        List list=new ArrayList<>();
        try{
            if(StringUtil.isEmpty(string)){
                return Lists.newArrayList();
            }
            StringReader sr=new StringReader(string);
            IKSegmenter ik=new IKSegmenter(sr,false);
            Lexeme lex;
            while((lex=ik.next())!=null){
                String lexemeText=lex.getLexemeText();
                if(lexemeText.length()>=2){
                    list.add(lexemeText);
                }
            }
        }catch (Exception e){
            e.printStackTrace();
        }
        return list;
    }
}
  1. 自定义扩展配置

resource目录下三个配置文件
springboot集成IKAnalyer分词工具_第1张图片

  • IKAnalyzer.cfg.xml配置



    IKAnalyzer扩展配置
    
    extend.dic
    
    stopword.dic

  • extend.dic配置
相互学习
多多转发
csdn博客
  • stopword.dic
qq
41015193
csdn
博客
相互
互学
学习
  1. 测试结果

你可能感兴趣的:(java,spring)