es-ik分词器的拓展和停用字典

目录

一、分词器


一、分词器

  • 分词器的作用是什么?

        创建倒排索引时对文档分词
        用户搜索时,对输入的内容分词

  • IK分词器有几种模式?

        ik_smart:智能切分,粗粒度
        ik_max_word:最细切分,细粒度

  • IK分词器如何拓展词条?如何停用词条?

        利用config目录的IkAnalyzer.cfg.xml文件添加拓展词典和停用词典
        在词典中添加拓展词条或者停用词条

ik分词器-拓展词库

要拓展ik分词器的词库,只需要修改一个ik分词器目录中的config目录中的IkAnalyzer.cfq.xml文件


        IK Analyzer 扩展配置

        

        ext.dic

 

ik分词器-停用词库

要禁用某些敏感词条,只需要修改一个ik分词器目录中的config目录中的IkAnalyzer.cfq.xml文件


        IK Analyzer 扩展配置

        

        ext.dic

        

        stopword.dic

 

 二、分词器字典的扩展与停用

 2.1 打开IkAnalyzer.cfq.xml文件

es-ik分词器的拓展和停用字典_第1张图片

添加扩展词字典、停止词字典

es-ik分词器的拓展和停用字典_第2张图片

2.2 在同级目录下新建 ext.dic 文件(扩展词)
es-ik分词器的拓展和停用字典_第3张图片 2.3 在同级目录下找到 stopword.dic 文件(禁用词)并编辑,用于禁用分词

es-ik分词器的拓展和停用字典_第4张图片

2.4 重启即可完成 

你可能感兴趣的:(大数据,Java,SpringCloud,elasticsearch,大数据,搜索引擎,spring,cloud,mysql,分布式,tomcat)