Solr开发

本文章仅供参考,没有提供完整的教程,着重点在搭建过程中可能遇到的各类问题,详细的教程网上有很多,可以多看看。
好文参考:Solr7.4.0应用部署Demo

服务部署

复制conf文件

修改data-config.xml文件

分为两种类型:

数据库

数据库的配置相对简单,可以同时配置多张表,写在document字段下即可,此处存在一个问题,id字段一般为uniqueKey,多张表的id字段可能出现重复的情况,可以如下配置id字段,在后面拼接表名,解决重名的问题。



    
      
    
        
        
        
            
            
            
            
        
    

本地文件

对富文本格式进行递归解析(设置recursivetrue),使用TikaEntityProcessor对文件进行解析,注意需要复制一堆架包到lib目录下,可以参考相关教程,一般来说在solr-7.5.0\contribsolr-7.5.0\dist目录下,主要添加了分词器架包以及tika解析文件的各类架包

  • 参考项目solr7.4 配置ikanalyzer和自带的中文分词器
  • ik-analyzer-solr7插件地址


    
    
    
        
            
            
            
            
                
                
                
                
            
        
    










fileName






    
        
    
    
        
    




    
        
        
    
    
        
        
    

文件上传

使用update/extract方法上传富文本

可能存在的问题

  1. Spring data solr Document is missing mandatory uniqueKey field:报错,可能是字段名称没有匹配上,需要仔细检查xml文件配置,同时需要注意为什么网上教程的字段名称全部都是小写,而不是常见的驼峰命名法?因为只要存在大写,就可能匹配失败,注意solrconfig.xml,注意lowernames属性,所有的上传field都会被转成小写进行匹配。

    
        
          true
          ignored_
    
          
          true
          links
          ignored_
        
    
    
  2. 查询的多字段高亮,需要注意QueryFilter Query,可以参考这篇文章搜索引擎solr系列---高亮配置及问题总结。

你可能感兴趣的:(Solr开发)