跟着官网学solr(三):数据导入

        前面简单介绍了索引的主要组成部分,本篇主要是记录下导入数据构建索引的几种配置方法。

        导入数据的命令:bin/solr -e dih

        待索引数据主要分为三类:数据库数据、文件数据、网页数据。这三类数据对应的solrconfig.xml的配置是一致的,修改solrconfig.xml,增加所需lib包及以下配置:



    
      data-config.xml
    
  
        数据库数据:对应的data-config.xml配置如下:


  


  
 


    
      
 

      
        
      
      
        
          
        
      
    
  
        文件数据:对应的data-config.xml配置如下:

    
    
        
                
                
                
        
    

        网页数据:对应的data-config.xml配置如下:

  
    
      
              forEach="/RDF/channel | /RDF/item"
              transformer="DateFormatTransformer">
      
      
      
      
      
      
      
      
      
      
      
      
    
  
        以上几个配置可以看出,所有的数据导入都是由DataSource以及EntityProcessor两个对象来进行处理,需要熟悉两个类及其子类。


        参考:https://cwiki.apache.org/confluence/display/solr/Uploading+Structured+Data+Store+Data+with+the+Data+Import+Handler

你可能感兴趣的:(solr)