Solr 使用Carrot2完成了聚类功能,能够把检索到的内容自动分类, Carrot2聚类示例:

 



       要想Solr支持聚类功能,首选要把Solr发行包的中的dist/ solr-clustering-4.2.0.jar, 复制到\solr\contrib\analysis-extras\lib下.然后打开solrconfig.xml进行添加配置:


        

   

                      enable="${solr.clustering.enabled:true}"

   

                      class="solr.clustering.ClusteringComponent" >

   

   

   

        default

   

        org.carrot2.clustering.lingo.LingoClusteringAlgorithm

   

        30

   

         0.70

   

         0

   

         org.carrot2.clustering.lingo.SimpleLabelAssigner

   

          1.5

   

         8

   

         8

    
   

         HIGH

   

         

   

         org.carrot2.matrix.factorization.NonnegativeMatrixFactorizationEDFactory

   

         37500

   

         2.0

   

         0.9

   

         

   

         org.carrot2.text.vsm.TfTermWeighting

   

         CHINESE_SIMPLIFIED

   

         org.carrot2.text.clustering.MultilingualClustering.LanguageAggregationStrategy.FLATTEN_MAJOR_LANGUAGE   

   

         true

   

         true

   

         true

   

         true

   

         true

   

         true

   

         true

   

         0.65

   

         false

   

         2

   

         true

   

         1

   

         1

   

         clustering/carrot2

   

         id

   

   

   

     

    
   

    

       配好了聚类组件后,下面配置requestHandler:


        

  

   

                  startup="lazy"

   

                     enable="${solr.clustering.enabled:true}"

   

                     class="solr.SearchHandler">

   

   

   

    explicit

   

    true

   

    default

   

    true

   

    category_s

   

    content        

   

    path

   

    true

   

  

   

  

   

    clustering

   

  

   

  

    
   

    

       有两个参数要注意carrot.title,carrot.snippet是聚类的比较计算字段,这两个参数必须是stored="true".carrot.title的权重要高于carrot.snippet,如果只有一个做计算的字段carrot.snippet可以去掉(是去掉不是值为空).设完了用下面的URL就可以查询了

http://localhost:8080/skyCore/clustering?q=*%3A*&wt=xml&indent=true

更多精彩内容请关注:http://bbs.superwu.cn 

关注超人学院微信二维码:solr聚类_第1张图片

关注超人学院java免费学习交流群:solr聚类_第2张图片