SOLR分组聚合的相关技巧

0. 前言

  1. 使用SOLR的时候我是抗拒的,又应为项目只能用SOLR实现需要,没有办法只能硬着头皮来做,如果实现没办法可以看看下文。
  2. 在做的过程中,SOLR这个技术栈可能用的少,国内的文字写的都是基本应用,facet query都很少使用,我的需求也无法满足,只能自己找两本去读,来研究SOLR,也把成果记录下来,分享给大家。

1. 分组

  1. 我们经常在MySQL中使用group实现分组,虽然SOLR中也提供了Group参数,实现分组,但是只能实现一级分组。
  2. 当然SOLR也可以实现二级分组或多级,有两种方案
    1. 通过facet.pivot实现,优点是结构清晰,SolrQuery实现容易,缺点是获取的分组结果只有总和数量(获取不到具体的数据内容),如果想要加入统计函数,就必须通过Solr的stats工具实现。

      1. 实现分组
      2. facet.pivot=key1,key2

      3. 实现分组加查询
      4. ?q=:&facet query={!tag=zt1 key=”level1”}ZT:1&facet=true&facet.pivot={!query=zt1}key1,key2&rows=0

      5. 实现分组加统计
      6. ?q=:&stats=true&stats.field={!tag=piv1}TS&facet=true&facet.pivot={!stats=piv1}key1,key2&rows=0

    2. 通过json.facet实现,优点是基于分组,对内容进行处理,缺点就是查询结构必须是JSON格式,不容易调试,功能很强大。

      1. 参考
      2. json.facet={key1:{type:terms,limit:-1,field:key1,facet:{key2:{type:terms,limit:-1,field:key2}}}}

      3. 在JSON基础上添加聚合函数
      4. json.facet={key1:{type:terms,limit:-1,field:key1,facet:{key2:{type:terms,limit:-1,field:key2,facet:{max:‘max(ms(NOW,RQ))’,avg:‘avg(ms(NOW,RQ))’}}}}}

2. 注意点

  1. 先看SOLR版本,低版本不支持这两种方案

  2. 通过facet查询的时候,如果数据高于100条,需要设置FacetLimit,不然只会显示100条数据

    query.setFacetLimit(-1);

  3. 使用json.facet的时候,也需要在内部添加limit:-1

  4. 如果SOLR是高版本,报错不支持聚合函数,那就可能是函数接受的这个字段是不支持的类型,改下字段类型就可以了。

3. 参考书籍

  1. SOLR权威指南下卷

你可能感兴趣的:(工作问题,solr)