倒排链求交过程--Lucene

前言

自己理解的倒排求交:

1: 首先倒排链是排序的,根据docid大小排序

2: 比如现在有两个倒排链(对应于两个term的查询结果),现在需要求交

3: 两个指针在倒排链上移动,先移动拥有较小头的链的首指针,找到大于等于另一个链首的时候,停下

4: 如果等于,则放到记录此docid, 大于则移动另一条

5: 记录下来的docid就是求交后的结果集

如果三条的倒排链求交?

答案是可以同时用三个指针,不要想着两个结束后操作第三个

 

正文

 

下面给出Lucene的倒排链求交的过程

  链表集合求交 

      lucene中用的是ConjunctionScorer ,大致过程是每条倒排链不断的推进到小于等于当前最大节点的位置。

 

首先假设我们已经用query: name=hxx&age=19&... 每个term条件查出来一条倒排链,接下来就要对每个倒排链进行求交,得到满足所有条件的结果集。

将每条倒排链(头指针),按照第一个元素的大小顺序,放到一个循环数组中(对应图中下标为0-7),现在取最arr[7] 的倒排链的第一个元素作为最先要比较的docid(因为它最大,即doc=8),

执行下面过程

 

首先把倒排链按第一个next排序:

 

    倒排链求交过程--Lucene_第1张图片

 

查看0~7的倒排链的第一个和最后一个是否相同,

你可能感兴趣的:(云搜索进阶之路)