Solr查询过程源码分析

SearchHandler.handleRequestBody():
solr搜索主流程
1.调用:RequestHandlerBase
	|--handleRequest(req, rsp);
2.源码分析:
|-prepare() |前期的请求参数准备工作,QueryComponent可以在schemal文件中设置,易扩展
	|-- SearchComponent c : components   
               |--queryComponent.prepare()   	

			|--FQ,FL,SHARDS,Q.SHARDS.ROWS,SHARDS.START  |设置查询的条件,包括分片的查询条件  
			|--设置fieldFlags返回的field值
			|--设置defType值 |默认lucene,实际指向的是lucenePlugin,可在schema文件中扩展
			|--解析QueryParser |对queryString进行解析
      			|--解析fq过滤值,生成filter过滤query集
			|--设定shards分片信息
		|--statComponent.prepare()   
	       	|--debugComponent.prepare()


|--process()   |单组无shard情况处理
	|--String ids = params.get(ShardParams.IDS); |获取shardDoc的id集合,不为空往下执行
		|--通过ids获取文档id的集合,并为下一步获取DocList做准备
			|--int id = req.getSearcher().getFirstMatch(   
                		|--new Term(idField.getName(), idField.getType().toInternal(idArr.get(i))));
			|-- luceneIds[docs++] = id;  
			|-- res.docList = new DocSlice(0, docs, luceneIds, null, docs, 0);

                |--if (rb.isNeedDocSet()) 存在DocSet需求
			|--queries.add(rb.getQuery()); |queryString的查询条件
			|--queries.addAll(filters);    |filter查询条件
			|--res.docSet = searcher.getDocSet(queries);  |通过queries条件进行DocSet查询
		|--rb.setResults(res);  |设置结果返回值
	        |--rsp.add("response",rb.getResults().docList);
		|--return; |获取结果集后返回
 
	|--SolrIndexSearcher.QueryCommand cmd = rb.getQueryCommand();  |获取查询封装的QueryCommand对象
	|--searcher.search(result,cmd);
		|--getDocListC(qr,cmd); 
	|--rb.setResult( result );   |与上同
    	|--rsp.add("response",rb.getResults().docList);

	|--boolean fsv = req.getParams().getBool(ResponseBuilder.FIELD_SORT_VALUES,false);   |设定fsv,用于排序字段处理
		|--SortField[] sortFields  |获取排序的域
		|--Field field = new Field("dummy", "", Field.Store.YES, Field.Index.NO); //  仿冒域
		|--SolrIndexReader[] readers = reader.getLeafReaders();   |获取所有的IndexReader结点
		|--if (readers.length==1)  subReader = readers[0]; |直接处理
		|--for (SortField sortField: sortFields)  |循环处理各个排序域
			|--FieldComparator comparators[] = (readers==null) ? null : new FieldComparator[readers.length]; |声明域比较器
			|--DocIterator it = rb.getResults().docList.iterator(); |过滤docList集合
			|--while(it.hasNext())
				|--int doc = it.nextDoc();
				|--idx = SolrIndexReader.readerIndex(doc, offsets); |获取id所在的Indexreader
				|--comparator.copy(0, doc); 
				|--Object val = comparator.value(0); |获取comparator的value值
				|-- vals.add(val);  |添加至vals当中
			|--sortVals.add(fieldname, vals);  |添加至排序值当中
		|--rsp.add("sort_values", sortVals); |设置响应对象Response的sort_values的排序值


|--process()   |多组shard处理
	|--初始化操作
		|-- HttpCommComponent comm = new HttpCommComponent();
		|-- rb.outgoing = new LinkedList<ShardRequest>();
		|-- rb.finished = new ArrayList<ShardRequest>();
	|--while (nextStage != Integer.MAX_VALUE) |循环执行,设置stage状态
		|-- for( SearchComponent c : components ) {
          	        |--nextStage = Math.min(nextStage, c.distributedProcess(rb)); |distributedProcess(rb)根据rb的stage状态做处理
        	
		|-- while (rb.outgoing.size() > 0)
			|--while (rb.outgoing.size() > 0)
				|--ShardRequest sreq = rb.outgoing.remove(0); |取第一个请求值
				|--for (String shard : sreq.actualShards)  
					|--ModifiableSolrParams params = new ModifiableSolrParams(sreq.params); |设置参数
					|--comm.submit(sreq, shard, params); |提交http请求,执行一个Task任务,获取Response响应
			|--while (rb.outgoing.size() == 0)  
				|--ShardResponse srsp = comm.takeCompletedOrError();  |获取响应
				|--rb.finished.add(srsp.getShardRequest());   |完成此次搜索
				|--for(SearchComponent c : components)        |完成返回的Response的处理
         	    			|--c.handleResponses(rb, srsp.getShardRequest());
		|-- for(SearchComponent c : components) 
          		|-- c.finishStage(rb);  |rb请求响应完成处理
         
         





|--SolrIndexSearcher.getDocSet(List<query>)
	|--if (queries.size()==1) return getDocSet(queries.get(0)) |Query集合为1则直接处理
	|--for (int i=0; i<sets.length; i++)  |集合存在多个query,且query可能为not查询
		|--Query q = queries.get(i);  |取到第i个query
		|--Query posQuery = QueryUtils.getAbs(q);  |如果为negative,则为not,则返回相应的补集
		|--sets[i] = getPositiveDocSet(posQuery);  |查询query获取DocSet集合
		|--if (q==posQuery) |判断是否为negative
			|--nge[i] = false;    |为后续判断
			|--answer = sets[i];  |是postivi查询设置返回的answer值
		|--neg[i] = true;     |否则为正向
	|--if(answer == null) answer = getPositiveDocSet(matchAllDocsQuery);  |如果answer为空,则无positive query
	|--for (int i=0; i<sets.length; i++)   
		|-- if (neg[i]) answer = answer.andNot(sets[i]);    |合并negative查询的answer结果集,并取补集
	 for (int i=0; i<sets.length; i++) 
		|-- if (!neg[i] && i!=smallestIndex) 
			|--answer = answer.intersection(sets[i]);   |--循环set集合,取交集生成新的DocSet,详见HashDocSet
	|--return answer;
    

|--SolrIndexSearcher.getPositiveDocSet(Query q)
	|--if (filterCache != null)
		|--answer = (DocSet)filterCache.get(q);
	|--else
		|--answer = getDocSetNC(q,null);  |normal way to get DocSet
		|--if (filterCache != null) filterCache.put(q,answer);	|保存至filterCache当中

 
|--getDocListC(QueryResult qr, QueryCommand cmd)  |通过QueryCommmand进行查找 
	|--if (queryResultCache != null && cmd.getFilter()==null) |从queryResultCache中进行查找
		|--key = new QueryResultKey(cmd.getQuery(), cmd.getFilterList(), cmd.getSort(), cmd.getFlags());  |计算key值
		|--if ((cmd.getFlags() & NO_CHECK_QCACHE)==0)
			|--superset = (DocList)queryResultCache.get(key);  |从cache中取出DocList集合
				|--out.docList = superset.subset(cmd.getOffset(),cmd.getLen());  |如果子集合不为空
			|--if (out.docSet==null && ((cmd.getFlags() & GET_DOCSET)!=0) ) 
		                |--if (cmd.getFilterList()==null)    |如果filter为null,则直接查询
					|--out.docSet = getDocSet(cmd.getQuery()); |获取DocSet集合
				|--else 
					|--newList.addAll(cmd.getFilterList());  |添加filterList的Doc集合
					|--out.docSet = getDocSet(newList);    |获取DocSet集合
		|--return ;查询完成返回
	|--boolean useFilterCache=false;  |检查是否需要filterCache
	|--for (SortField sf : sfields)   |如果存在SortField,则返回false
		|--if (sf.getType() == SortField.SCORE) 
			|--useFilterCache=false;
			|--break;
	|--if(useFilterCache)
		|--if (out.docSet == null)  |获取真实的DocSet集合
		        |--out.docSet = getDocSet(cmd.getQuery(),cmd.getFilter());
			|--DocSet bigFilt = getDocSet(cmd.getFilterList());
			|--if (bigFilt != null) out.docSet = out.docSet.intersection(bigFilt);
		|--superset = sortDocSet(out.docSet,cmd.getSort(),supersetMaxDoc);  |取出子的设定的返回Doc
		|--out.docList = superset.subset(cmd.getOffset(),cmd.getLen());     |设置docList
	|--else          |此时无任何缓存,为正常处理模式
		|--if ((cmd.getFlags() & GET_DOCSET)!=0) 
			|--DocSet qDocSet = getDocListAndSetNC(qr,cmd);
		|--else 
			|--getDocListNC(qr,cmd);
		|--superset = out.docList;
		      |--out.docList = superset.subset(cmd.getOffset(),cmd.getLen());
	|--if (key != null && superset.size() <= queryResultMaxDocsCached && !qr.isPartialResults())  |设置是否需要设置queryResultCache
	        |--queryResultCache.put(key, superset);
    



|--getDocListAndSetNC(QueryResult qr,QueryCommand cmd)
	|--DocSet filter = cmd.getFilter()!=null ? cmd.getFilter() : getDocSet(cmd.getFilterList()); |获取filter过滤信息
	|--Query query = QueryUtils.makeQueryable(cmd.getQuery()); |设定query为positive的Query条件
	|--final Filter luceneFilter = filter==null ? null : filter.getTopFilter();   
	|--if (lastDocRequested<=0)
		|--if (!needScores)  |是否需要打分
			|--collector = setCollector = new DocSetCollector(smallSetSize, maxDoc);
		|--else
			|--collector = setCollector = new DocSetDelegateCollector(smallSetSize, maxDoc, new Collector()
		|--super.search(query, luceneFilter, collector);  |执行查询条件,获取collector信息,前面操作均为构造查询条件,并作相应的缓存的存取处理
		|--set = setCollector.getDocSet();
	|--else 
		|--处理过程与上类似,但参数设置不同,如下 
		|--totalHits = topCollector.getTotalHits();
		|--TopDocs topDocs = topCollector.topDocs(0, len);
		|--ids[i] = scoreDoc.doc;
	|--qr.setDocList(new DocSlice(0,sliceLen,ids,scores,totalHits,maxScore));
	|--qr.setDocSet(set);
	|--return filter==null ? qr.getDocSet() : null;







你可能感兴趣的:(filter,cmd,null,Solr,query,Components)