【转载】 Searching过程粗略梳理

转载自：http://www.cnblogs.com/huangfox/archive/2012/02/09/2344686.html

solr-searching过程分析（一）

——searching过程粗略梳理

下午看了一会solr的启动过程，往细的看相当繁琐。换个头绪先看看solr的searching过程。

1.拦截请求，解析请求并构建相应的handler。

发送检索请求，例如：http://localhost:8983/solr3.5/core2/select/?q=*%3A*&version=2.2&start=0&rows=10&indent=on

首先他将被SolrDispatchFilter拦截。

doFilter(ServletRequest
 request, ServletResponse response, FilterChain chain)

通过对request的分析，获知当前request是做什么的（/select），并构造相应的handler（SearchHandler）。

2.SolrCore出面处理上层工作（具体工作交由handler处理）

将handler、SolrQueryRequest、SolrQueryResponse交由solrCore的execute方法处理

public void execute(SolrRequestHandler
 handler, SolrQueryRequest req, SolrQueryResponse rsp)

在该方法中主要还是由handler来完成的。

SolrRequestHandler是一个接口，他主要的方法就是：

public void handleRequest(SolrQueryRequest
 req, SolrQueryResponse rsp);

SolrRequestHandler的实现类的结构图如下：

其中RequestHandlerBase为大部分的Handler实现了部分功能，主要包括

public void handleRequest(SolrQueryRequest
 req, SolrQueryResponse rsp){

　　......

　　handleRequestBody(
 req, rsp );

　　......

}

然而具体怎么做就交给具体的子类去执行了！（handleRequestBody( req, rsp );）

例如：这里是做检索，那么就交由SearchHandler处理。

（这里的设计方式有点类似于servlet，GenericSerlet实现了一些公用方法，而具体的则有其子类完成，例如HttpServlet）

3.SearchHandler具体的检索过程

现在的检索没有使用shards，在跟踪代码的过程中，发现以下过程是检索的主要环节。

if(!rb.isDebug())
 {

        //
 Process

        for(
 SearchComponent c : components ) {

         <strong>
 c.process(rb);</strong>

        }

      }

从中可知真正的检索需要经过多个SearchComponent，在当前的实验环境下包括6个，如下：

4.各个SearchComponent配合工作完成检索

我们先重点了解QueryComponent。

获得SolrIndexSearcher，这个对象是检索的主要执行者。

同时获取SolrIndexSearcher.QueryCommand、SolrIndexSearcher.QueryResult，并将其作为查询条件和查询结果提交给SolrIndexSearcher进行检索。

searcher.search(result,cmd);

在SolrIndexSearcher中search方法如下：

public QueryResult
 search(QueryResult qr, QueryCommand cmd) throws IOException
 {

    <strong>getDocListC(qr,cmd);</strong>

    return qr;

  }

getDocListC又是一个比较复杂的方法，在这里加入的cache。

如果当前检索被缓存了（缓存也是个重点内容，后续详细分析！），那么直接返回结果，否则重新进行检索，检索的方法是：

private void getDocListNC(QueryResult
 qr,QueryCommand cmd) 

在该方法中，和我们使用lucene进行检索十分相似，采用的具体方法是：

super.search(query,
 luceneFilter, collector);

检索完成将结果进行封装，放入QueryResult当中。

qr.setDocList(new DocSlice(0,sliceLen,ids,scores,totalHits,maxScore));

检索完成后，将结果放入缓存中，“造福后人”！

至此QueryComponent的工作就算完成了。

如果做简单查询（如：http://localhost:8983/solr3.5/core2/select/?q=*%3A*&version=2.2&start=0&rows=10&indent=on）

那么后面5个Component就直接过了（没有真正被执行）。

5.收尾工作

将结果封装好，写入相应的ResponseHeaders，关闭SolrQueryRequest、solrCore。

-----------------------------------------------------

以上是solr-searching最粗略的过程，本着先脉络后细节的思想，以后再对各个重要环节做深入分析。

searching主要执行方法如下：

SolrDispatchFilter（doFilter,execute）

->SolrCore(execute)

->RequestHandlerBase(handleRequest)

->SearchHandler(handleRequestBody) //有可能执行多个Component

->QueryComponent(process)

->SolrIndexSearcher(search,getDocListC)

相关阅读:
Impala源码之订阅发布系统的实现
Kylin性能调优记——业务技术两手抓
The Beam Model：Stream & Tables翻译（上）
手把手教你搭建hadoop+hive测试环境(新手向)
使用 Apache Atlas 进行数据治理
类似gitlab代码提交的热力图怎么做？
3分钟掌握一个有数小技能：回头客分析
3分钟掌握一个有数小技能：制作动态标题
uva 10404 Bachet's Game(完全背包）
POJ3771+Prim

原文地址：https://www.cnblogs.com/eaglegeek/p/4557875.html