• 【转载】 Searching过程粗略梳理



    转载自:http://www.cnblogs.com/huangfox/archive/2012/02/09/2344686.html

    solr-searching过程分析(一)

    ——searching过程粗略梳理

     

    下午看了一会solr的启动过程,往细的看相当繁琐。换个头绪先看看solr的searching过程。

     

    1.拦截请求,解析请求并构建相应的handler。

    发送检索请求,例如:http://localhost:8983/solr3.5/core2/select/?q=*%3A*&version=2.2&start=0&rows=10&indent=on

    首先他将被SolrDispatchFilter拦截。

    doFilter(ServletRequest request, ServletResponse response, FilterChain chain)

    通过对request的分析,获知当前request是做什么的(/select),并构造相应的handler(SearchHandler)。

     

    2.SolrCore出面处理上层工作(具体工作交由handler处理)

    将handler、SolrQueryRequest、SolrQueryResponse交由solrCore的execute方法处理

    public void execute(SolrRequestHandler handler, SolrQueryRequest req, SolrQueryResponse rsp)

    在该方法中主要还是由handler来完成的。

    SolrRequestHandler是一个接口,他主要的方法就是:

    public void handleRequest(SolrQueryRequest req, SolrQueryResponse rsp);

    SolrRequestHandler的实现类的结构图如下:

    其中RequestHandlerBase为大部分的Handler实现了部分功能,主要包括

    public void handleRequest(SolrQueryRequest req, SolrQueryResponse rsp){
      ......
      handleRequestBody( req, rsp );
      ......
    }

    然而具体怎么做就交给具体的子类去执行了!(handleRequestBody( req, rsp );)

    例如:这里是做检索,那么就交由SearchHandler处理。

    (这里的设计方式有点类似于servlet,GenericSerlet实现了一些公用方法,而具体的则有其子类完成,例如HttpServlet)

     

    3.SearchHandler具体的检索过程

    现在的检索没有使用shards,在跟踪代码的过程中,发现以下过程是检索的主要环节。

    if(!rb.isDebug()) {
            // Process
            for( SearchComponent c : components ) {
             <strong> c.process(rb);</strong>
            }
          }

    从中可知真正的检索需要经过多个SearchComponent,在当前的实验环境下包括6个,如下:

     

    4.各个SearchComponent配合工作完成检索

    我们先重点了解QueryComponent。

    获得SolrIndexSearcher,这个对象是检索的主要执行者。

    同时获取SolrIndexSearcher.QueryCommand、SolrIndexSearcher.QueryResult,并将其作为查询条件和查询结果提交给SolrIndexSearcher进行检索。

    searcher.search(result,cmd);

    在SolrIndexSearcher中search方法如下:

    public QueryResult search(QueryResult qr, QueryCommand cmd) throws IOException {
        <strong>getDocListC(qr,cmd);</strong>
        return qr;
      }

    getDocListC又是一个比较复杂的方法,在这里加入的cache。

    如果当前检索被缓存了(缓存也是个重点内容,后续详细分析!),那么直接返回结果,否则重新进行检索,检索的方法是:

    private void getDocListNC(QueryResult qr,QueryCommand cmd)

    在该方法中,和我们使用lucene进行检索十分相似,采用的具体方法是:

    super.search(query, luceneFilter, collector);

    检索完成将结果进行封装,放入QueryResult当中。

    qr.setDocList(new DocSlice(0,sliceLen,ids,scores,totalHits,maxScore));

    检索完成后,将结果放入缓存中,“造福后人”!

    至此QueryComponent的工作就算完成了。

    如果做简单查询(如:http://localhost:8983/solr3.5/core2/select/?q=*%3A*&version=2.2&start=0&rows=10&indent=on

    那么后面5个Component就直接过了(没有真正被执行)。

     

    5.收尾工作

    将结果封装好,写入相应的ResponseHeaders,关闭SolrQueryRequest、solrCore。

     

    -----------------------------------------------------

    以上是solr-searching最粗略的过程,本着先脉络后细节的思想,以后再对各个重要环节做深入分析。

    searching主要执行方法如下:

    SolrDispatchFilter(doFilter,execute)

    ->SolrCore(execute)

    ->RequestHandlerBase(handleRequest)

    ->SearchHandler(handleRequestBody) //有可能执行多个Component

    ->QueryComponent(process)

    ->SolrIndexSearcher(search,getDocListC)


  • 相关阅读:
    Impala源码之订阅发布系统的实现
    Kylin性能调优记——业务技术两手抓
    The Beam Model:Stream &amp; Tables翻译(上)
    手把手教你搭建hadoop+hive测试环境(新手向)
    使用 Apache Atlas 进行数据治理
    类似gitlab代码提交的热力图怎么做?
    3分钟掌握一个有数小技能:回头客分析
    3分钟掌握一个有数小技能:制作动态标题
    uva 10404 Bachet's Game(完全背包)
    POJ3771+Prim
  • 原文地址:https://www.cnblogs.com/eaglegeek/p/4557875.html
Copyright © 2020-2023  润新知