• Lucene.net多字段多索引目录搜索


    ============本文转自==========

    http://job-love.blog.sohu.com/97319481.html

    ================================

    Lucene.net是目前在.net环境中被普遍使用的全文索引的开源项目,这次在项目的开发中也使用它进行全文索引。
    在开发过程中碰到一些小问题就是对多字段和多索引目录进行搜索。
    1、多字段搜索就是同时要一个以上的字段中的内容进行比较搜索,类似概念在SQL中就是select * from Table where a like '%query%' or b like '%query%'。

    ▲ Lucene.net中的单个字段查询大家都比较熟悉,这里对字段content进行搜索
    Query query = QueryParser.Parse(querystr,"content",new ChineseAnalyzer());
    Hits hits = searcher.Search(query);

    ▲ 对多个字段查询用到一个MultiFieldQueryParser对象,该对象继承自Query,我们要对字段title,content进行搜索。
       IndexSearcher searcher = new IndexSearcher("c:/index/");
       string[] fields = {"content","title"};
       Query multiquery = MultiFieldQueryParser.Parse(querystr,fields,new ChineseAnalyzer());
       Hits hits = searcher.Search(multiquery);

       //Java搜索代码如下:
       IndexSearcher indexSearcher = new IndexSearcher(dic);
       String[] fields = {"name","description","detail"};
       MultiFieldQueryParser qp = new MultiFieldQueryParser(fields,new StandardAnalyzer());
       try {
          Query query = qp.parse(key);
          Hits hits =indexSearcher.search(query);
          return hits;
       } catch (ParseException e) {
          throw new Exception(e.getMessage());
       }

    2、多索引目录就是要在多个索引目录的中进行比较搜索,类似概念在SQL中就是select * from TableA union select * from TableB。
      IndexSearcher[] searchers = new IndexSearcher[2];
      searchers[0] = new IndexSearcher(IndexPath0);
      searchers[1] = new IndexSearcher(IndexPath1);

      MultiSearcher multisearcher = new MultiSearcher(searchers);
      TopDocs multitopdocs = multisearcher.Search(query, null, 1000);
    这个搜索的结果可能有相同的信息,比如你有一条相同的信息在多个目录中索引,搜索的结果就会出现多次相同的信息。

    还有一种搜索方式是用到ParallelMultiSearcher这个对象,它是从MulitSearcher继承而来。
    ParallelMultiSearcher parallelmultisearcher = new ParallelMultiSearcher(searchers);
    TopDocs paralleltopdocs = parallelmultisearcher.Search(query, null, 1000);
    这个搜索是对搜索后的结果进行合并,剔除重复的信息。 

     
     
  • 相关阅读:
    Java学习第一周汇报
    Java暑期学习第八天日报
    Java暑期学习第十天日报
    Java暑期学习第十二天日报
    Java学习第二周汇报
    Java暑期学习第九天日报
    0006 列表(ul、ol、dl)
    0015 行高那些事:lineheight
    0016 CSS 背景:background
    HTTP中GET与POST的区别 99%的错误认识
  • 原文地址:https://www.cnblogs.com/zjw520/p/3023481.html
Copyright © 2020-2023  润新知