【Lucene4.8教程之三】搜索

【Lucene4.8教程之三】搜索
1、关键类

Lucene的搜索过程中涉及的主要类有下面几个：

（1）IndexSearcher：运行search()方法的类

（2）IndexReader：对索引文件进行读操作，并为IndexSearcher提供搜索接口

（3）Query及其子类：查询对象，search()方法的重要參数

（4）QueryParser：依据用户输入的搜索词汇生成Query对象。

（5）TopDocs：search()方法返回的前n个文档

（6）ScoreDocs：提供TopDocs中搜索结果的訪问接口

2、搜索的关键步骤

（1）创建IndexReader

（2）使用IndexReader创建IndexSearcher

（3）依据搜索keyword，使用QueryParser生成Query对象

（4）以Query作为參数调用IndexSearcher.search()，运行搜索

（5）以TopDocs以及ScoreDocs遍历结果并处理

演示样例代码例如以下：
```
//（1）创建IndexReader
Directory indexDir2 = FSDirectory.open(indexDir);
IndexReader ir = DirectoryReader.open(indexDir2);
//（2）使用IndexReader创建IndexSearcher
IndexSearcher searcher = new IndexSearcher(ir);
//（3）依据搜索keyword，使用QueryParser生成Query对象
QueryParser parser = new QueryParser(Version.LUCENE_48, "contents",new SimpleAnalyzer(Version.LUCENE_48));
Query query = null;
try {
	query = parser.parse(term);
	} catch (ParseException e) {
		e.printStackTrace();
	}
//（4）以Query作为參数调用IndexSearcher.search()，运行搜索
TopDocs docs = searcher.search(query, 30);		

//（5）以TopDocs以及ScoreDocs遍历结果并处理
ScoreDoc[] hits = docs.scoreDocs;
System.out.println(hits.length);
for (ScoreDoc hit : hits) {
			System.out.println("doc: " + hit.doc + " score: " + hit.score);
		}
```
3、关于IndexReader

（1）IndexReader未提供构造函数，因此须要通过DirectoryReader.open()方法来创建一个IndexReader。

（2）创建一个IndexReader须要较大的系统开销，因此最好在全部搜索期间都反复使用一个IndexReader，仅仅有在必要的时候才建议打开新的IndexReader。

（3）在创建IndexReader时，它会搜索已有的索引快照，假设你须要搜索索引中的变更信息，那么必须打开一个新的reader。所幸的是IndexReader.reopen方法是一个获取新IndexReader的有效方法，能在耗费较少系统资源的情况下使用当前reader来获取索引中全部的变更信息。【新版本号中已废弃，待确认替代方法】

4、关于QueryParser与Query的子类

对于一个搜索而言，其核心语句为：
```
searcher.search(query, 10);
```
此时，其最重要的參数为一个Qeury对象。构造一个Query对象有2种方法：【均以在contents域搜索java关键词为例】

（1）使用Query的子类，如BooleanQuery, ConstantScoreQuery, DisjunctionMaxQuery, FilteredQuery, MatchAllDocsQuery, MultiPhraseQuery, MultiTermQuery, PhraseQuery, SpanQuery, TermQuery，直接实例化一个对外：
```
searcher.search( new TermQuery(new Term("contents","java")), 10);
```
下面语句结构更为清晰
```
Term term= new Term("contents","java");
TermQuery tq = new TermQuery(term);
searcher.search(tq , 10);
```
此外，即为在contents域中搜索包含java的文档。
（2）使用QueryParser的parse()方法，对所传入的搜索关键词汇进行解释，并返回query对象。
```
QueryParser parser = new QueryParser(Version.LUCENE_48, "contents",new SimpleAnalyzer(Version.LUCENE_48));
Query query = null;
try {
	query = parser.parse("java");
} catch (ParseException e) {
	e.printStackTrace();
}
TopDocs docs = searcher.search(query, 10);
```
以上语句创建一个QueryParser，其默认搜索域为contents，然后将搜索词汇转化为Query对象。

假设指定QueryParser的默认搜索域为所有？怎样指定一个Query的搜索域？

关于QueryParser与Query子类的更具体内容，请參见

【Lucene4.8教程之六】QueryParser与Query子类：怎样生成Query对象 http://blog.csdn.net/jediael_lu/article/details/33288793
相关阅读:
SpringMvc 框架
 面试：你最大的长处和弱点分别是什么？这些长处和弱点对你在企业的业绩会有什么样的影响？
线程、并发、并行、进程是什么，以及如何开启新的线程？
面向对象三大特性
 一台客户端有三百个客户与三百个客户端有三百个客户对服务器施压，有什么区别?
JavaScript 引擎
 Spring Data JPA简介 Spring Data JPA特点
 redo log 有什么作用？
Spring的简介和优点？
学习笔记——享元模式Flyweight
原文地址：https://www.cnblogs.com/mfrbuaa/p/3898950.html