1.采用最新版本的Lucene
2.索引文件存储采用本地文件系统,如果需要挂载远程系统,请采用 readonly方式。
3.当然采用更好的硬件,更高I/O的磁盘
4.提高OS 缓存,调整参数
5.提高JVM heap size
6.索引文件读写分离,打开 IndexReader 的时候采用 readonly方式
7.在非Windows系统中使用,采用 NIOFSDirectory 取代 FSDirectory
8.采用单例的 IndexSearcher。
9.只在必须的情况下重复打开 IndexSearcher,监视 索引文件,如果有更新才重新打开 IndexSearcher
10.减少mergeFactor, 有助于提高检索速度,但会降低 索引 速度, 检索和索引分离
11.限制使用 sorted field 和 term vector。分页获取,通过docID 得到文档的时候请先排序。
12.在得到document的时候采用 FieldSelector 决定哪些field需要加载,怎样加载。
13.当采用 Fuzzy 模糊检索的时候,prefix前缀 长度尽可能的短
14.谨慎使用Filter,Filter 提高检索精度,不会影响评分