• Lucene 入门需要了解的东西


    全文搜索引擎的原理网上大段的内容,要想深入的学习,最好的办法就是先用一下,lucene 发展比较快,下面是写第一个demo  要注意的一些事情:

    1、Lucene的核心jar包,下面几个包分别位于不同的文件夹,需要手工找到并引用就可以进行开发了

    lucene-core-5.3.1.jar

    lucene-analyzers-common-5.3.1.jar

    lucene-queryparser-5.3.1.jar

    2、主要开发包说明

    org.apache.lucene.analysis:语言分析器,主要用于分词

    org.apache.lucene.document:索引文档的管理

    org.apache.lucene.index:索引管理,如增、删、改

    org.apache.lucene.queryparser:查询分析

    org.apache.lucene.search:检索管理

    org.apache.lucene.store:数据存储管理

    org.apache.lucene.util:工具包

    3、写入索引操作的核心类

    Directory:代表索引文档的存储位置,这是一个抽象类有FSDirectoryRAMDirectory两个主要子类。前者将索引写入文件系统,后者将索引文档写入内存。

    Analyzer:建立索引时使用的分析器,主要子类有StandardAnalyzer(一个汉字一个词),还可以由第三方提供如开源社区提供一些中文分词器。

    IndexWriterConfig:操作索引库的配置信息

    IndexWriter:建立索引的核心类,用来操作索引(增、删、改)

    Document:代表一个索引文档

    Field:代表索引文档中存储的数据,新版本的Lucene进行了细化给出了多个子类:IntFieldLongFieldFloatFieldDoubleFieldTextFieldStringField等。

  • 相关阅读:
    整理:分页存储过程整理
    净利润-流通市值比率”与公司估值
    常见7种股票底部形态(图解)
    nginx
    移动成本分布1
    浅谈公开信息检索和判断能力
    股票技术分析 成交量与换手率专题
    成份股和成份股指数
    股票底部形态初探
    筹码拉抬派发法
  • 原文地址:https://www.cnblogs.com/dhf327/p/5058498.html
Copyright © 2020-2023  润新知