• Clucene系列3--Clucene的代码组织结构


    Clucene系列(3)——Clucene的代码组织结构

    analysis

    模块主要负责词法分析及语言处理,从而生成Term。也包括各种分析器

    config

    各种编译配置选项,以及一些与OS平台相关的内容。

    debug

    各种断言异常处理宏定义,错误常量。还自带一个内存泄漏跟踪工具和内存池

    document

    一个document对象就是用户提供的一篇文档,可以包括多个Field

    index

    模块主要负责索引的创建,如何读取索引,重要的类里IndexWriter,DocumentWriter,IndexReader,SegmentMerger,SegmentReader.
    IndexWriter和DocumentWriter:负责创建索引
    SegmentReader和IndexReader:负责读取索引
    Segmentmerger:负责索引的合并

    queryparser

    Lucene自带的查询引擎。负责解析用户的输入,可以通过扫描用户输入的字符串,生成各种Query对象。Clucene中支持模糊查询,语义查询,短语查询,组合查询等等,如有TermQuery,BooleanQuery,RangeQuery,WildcardQuery等。

    Search

    模块主要负责对索引的搜索,打分,和排序。

    Store

    主要负责对索引的存储。FSDirectory和RAMDistory是两个重要的类,一个实现了对磁盘的跨平台读写,另一个是把内存当成磁盘。

    util

    一些常用的工具类。主要有:
    BitVector:位数组
    PriorityQueue:优先级队列,好多地方都用到此结构。
    VoidList和VoidMap:分别继承自STL的list 和map。
    聪明的狐狸

  • 相关阅读:
    VMware Workstation 16.0 key (仅支持 intel 架构)
    使用思科ASA对指定端口、IP进行抓包
    轮子的意义
    dubbo学习(三)泛化
    dubbo学习(二)链接
    dubbo学习(一)线程池
    mips交叉编译:SQLite3
    生成证书脚本
    ssh连接不上 WARNING: REMOTE HOST IDENTIFICATION HAS CHANGED!
    gmssl ocsp 验证证书
  • 原文地址:https://www.cnblogs.com/fengtai/p/13264718.html
Copyright © 2020-2023  润新知