• 关于lucene断点续索引和增量索引的问题


    关于lucene断点续索引和增量索引的问题
    1、像百度、google等桌面搜索建立索引的时候可以停止后重新索引,他能保证以前索引过的文件重新索引的时候不用再索引吗?如果停止后要索引的文件进行了删除和添加等操作,那么他是怎么处理的以保证索引文件的覆盖率。用lucene索引文件的时候如何实现这种功能,给个思路。

    2、如何在我给一个目录里添加一个文件的时候自动把这个文件用lucene索引起来,就是所谓的增量索引,难道用个timer扫描目录变化或者用filewatch来监视这个目录,然后对其索引吗?可是这样的话必须做个windows服务了,要不这个软件关闭的话就不能相应目录里文件的变化了。

    3、如果一个文件修改或者删除了,如何同步到索引里,用IndexReader找这个Document的时候考什么去找,必须要在Document里放一个类似于主键的域来找到它,并删除或者重新建立索引吗?

    就这3问题,大家给说说思路,谢谢。

  • 相关阅读:
    runc create container 流程分析
    cri-o pod 创建源码分析
    hyperstart 容器创建流程分析
    MIT jos 6.828 Fall 2014 训练记录(lab 4)
    python 邮件发送 脚本
    jvm: 理解gc日志
    jvm:垃圾收集器
    GC 垃圾收集
    jvm结构
    Java transient关键字使用小记
  • 原文地址:https://www.cnblogs.com/onlytiancai/p/689697.html
Copyright © 2020-2023  润新知