• lucene 索引查看工具


    luke 是 lucene 索引查看工具,基于 swing 开发的,是 lucene、solr、nutch 开发过程中不可或缺的工具。在测试搜索过程,进程出现搜不到东西或者搜到的东西不是想要的结果时,这时就需要用 luke 查看一下索引库的情况,来协助排查问题。
    它能访问Lucene建立好的索引同时也允许以如下的一些方式展示和修改内容:
    1、按文档(Document)号或者词项浏览
    2、查看文件/复制到粘贴板

    3、查询一个高频词项排序列表

    4、执行查询并查看结果

    5、分析查询结果

    6、选择性地从索引中删除文档

    7、重建修改原始文档域,重新插入索引中

    8、优化索引

     现在Luke版本可以通过插件或者脚本进行扩展。

    在Luke中选择plugins标签,再选择Analyzer Tool,就可以使用这个测试Analyzer的工具了。在下拉列表中选择要测试的Analyzer,然后输入要分析的文本,点Analyze,就可以看 到分析出来的token了。这个工具可以测试很多analyzer,除了最基本的WhitespaceAnalyzer、StopAnalyzer、 SimpleAnalyzer、StandardAnalyzer之外还可以实验KeywordAnalyzer、SnowballAnalyzer、 CJKAnalyzer、ChineseAnalyzer等等,可以说是包罗万象了。

    写索引和搜索程序之前,都可以用这个工具来比较一下各种Analyzer的运行结果。另外估计如果把自己写的Analyzer编译后加入Luke的jar包的相应位置中,应该也可以测试自己的Analyzer类了。


    下载:
    luke 可以从 google code 上下载
    只是为了使用 luke 的话,下载 jar 包即可,经常有朋友下载成了源码包,最后不知道如何运行,从 luke 在 1.0 版版本对应的是 lucene 3.0,1.0 以前的版本,如0.9,对应的 lucene 版本为 2.9,从 1.0 以后,luke 跟 lucene 的版本号一一对应了,暂时没有找到3.6版本的luke,其实可以用4.0的luke代替,可以兼容的。
    假设下载了lukeall-3.5.0.jar ,然后右键点击这个 jar,打开方式中选择 java 来运行他,即可看如下运行界面:
    luke
    在path中写入索引库的目录,点击OK即可打开索引库。
  • 相关阅读:
    Python 实例、类方法和静态方法
    allure生成测试报告,index.html页面内容为空
    【UOJ567】【IOI2020】Biscuits(DP)
    【BZOJ2410】Nim游戏(博弈论)
    【洛谷4351】[CERC2015] Frightful Formula(坐标系走路)
    【洛谷3581】[POI2015] CZA(DP)
    【LOJ117】有源汇有上下界最小流
    【洛谷6915】[ICPC2015 WF] Weather Report(哈夫曼树)
    【洛谷6152】[集训队作业2018] 后缀树节点数(SAM+LCT)
    【CF1349D】Slime and Biscuits(势能函数)
  • 原文地址:https://www.cnblogs.com/duyinqiang/p/5696700.html
Copyright © 2020-2023  润新知