• Solr8.0速成系列 | Solr客户端常用操作和查询语法 08


    1.控制台条件查询
    2.标准查询操作符
    3.solr的分页
    4.solr控制台高亮字段配置
    5.转移字符
     

    solr控制台高亮字段配置
    1、solr默认集成了高亮插件

    2、配置高亮3个条件

    a.开启高亮 
    b.显示高亮的字段 
    c.高亮使用的标签。如

    控制台查询条件 

    常用查询参数
     q – 查询字符串,必须的
                测试列子: blog_name:*Java* AND blog_intro:*csdn* 

                                   blog_name:*Java* OR blog_intro:*csdn*

                                  date_time:[20081001 TO 20091031]

                                  不包含条件为"-",比如不包含名称中有红色的:-blog_name:*java*

                     *号可以用在范围查询的开始或结束 
                      field:[* TO 100] field值小于等于100 
                      field:[100 TO *] field值大于等于100 
                      field:[* TO *] 匹配包含field字段的所有文档

    start – 返回第一条记录在完整找到结果中的偏移位置,0开始,一般分页用。
    rows – 指定返回结果最多有多少条记录,配合start来实现分页。
    sort – 排序,格式:sort=<field name>+<desc|asc>[,<field name>+<desc|asc>]… 。示例:(date desc, price asc)表示先 “date ” 降序, 再 “price” 升序,默认是相关性降序。
    wt – (writer type)指定输出格式,可以有 csv,json,xml, python, php, ruby..
    fq – (filter query)过虑查询,作用:在q查询符合结果中同时是fq查询符合的。提供一个可选的筛选器查询。查询结果被限制为仅搜索筛选器查询返回的结果。筛选过的查询由 Solr 进行缓存。它们对提高复杂查询的速度非常有用。
                  相关性(score)为优先排序条件的,那么条件一定放在q参数中。

                  如果用于q。那么,就会查所有name中包含"张三"的,然后order by score,这时就会按name的相似度来排序。

                 而如果用fq,q设置为*:*。那么solr会先order by score,而因为条件是*:*,所以所有文档的相关性都是一样的,所以即使用fq               过滤了,返回的最前面的却不是相关性最高的。

    fl- field作为逗号分隔的列表指定文档结果中应返回的 Field 集。默认为 “*”,指所有的字段。“score” 指还应返回记分。例如 *,score
    将返回所有字段及得分。用solrj的bean时,得在query中指定 query.set("fl", "*,score");
    q.op – 覆盖schema.xml的defaultOperator(有空格时用"AND"还是用"OR"操作逻辑),一般默认指定
    df – 默认的查询字段,一般默认指定
    qt – (query type)指定那个类型来处理查询请求,一般不用指定,默认是standard。
    indent – 返回的结果是否缩进,默认关闭,用 indent=true|on 开启,一般调试json,php,phps,ruby输出才有必要用这个参数。
    version – 查询语法的版本,建议不使用它,由服务器指定默认值。
    hight:
         hl-highlight,h1=true,表示采用高亮。可以用h1.fl=field1,field2 来设定高亮显示的字段。

    hl.fl: 用空格或逗号隔开的字段列表。要启用某个字段的highlight功能,就得保证该字段在schema中是stored。如果该参数未被给出,那么就会高 亮默认字段 standard handler会用df参数,dismax字段用qf参数。你可以使用星号去方便的高亮所有字段。如果你使用了通配符,那么要考虑启用 hl.requiredFieldMatch选项。
    hl.requireFieldMatch:
    如果置为true,除非该字段的查询结果不为空才会被高亮。它的默认值是false,意味 着它可能匹配某个字段却高亮一个不同的字段。如果hl.fl使用了通配符,那么就要启用该参数。尽管如此,如果你的查询是all字段(可能是使用 copy-field 指令),那么还是把它设为false,这样搜索结果能表明哪个字段的查询文本未被找到
    hl.usePhraseHighlighter:
    如果一个查询中含有短语(引号框起来的)那么会保证一定要完全匹配短语的才会被高亮。
    hl.highlightMultiTerm
    如果使用通配符和模糊搜索,那么会确保与通配符匹配的term会高亮。默认为false,同时hl.usePhraseHighlighter要为true。
    hl.snippets:
    这是highlighted片段的最大数。默认值为1,也几乎不会修改。如果某个特定的字段的该值被置为0(如f.allText.hl.snippets=0),这就表明该字段被禁用高亮了。你可能在hl.fl=*时会这么用。
    hl.fragsize:
    每个snippet返回的最大字符数。默认是100.如果为0,那么该字段不会被fragmented且整个字段的值会被返回。大字段时不会这么做。
    hl.mergeContiguous:
    如果被置为true,当snippet重叠时会merge起来。
    hl.maxAnalyzedChars:
    会搜索高亮的最大字符,默认值为51200,如果你想禁用,设为-1
    hl.alternateField:
    如果没有生成snippet(没有terms 匹配),那么使用另一个字段值作为返回。
    hl.maxAlternateFieldLength:
    如果hl.alternateField启用,则有时需要制定alternateField的最大字符长度,默认0是即没有限制。所以合理的值是应该为
    hl.snippets * hl.fragsize这样返回结果的大小就能保持一致。
    hl.formatter:一个提供可替换的formatting算法的扩展点。默认值是simple,这是目前仅有的选项。显然这不够用,你可以看看org.apache.solr.highlight.HtmlFormatter.java 和 solrconfig.xml中highlighting元素是如何配置的。
    注意在不论原文中被高亮了什么值的情况下,如预先已存在的em tags,也不会被转义,所以在有时会导致假的高亮。
    hl.fragmenter:
    这个是solr制 定fragment算法的扩展点。gap是默认值。regex是另一种选项,这种选项指明highlight的边界由一个正则表达式确定。这是一种非典型 的高级选项。为了知道默认设置和fragmenters (and formatters)是如何配置的,可以看看solrconfig.xml中的highlight段。
    regex 的fragmenter有如下选项:
    hl.regex.pattern:正则表达式的pattern
    hl.regex.slop:这是hl.fragsize能变化以适应正则表达式的因子。默认值是0.6,意思是如果hl.fragsize=100那么fragment的大小会从40-160.
    这些值都可以在select中加入,也可以用solrj的api去设定,也可以配置在solrconfig.xml中配置。
    示例如下:

    <requestHandler name="search" class="solr.SearchHandler" default="true">
        <!– default values for query parameters can be specified, these
             will be overridden by parameters in the request
          –>
         <lst name="defaults">
           <str name="echoParams">explicit</str>
           <int name="rows">10</int>
           <bool name="hl">true</bool> 
           <str name="hl.fl">title,content</str>  
           <str name="f.content.hl.fragsize">200</str>
           <str name="mlt.qf">
             id^10.0 title^10.0 content^1.0
           </str>
         </lst>
    </requestHandler>
    标准查询操作符


    转移字符
    + - && || ! ( ) { } [ ] ^ " ~ * ? : /
    这些字符在solr中具有特殊的含义,如果要使用这么字符本身含义,需要利用反斜杠进行转义,比如: (1+1):2
    其他操作命令
    SOLR在浏览器中输入命令:

    1、全导入:

    http://localhost:8085/solr/law/dataimport?command=full-import&commit=true

    2、增量导入:

    http://localhost:8085/solr/core0/dataimport?command=delta-import&clean=false&commit=true

    3、查看导入状态

    http://localhost:8085/solr/core0/dataimport?command=status

    4、删除数据

    <delete><query>*:*</query></delete>
    <commit/>

    ————————————————
    版权声明:本文为CSDN博主「十年呵护」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
    原文链接:https://blog.csdn.net/zzhuan_1/article/details/80065417

  • 相关阅读:
    物理好题随想
    学案12:电场强度和静电现象
    vscode插件记录
    windows使用总结
    元素周期律 + 元素周期表
    酸碱理论
    氮族元素——磷
    氮族元素——氮
    碱金属元素
    SDN第一次上机实验
  • 原文地址:https://www.cnblogs.com/wangwenlong8/p/13021943.html
Copyright © 2020-2023  润新知