1.控制台条件查询
2.标准查询操作符
3.solr的分页
4.solr控制台高亮字段配置
5.转移字符
solr控制台高亮字段配置
1、solr默认集成了高亮插件
2、配置高亮3个条件
a.开启高亮
b.显示高亮的字段
c.高亮使用的标签。如
控制台查询条件
常用查询参数
q – 查询字符串,必须的
测试列子: blog_name:*Java* AND blog_intro:*csdn*
blog_name:*Java* OR blog_intro:*csdn*
date_time:[20081001 TO 20091031]
不包含条件为"-",比如不包含名称中有红色的:-blog_name:*java*
*号可以用在范围查询的开始或结束
field:[* TO 100] field值小于等于100
field:[100 TO *] field值大于等于100
field:[* TO *] 匹配包含field字段的所有文档
start – 返回第一条记录在完整找到结果中的偏移位置,0开始,一般分页用。
rows – 指定返回结果最多有多少条记录,配合start来实现分页。
sort – 排序,格式:sort=<field name>+<desc|asc>[,<field name>+<desc|asc>]… 。示例:(date desc, price asc)表示先 “date ” 降序, 再 “price” 升序,默认是相关性降序。
wt – (writer type)指定输出格式,可以有 csv,json,xml, python, php, ruby..
fq – (filter query)过虑查询,作用:在q查询符合结果中同时是fq查询符合的。提供一个可选的筛选器查询。查询结果被限制为仅搜索筛选器查询返回的结果。筛选过的查询由 Solr 进行缓存。它们对提高复杂查询的速度非常有用。
相关性(score)为优先排序条件的,那么条件一定放在q参数中。
如果用于q。那么,就会查所有name中包含"张三"的,然后order by score,这时就会按name的相似度来排序。
而如果用fq,q设置为*:*。那么solr会先order by score,而因为条件是*:*,所以所有文档的相关性都是一样的,所以即使用fq 过滤了,返回的最前面的却不是相关性最高的。
fl- field作为逗号分隔的列表指定文档结果中应返回的 Field 集。默认为 “*”,指所有的字段。“score” 指还应返回记分。例如 *,score
将返回所有字段及得分。用solrj的bean时,得在query中指定 query.set("fl", "*,score");
q.op – 覆盖schema.xml的defaultOperator(有空格时用"AND"还是用"OR"操作逻辑),一般默认指定
df – 默认的查询字段,一般默认指定
qt – (query type)指定那个类型来处理查询请求,一般不用指定,默认是standard。
indent – 返回的结果是否缩进,默认关闭,用 indent=true|on 开启,一般调试json,php,phps,ruby输出才有必要用这个参数。
version – 查询语法的版本,建议不使用它,由服务器指定默认值。
hight:
hl-highlight,h1=true,表示采用高亮。可以用h1.fl=field1,field2 来设定高亮显示的字段。
hl.fl: 用空格或逗号隔开的字段列表。要启用某个字段的highlight功能,就得保证该字段在schema中是stored。如果该参数未被给出,那么就会高 亮默认字段 standard handler会用df参数,dismax字段用qf参数。你可以使用星号去方便的高亮所有字段。如果你使用了通配符,那么要考虑启用 hl.requiredFieldMatch选项。
hl.requireFieldMatch:
如果置为true,除非该字段的查询结果不为空才会被高亮。它的默认值是false,意味 着它可能匹配某个字段却高亮一个不同的字段。如果hl.fl使用了通配符,那么就要启用该参数。尽管如此,如果你的查询是all字段(可能是使用 copy-field 指令),那么还是把它设为false,这样搜索结果能表明哪个字段的查询文本未被找到
hl.usePhraseHighlighter:
如果一个查询中含有短语(引号框起来的)那么会保证一定要完全匹配短语的才会被高亮。
hl.highlightMultiTerm
如果使用通配符和模糊搜索,那么会确保与通配符匹配的term会高亮。默认为false,同时hl.usePhraseHighlighter要为true。
hl.snippets:
这是highlighted片段的最大数。默认值为1,也几乎不会修改。如果某个特定的字段的该值被置为0(如f.allText.hl.snippets=0),这就表明该字段被禁用高亮了。你可能在hl.fl=*时会这么用。
hl.fragsize:
每个snippet返回的最大字符数。默认是100.如果为0,那么该字段不会被fragmented且整个字段的值会被返回。大字段时不会这么做。
hl.mergeContiguous:
如果被置为true,当snippet重叠时会merge起来。
hl.maxAnalyzedChars:
会搜索高亮的最大字符,默认值为51200,如果你想禁用,设为-1
hl.alternateField:
如果没有生成snippet(没有terms 匹配),那么使用另一个字段值作为返回。
hl.maxAlternateFieldLength:
如果hl.alternateField启用,则有时需要制定alternateField的最大字符长度,默认0是即没有限制。所以合理的值是应该为
hl.snippets * hl.fragsize这样返回结果的大小就能保持一致。
hl.formatter:一个提供可替换的formatting算法的扩展点。默认值是simple,这是目前仅有的选项。显然这不够用,你可以看看org.apache.solr.highlight.HtmlFormatter.java 和 solrconfig.xml中highlighting元素是如何配置的。
注意在不论原文中被高亮了什么值的情况下,如预先已存在的em tags,也不会被转义,所以在有时会导致假的高亮。
hl.fragmenter:
这个是solr制 定fragment算法的扩展点。gap是默认值。regex是另一种选项,这种选项指明highlight的边界由一个正则表达式确定。这是一种非典型 的高级选项。为了知道默认设置和fragmenters (and formatters)是如何配置的,可以看看solrconfig.xml中的highlight段。
regex 的fragmenter有如下选项:
hl.regex.pattern:正则表达式的pattern
hl.regex.slop:这是hl.fragsize能变化以适应正则表达式的因子。默认值是0.6,意思是如果hl.fragsize=100那么fragment的大小会从40-160.
这些值都可以在select中加入,也可以用solrj的api去设定,也可以配置在solrconfig.xml中配置。
示例如下:
<requestHandler name="search" class="solr.SearchHandler" default="true">
<!– default values for query parameters can be specified, these
will be overridden by parameters in the request
–>
<lst name="defaults">
<str name="echoParams">explicit</str>
<int name="rows">10</int>
<bool name="hl">true</bool>
<str name="hl.fl">title,content</str>
<str name="f.content.hl.fragsize">200</str>
<str name="mlt.qf">
id^10.0 title^10.0 content^1.0
</str>
</lst>
</requestHandler>
标准查询操作符
转移字符
+ - && || ! ( ) { } [ ] ^ " ~ * ? : /
这些字符在solr中具有特殊的含义,如果要使用这么字符本身含义,需要利用反斜杠进行转义,比如: (1+1):2
其他操作命令
SOLR在浏览器中输入命令:
1、全导入:
http://localhost:8085/solr/law/dataimport?command=full-import&commit=true
2、增量导入:
http://localhost:8085/solr/core0/dataimport?command=delta-import&clean=false&commit=true
3、查看导入状态
http://localhost:8085/solr/core0/dataimport?command=status
4、删除数据
<delete><query>*:*</query></delete>
<commit/>
————————————————
版权声明:本文为CSDN博主「十年呵护」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/zzhuan_1/article/details/80065417