Solr的自动完成实现方式（第三部分：Suggester方式续）

Solr的自动完成实现方式（第三部分：Suggester方式续）
　　在之前的两个部分(part1、part2)中,我们学会了如何配置和查询solr来获取自动完成的功能。今天，我们来看一下如果为suggester添加字段，以这种方式来提供自动完成的功能。

组件配置
在上一期的配置组件中添加如下的参数：
```
<str name="sourceLocation">dict.txt</str>  
```
这样我们的配置就变成了：
```
<searchComponent name="suggest" class="solr.SpellCheckComponent">   
<lst name="spellchecker">   
<str name="name">suggest</str>   
<str name="classname">org.apache.solr.spelling.suggest.Suggester</str>    
<str name="lookupImpl">org.apache.solr.spelling.suggest.tst.TSTLookup</str>   
<str name="field">name_autocomplete</str>   
<str name="sourceLocation">dict.txt</str>   
</lst>   
</searchComponent>  
```
使用这个参数，我们让suggest组件使用名叫dict.txt的文件作为solr的配置字典。

handler配置
handler的配置也需要添加额外的一个参数：
```
<str name="spellcheck.onlyMorePopular">true</str>  
```
完整的配置为：
```
<requestHandler name="/suggest" class="org.apache.solr.handler.component.SearchComponent">   
<lst name="defaults">   
<str name="spellcheck">true</str>   
<str name="spellcheck.dictionary">suggest</str>    
<str name="spellcheck.count">10</str>   
<str name="spellcheck.onlyMorePopular">true</str>   
</lst>   
<arr name="components">   
<str>suggest</str>   
</arr>   
</requestHandler>  
```
这个参数告诉solr，当查询的结果数多于设定的count数时，返回点击数更多的那些。

Dictionary
我们告诉solr来使用这个字段，那么这个字段长的什么样呢？下面来看一个例子：
```
# sample dict 
Hard disk hitachi 
Hard disk wd    2.0 
Hard disk jjdd    3.0 
```
这个字典的结果是什么样的呢？每个词组放在单独的一行中，每行以改词组的权重为结束(权重与词组之间以TAB字符分隔)，这个权重就是跟spellcheck.onlyMorePopular=true 香港的参数，默认值为1.0。该字段必须以UTF-8的编码格式存储。每行前有#字符的将被忽略(注释行)。

数据
以这种方式，我们不需要数据，字段就是数据。

运行
在重新构建suggester之后，我们来看一下它的运行情况，输入命令：
```
/suggest?q=Har
```
得到的结果为：
```
<?xml version="1.0" encoding="UTF-8"?>   
<response>   
<lst name="responseHeader">    
<int name="status">0</int>    
<int name="QTime">0</int>   
</lst>   
<lst name="spellcheck">   
<lst name="suggestions">   
<lst name="Dys">      
<int name="numFound">3</int>     
<int name="startOffset">0</int>      
<int name="endOffset">3</int>       
<arr name="suggestion">       
<str>Hard disk jjdd</str>     
<str>Hard disk wd</str>   
<str>Hard disk hitachi</str>     
</arr>    
</lst>   
</lst>   
</lst>   
</response>  
```
结束语
跟预期一样，suggest的结果是按权重排序的。这里的大小写敏感(注意首字母).

你有什么建议呢？如果我们有一个很好的字典，这个字典的权重是基于用户的查询行为产生的，那么用户肯定会喜欢它！如果没有好的字典，还是不要用这种方式的好。

下一步
下一期，我们看一下不同方式的suggest产生的索引结构和大小。

原文URL：http://java.dzone.com/news/solr-and-autocomplete-part-3?mz=33057-solr_lucene
博客地址：【爱开卷360】http://www.cnblogs.com/ibook360
相关阅读:
[ZJOI2006]书架
 luogu P3369 【模板】普通平衡树（splay）
MegaCli是一款管理维护硬件RAID软件，可以通过它来了解当前raid卡的所有信息，包括 raid卡的型号，raid的阵列类型，raid 上各磁盘状态
 ipmi配置方法-20200328
debian配置---->/etc/apt/sources.list apt基本源设置指南
 Alien 魔法：RPM 和 DEB 互转
 Debian 9 中设置网络
 SSH自动断开连接的原因-20200323
mpstat命令
 dstat命令
原文地址：https://www.cnblogs.com/ibook360/p/2269126.html