solr中配有分词器,但分词器里面有大写转换为小写的过滤器时,数字就会被过滤。比如123中国ABC。123就会被过滤掉了,所以才查1|12|123都会失败。
《Solr 数字字符不能搜索的一个问题》这篇博文说得还算详细,我就是学这篇文章的。
根据账号来搜索,当账号在数据库中是整型变量时,导入到solr中,配置单个数字的过滤字段时,是搜索不出任何信息的,这不知什么原因,有时间要好好研究一下schema.xml这个配置文件先。
在schema.xml这个配置文件中加入字段类型:
<fieldType name="text_inclunum" class="solr.TextField" positionIncrementGap="100"> <analyzer type="index"> <tokenizer class="solr.WhitespaceTokenizerFactory"/> <filter class="solr.EdgeNGramFilterFactory" minGramSize="1" maxGramSize="50" side="front"/> </analyzer> <analyzer type="query"> <tokenizer class="solr.WhitespaceTokenizerFactory"/> <filter class="solr.EdgeNGramFilterFactory" minGramSize="1" maxGramSize="50" side="front"/> </analyzer> </fieldType>
"solr.EdgeNGramFilterFactory" minGramSize="1" maxGramSize="50")这个就是从左到右一个一个分词的。
让我们的字段使用这个字段类型:
在分析里面做一下分析,看能不能切割:
没问题!接着在搜索里面搜索:
也没问题,最符合条件的排在前面,其次的排在后面。
剩下的事情就简单了,按照前面的教程,改一下配置参数,输入两个字符就触发:
最后呈现的结果为:
前面的是最符合的: