一、定义
官网的定义:
Solr是基于Lucene构建的流行,快速,开放源代码的企业搜索平台。它具有高度的可靠性,可伸缩性和容错能力,可提供分布式索引,复制和负载平衡查询,自动故障转移和恢复,集中式配置等。 Solr支持许多世界上最大的互联网站点的搜索和导航功能。
简单的理解solr就是一款搜索框架,通常用实现查询功能,比如电商网站的商品检索。
二、环境搭建
本文基于以下开源组件版本搭建,约定下载后组件和解压缩的文件都放置在/opt目录下:
-
solr-8.2.0
-
apache-tomcat-8.5.47
首先下载solr-8.2.0.tgz,可以使用wget命令:
wget http://mirrors.tuna.tsinghua.edu.cn/apache/lucene/solr/8.2.0/solr-8.2.0.tgz
解压缩:
tar -zxvf solr-8.2.0.tgz -C .
解压后,/opt目录下会多一个solr-8.2.0目录
下载apache-tomcat-8.5.47:
wget https://mirrors.tuna.tsinghua.edu.cn/apache/tomcat/tomcat-8/v8.5.47/bin/apache-tomcat-8.5.47.tar.gz
解压缩:
tar -zxvf apache-tomcat-8.5.47.tar.gz
为了将solr部署到tomcat服务器,不使用solr自带的jetty,首先在/opt目录下创建一个目录用于部署solr服务,名称无限制,这里取名solr
了。
mkdir solr
复制一份tomcat到/opt/solr
目录下,重命名为tomcat8
cp -r apache-tomcat-8.5.47 solr/tomcat8
solr本质是一个web服务,我们将它复制到tomcat8下:
cp -r solr-8.2.0/server/solr-webapp/webapp solr/tomcat8/webapps/solr
复制solr-8.2.0/server/lib/ext下的部分jar到solr目录中,为了简便可以完全复制所有的,然后忽略掉disruptor-3.4.2.jar
cp solr-8.2.0/server/lib/ext/* solr/tomcat8/webapps/solr/WEB-INF/lib/
复制solr-8.2.0/server/lib下以metrics开头的jar到solr目录:
cp solr-8.2.0/server/lib/metrics* solr/tomcat8/webapps/solr/WEB-INF/lib/
上面这两项注意是复制到solr服务的lib目录下,不是复制到tomcat8/lib下。
复制solr-8.2.0/server/resources下的log4j*.xml文件到solr
首先在solr创建classes目录:
mkdir solr/tomcat8/webapps/solr/WEB-INF/classes
复制日志配置文件:
cp solr-8.2.0/server/resources/log4j2*.xml solr/tomcat8/webapps/solr/WEB-INF/classes/
将solr-8.2.0/server/solr目录复制到solr/目录下,并重命名为solrhome:
cp -r solr-8.2.0/server/solr solr/solrhome
修改日志路径
vim solr/tomcat8/webapps/solr/WEB-INF/classes/log4j2.xml
指定fileName和filePattern的路径:
<RollingRandomAccessFile
name="MainLogFile"
fileName="/opt/solr/solrhome/log/solr.log"
filePattern="/opt/solr/solrhome/log/solr.log.%i" >
<PatternLayout>
....
关联solr及solrhome
修改solr里的web.xml文件
vim solr/tomcat8/webapps/solr/WEB-INF/web.xml
web.xml中<web-app></web-app>标签内
添加如下配置,指定sorlhome路径
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>/opt/solr/solrhome</env-entry-value>
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
注释掉下方的下列配置:
<!--
<security-constraint>
<web-resource-collection>
<web-resource-name>Disable TRACE</web-resource-name>
<url-pattern>/</url-pattern>
<http-method>TRACE</http-method>
</web-resource-collection>
<auth-constraint/>
</security-constraint>
<security-constraint>
<web-resource-collection>
<web-resource-name>Enable everything but TRACE</web-resource-name>
<url-pattern>/</url-pattern>
<http-method-omission>TRACE</http-method-omission>
</web-resource-collection>
</security-constraint>
-->
最后启动tomcat,访问服务器的solr服务:
sh solr/tomcat8/bin/start.sh
访问地址:
localhost:8080/solr/index.html
三、配置IK分词器
首先从IK分词器下载与solr版本匹配的jar包,并放置在solr服务的lib目录下,
cp ik-analyzer-8.2.0.jar solr/tomcat8/webapps/solr/WEB-INF/lib/
在solr/solrhome/下创建目录test_core,拷贝配置文件到test_core中:
cp -r solr/solrhome/configsets/sample_techproducts_configs/conf/ solr/solrhome/test_core/
修改conf中的solr.xml文件,修改jar路径:
<lib dir="${solr.install.dir:../}/contrib/extraction/lib" regex=".*.jar" />
<lib dir="${solr.install.dir:../}/dist/" regex="solr-cell-d.*.jar" />
<lib dir="${solr.install.dir:../}/contrib/clustering/lib/" regex=".*.jar" />
<lib dir="${solr.install.dir:../}/dist/" regex="solr-clustering-d.*.jar" />
<lib dir="${solr.install.dir:../}/contrib/langid/lib/" regex=".*.jar" />
<lib dir="${solr.install.dir:../}/dist/" regex="solr-langid-d.*.jar" />
<lib dir="${solr.install.dir:../}/dist/" regex="solr-ltr-d.*.jar" />
<lib dir="${solr.install.dir:../}/contrib/velocity/lib" regex=".*.jar" />
<lib dir="${solr.install.dir:../}/dist/" regex="solr-velocity-d.*.jar" />
修改managed-schema文件,添加ik分词器配置:
<!-- ik分词器 -->
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>
重启solr服务,打开管理界面,添加test_core:
打开管理界面,分词示例: