Solr安装(单机版)

Solr安装(单机版)
　　本文记录的是solr在win下安装配置使用的过程，最后将solr部署到Linux上通过远程访问。下一篇文章会介绍 solr集群搭建(SolrCloud) 的安装！

　　Solr是基于Lucene的全文检索服务器，性能进行了优化。运行在jetty、tomcat这些web容器中。而Lucene只是一个jar包，不能对外提供服务。在安装之前我们要先搞清楚下面两个问题。

一：Solr是如何实现全文检索的

　　索引流程

　　Solr客户端(浏览器、java程序)可以向solr服务器发送post请求，请求内容是包含Field等信息的一个xml文档, 通过该文档可以对索引进行维护。

　　搜索流程

　　Solr客户端(浏览器、java程序)可以向solr服务器发送get请求，solr服务器返回一个xml文档。

二：Solrhome和SoleCore

　　SolreHome是solr服务运行的主目录，一个solrhome目录里面包含多个SoleCore。一个SolrCore包含一个Solr实例运行时所需的配置文件和数据文件。Solrcore可以单独对外搜索和索引提供服务，彼此间没有半毛钱的关系。Home和core的关系好比，数据库连接和数据库的关系,自己体会。

　　对solr有个大致的认识后我们就要开始安装了~~

　　准备工具： 1. solr 2. IK Analyzer中文分词器 3. 一个干净的tomcat

　　安装步骤： 1. 安装solr 2.配置中文分词

安装步骤：

　　1.1 解压安装文件

　　1.2 复制solr.war到tomcat的webapps下；然后解压为solr文件夹，并删除该solr.war文件。

　　1.3 把solr的lib文件夹中的5个扩展包复制到tomcat的lib文件夹里面

　　1.4 在tomcat文件夹下面创建mysolrhome文件夹，并且将solr-4.10-3中的solrhome文件全部复制过来。　　

　　1.5 指定solrhome的路径。

　　1.6 启动tomcat 输入 localhost:8080/solr 能看到solr首页就说明已经配置成功了。如果启动tomcat闪退,是因为tomcat找不到jdk路径，需要修改下startup.bat文件(自行百度)

　　solr启动成功后，我们如图搜一句话，会发现它默认的分词规则是一个汉字就是一个词，比如秘密是个词语就不应该分开，下面我们来配置一些扩展信息吧！

　　2.1 复制IKAnalyzer2012FF_u1.jar到solr的lib文件夹；复制3个配置文件到solr的classes文件夹

　　2.2 自定义分词规则
```
    
    <fieldType name="text_ik" class="solr.TextField">
         <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
    </fieldType>
   
    <field name="item_goodsid" type="long" indexed="true" stored="true"/>
    <field name="item_title" type="text_ik" indexed="true" stored="true"/>
    <field name="item_price" type="double" indexed="true" stored="true"/>
    <field name="item_image" type="string" indexed="false" stored="true" />
    <field name="item_category" type="string" indexed="true" stored="true" />
    <field name="item_seller" type="text_ik" indexed="true" stored="true" />
    <field name="item_brand" type="string" indexed="true" stored="true" />
    

    <field name="item_keywords" type="text_ik" indexed="true" stored="false" multiValued="true"/>
    <copyField source="item_title" dest="item_keywords"/>
    <copyField source="item_category" dest="item_keywords"/>
    <copyField source="item_seller" dest="item_keywords"/> 
    <copyField source="item_brand" dest="item_keywords"/>
    

    <dynamicField name="item_spec_*" type="string" indexed="true" stored="true" />    
```
　　此时重启tomcat 选择我们刚才自定义的分词规则，发现中文分词就配置成功了！

将solr部署到linux中:

　　1. 创建文件夹 mkdir /usr/local/wulei/solr

　　2. 把刚配置好的solr压缩为zip文件，上传到该文件夹。

　　3. 解压 unzip tomcat7.zip

　　4. 编辑配置文件 vim tomcat7/webapps/solr/WEB-INF/web.xml

　　　修改solrhome地址 /usr/local/wulei/solr/tomcat7/mysolrhome

　　5. 修改成功略过这一步（楼主这里没有权限，所以在wulei/目录下设置下权限 chmod -R 777 solr 然后重新编辑。）

　　6. cd tomcat7/bin/ ./startup.sh 浏览器输入 ip:8080/solr 测试。

　　7. 【测试】若启动成功而浏览器不能访问，可能要关闭防火墙。 service firewalld stop

===============================================

扩展知识：在IKAnalyzer.cfg.xml中配置扩展词和停止词 （不配也行，没任何影响，了解下就就够了）
相关阅读:
在 Eclipse Workbench 之外使用 Eclipse GUI
GB2312,GBK,Unicode
木偶一之推荐系统
 Matlab：任意矩阵计算分布密度（海明距离的分布密度）
live555在arm linux下的交叉编译，并下载的Arm板播放H264文件
 java设计模式之原型模式
 HDU 1102
poj3661另一种做法（滚动数组）
基于QT的小游戏细菌病毒战
 某代码查看器的保护突破
原文地址：https://www.cnblogs.com/wlwl/p/9651049.html