SolrCloud集群部署

SolrCloud集群部署
SolrCloud是基于Solr和Zookeeper的分布式搜索方案，是正在开发中的Solr4.0的核心组件之一，它的主要思想是使用Zookeeper作为集群的配置信息中心。它有几个特色功能：
1. 集中式的配置信息
2. 自动容错
3. 近实时搜索
4. 查询时自动负载均衡
　　基本可以用上面这幅图来概述，这是一个拥有4个Solr节点的集群，索引分布在两个Shard里面，每个Shard包含两个Solr节点，一个是Leader节点，一个是Replica节点，此外集群中有一个负责维护集群状态信息的Overseer节点，它是一个总控制器。集群的所有状态信息都放在Zookeeper集群中统一维护。从图中还可以看到，任何一个节点都可以接收索引更新的请求，然后再将这个请求转发到文档所应该属于的那个Shard的Leader节点，Leader节点更新结束完成，最后将版本号和文档转发给同属于一个Shard的replicas节点。

下载相关程序

1、下载Solr-4.x http://lucene.apache.org/solr/downloads.html
2、下载Tomcat http://tomcat.apache.org/download-70.cgi
3、下载Zookeeper http://zookeeper.apache.org/releases.html

安装Zookeeper

单机zookeeper
```
#解压
$ tar -zxvf zookeeper-3.4.5.tar.gz
#更改配置
$ cp zookeeper-3.4.5/conf/zoo_sample.cfg zookeeper-3.4.5/conf/zoo.cfg
#启动服务
$ bin/zkServer.sh start
#验证
$ bin/zkCli.sh -server host:port
```
zookeeper主要配置:
```
# Zookeeper 服务器之间或客户端与服务器之间维持心跳的时间间隔，也就是每个 tickTime 时间就会发送一个心跳
tickTime=2000
# 这个配置项是用来配置 Zookeeper 接受客户端（这里所说的客户端不是用户连接 Zookeeper 服务器的客户端，而是 Zookeeper 服务器集群中连接到 Leader 的 Follower 服务器）初始化连接时最长能忍受多少个心跳时间间隔数。当已经超过 5个心跳的时间（也就是 tickTime）长度后 Zookeeper 服务器还没有收到客户端的返回信息，那么表明这个客户端连接失败。总的时间长度就是 5*2000=10 秒
initLimit=10
# 这个配置项标识 Leader 与 Follower 之间发送消息，请求和应答时间长度，最长不能超过多少个 tickTime 的时间长度，总的时间长度就是 2*2000=4 秒
syncLimit=5
# Zookeeper 保存数据的目录，默认情况下，Zookeeper 将写数据的日志文件也保存在这个目录里。
dataDir=/tmp/zookeeper
# 这个端口就是客户端连接 Zookeeper 服务器的端口，Zookeeper 会监听这个端口，接受客户端的访问请求。
clientPort=2181
```
zookeeper集群
1、在zookeeper-3.4.5/conf/zoo.cfg追加server配置
```
server.1=192.168.10.14:2888:3888
server.2=192.168.10.12:2888:3888
server.3=192.168.10.16:2888:3888
```
2、在每个Zookeeper保存数据的目录下指定myid文件，对应服务名称ID
```
#如server.id，则在myid文件中写1即可
$ vi /tmp/zookeeper/myid
```
3、启动zookeeper服务 bin/zkServer.sh start

SolrCloud使用Zookeeper管理集群的基本流程

第一台Solr服务器启动过程:
1. 启动第一台zookeeper服务器，作为集群状态信息的管理者
2. 将自己这个节点注册到/node_states/目录下,同时将自己注册到/live_nodes/目录下
3. 创建/overseer_elect/leader，为后续Overseer节点的选举做准备，新建一个Overseer
4. 更新/clusterstate.json目录下json格式的集群状态信息
5. 本机从Zookeeper中更新集群状态信息，维持与Zookeeper上的集群信息一致
6. 上传本地配置文件到Zookeeper中，供集群中其他solr节点使用,后面启动solr则不会上传配置文件，因为都是使用第一台solr服务启动上传的配置文件为准.
7. 启动本地的Solr服务器,Overseer会得知shard中有第一个节点进来，更新shard状态信息，并将本机所在节点设置为shard1的leader节点，并向整个集群发布最新的集群状态信息。
8. 本机从Zookeeper中再次更新集群状态信息，第一台solr服务器启动完毕。
第二台solr服务器的启动过程:
1. 连接到集群所在的Zookeeper
2. 将自己这个节点注册到/node_states/目录下,同时将自己注册到/live_nodes/目录下
3. 本机从Zookeeper中更新集群状态信息，维持与Zookeeper上的集群信息一致
4. 从集群中保存的配置文件加载Solr所需要的配置信息
5. 启动本地solr服务器,将本节点注册为集群中的shard，并将本机设置为shard2的Leader节点
6. 本机从Zookeeper中再次更新集群状态信息，第二台solr服务器启动完毕.
SolrCloud安装配置

包含2个shard的集群，每个shard中有replica节点
1. 安装Tomcat
2. 安装zookeeper集群,启动，我这里就使用上面的zookeeper集群
3. 拷贝solr项目中的solr配置文件到指定路径
```
$ copy -r solr $TOMCAT_HOME1/conf
$ copy -r solr $TOMCAT_HOME2/conf
$ copy -r solr $TOMCAT_HOME3/conf
$ copy -r solr $TOMCAT_HOME4/conf
```
4. 更改第一台tomcat的启动脚本catalina.sh，添加solr_home及配置信息到JAVA_OPTS,添加到开头就行,在catalina.sh指定solr_home,也可以在solr.war包中的web.xml中配置
5. 更改第二台及其他tomcat的启动脚本catalina.sh
6. 配置完所有的solr服务，则从第一台开始启动$TOMCAT_HOME1/bin/catalina.sh run
备注

1、solr.xml配置文件解释
```
<cores adminPath="/admin/cores" defaultCoreName="deals" host="${host:}" hostPort="${jetty.port:}" hostContext="${hostContext:}" leaderVoteWait="${leaderVoteWait:1000}">
    <core name="deals" instanceDir="deals" />
</cores>
```
hostContext:指定服务名称
hostPort:指定端口
leaderVoteWait:选举leader的等待时间ms

原文链接：http://demi-panda.com/2013/03/30/solr-cloud-install/
相关阅读:
hihocoder #1333 : 平衡树·Splay2
【bzoj1251】序列终结者 splay
BZOJ 1588: [HNOI2002]营业额统计双向链表 / splay / treap
湖南省第十二届大学生计算机程序设计竞赛 F 地铁多源多汇最短路
 湖南省第十二届大学生计算机程序设计竞赛 B 有向无环图拓扑DP
湖南省第十二届大学生计算机程序设计竞赛 G Parenthesis
HDU 4251 The Famous ICPC Team Again 主席树
 Codeforces Round #369 (Div. 2) D. Directed Roads dfs求某个联通块的在环上的点的数量
 python main
python显示灰度图
原文地址：https://www.cnblogs.com/kuyuyingzi/p/4266324.html

SolrCloud集群部署

下载相关程序

安装Zookeeper

SolrCloud使用Zookeeper管理集群的基本流程

SolrCloud安装配置

备注