运行复制的ZooKeeper 运行ZooKeeper 在一个独立模式下是方便评估的, 一些开发,和测试。 但是在生产,你应该运行ZooKeeper 在复制模式。一个复制的servers group 在相同应用是被称为 quorum(冲裁),在一个复制模式,所有的servers在冲裁有相同的配置文件的拷贝 对于复制模式, 至少需要3台机器, 并强烈推荐你有一个奇数的服务器。 如果你只有2个servers, 如果你是在这种情况下 如果其中一个故障,没有足够的机器来形成一个多数的冲裁。 2个server 是天生不稳定的 相比一个单一的server, 因为有两个单点故障。 所需要的conf/zoo.cfg 文件对于复制模式是类似于在独立模式下,但是也有一些区别: tickTime=2000 dataDir=/var/lib/zookeeper clientPort=2181 initLimit=5 syncLimit=2 server.1=zoo1:2888:3888 server.2=zoo2:2888:3888 server.3=zoo3:2888:3888 新的条目,initLimit=5 是超时时间 ZooKeeper 使用来限制 ZooKeeper servers 在冲裁去连接leader的限制的时间长度。 Follower在启动过程中,会从Leader同步所有最新数据,然后确定自己能够对外服务的起始状态。Leader允许F在initLimit时间内完成这个 工作。通常情况下,我们不用太在意这个参数的设置。如果ZK集群的数据量确实很大了,F在启动的时候,从Leader上同步数据的时间也会 相应变长,因此在这种情况下,有必要适当调大这个参数了。(No Java system property) 条目syncLimit=2 限制 在运行过程中,Leader负责与ZK集群中所有机器进行通信,例如通过一些心跳检测机制,来检测机器的存活 状态。如果L发出心跳包在syncLimit之后,还没有从F那里收到响应,那么就认为这个F已经不在线了。注意 :不要把这个参数设置得过大,否则可能会掩盖一些问题。(No Java system property) 所有这些超时, 你指定的时间单位是使用tickTime. 在这个例子中,timeout 对于initLimit 是5个 ticks 5 *2000 ,10秒 最后, 注意2个端口号 在每个server name " 2888" and "3888". tickTime=2000 initLimit=5 syncLimit=2 dataDir=xxxx/zookeeper/server1/data dataLogDir=xxx/zookeeper/server1/dataLog clientPort=2181 server.1=127.0.0.1:2888:3888 server.2=127.0.0.1:2889:3889 server.3=127.0.0.1:2890:3890 标红的几个配置应该官网讲得很清楚了,只是需要注意的是clientPort这个端口如果你是在1台机器上部署多个server,那么每台机器都要不 同的clientPort,比如我server1是2181,server2是2182,server3是2183,dataDir和dataLogDir也需要区分下。 对等使用前面的端口连接到其他对等(peers). 比如一个连接是需要,以便peers可以连接。 比如,同意更新的顺序。 更具体说, 一个 ZooKeeper server 使用这个端口来连接followers 到leader. 当一个新的leader 出现,一个follwer 打开一个TCP 连接到leader 使用这个端口。 因为默认的leader 选取也使用TCP,我们当前需要另外的端口用于leader 选取,这个第2个端口在服务器的入口 如果你需要测试不同的server 在一个单独的机器上, 指定servername 作为本地 使用一个唯一的冲裁 leader 选举端口(2888:3888, 2889:3889, 2890:3890 in the example above) 对于每个服务器 当然单位的dataDirs 和不同的clientPorts 也需要