Zookeeper主要可以干哪些事情:配置管理,名字服务,提供分布式同步以及集群管理.
一 、配置管理
在我们的应用中除了代码外,还有一些就是各种配置。比如数据库连接,远程服务访问地址等。一般我们都是使用配置文件的方式,在代码中引入这些配置文件。当我们只有一种配置,只有一台服务器,并且不经常修改的时候,使用配置文件是一个很好的做法,但是如果我们配置非常多,有很多服务器都需要这个配置,而且还可能是动态的话使用配置文件就不是个好主意了,这会导致维护配置信息的一致性相当的困难与烦琐。
这个时候往往需要寻找一种集中管理配置的方法,我们在这个集中的地方修改了配置,所有对这个配置感兴趣的都可以获得变更。比如我们可以把配置放在数据库里,然后所有需要配置的服务都去这个数据库读取配置。然后为了提高该配置服务的可靠性,一般我们可以使用集群的方式。
虽然用集群可以提升可靠性,但如何保证配置在集群中的一致性呢? 这个时候就需要使用一种实现了一致性协议的服务了。Zookeeper就是这种服务,它使用Zab这种一致性协议来提供一致性。现在有很多开源项目使用Zookeeper来维护配置,比如在HBase中,客户端就是连接一个Zookeeper,获得必要的HBase集群的配置信息,然后才可以进一步操作。还有在开源的消息队列Kafka中,也使用Zookeeper来维护broker的信息。在Alibaba开源的SOA框架Dubbo中也广泛的使用Zookeeper管理一些配置来实现服务治理。
二、名字服务
DNS就是一个提供名字服务的东西,域名就是IP地址的名字,因为计算机是不能识别域名的,但IP地址对于人来说又太难记忆,所以人们设计出了DNS这个统一域名解释的地方。Zookeeper也能提供这种名字到地址的映射服务,方便人们记忆与查找.
三、分布式同步
Zookeeper是通过分布式锁来完成同步的。通过锁可以让某个时刻只让一个服务去干活(Leader Election(leader选举)),当这台服务出问题的时候锁释放,立即fail over到另外的服务。因为分布式环境中,为了提高可靠性,我们的集群的每台服务器上都部署着同样的服务。但是,一件事情如果集群中的每个服务器都进行的话,那相互之间就要协调,编程起来将非常复杂。所以单个时刻还是只让单个服务去工作,再通过锁机制实现负载均衡。
四、集群管理
分布式的集群中,经常会由于各种原因,比如硬件故障,软件故障,网络问题,有些节点会进进出出。有新的节点加入进来,也有老的节点退出集群。这个时候,集群中其他机器需要感知到这种变化,然后根据这种变化做出对应的决策。例如分布式存储与分布式SOA架构都需要这种能力,自动发现新的或无效的节点。