Zookeeper是一个高性能,分布式的,开源分布式应用协调服务。它提供了简单原始的功能,分布式应用可以基于它实现更高级 的服务,比如同步,配置管理,集群管理,名空间。它被设计为易于编程,使用文件系统目录树作为数据模型。服务端跑在java上,提供java和C的客户端 API
协调
多个节点一起完成一个动作。
Zookeeper总体结构
Zookeeper服务自身组成一个集群(2n+1个服务允许n个失效)。Zookeeper服务有两个角色,一个是leader,负责写服务和数据同步,剩下的是follower,提供读服务,leader失效后会在follower中重新选举新的leader。
一、数据模型
1) 分层结构
2) 树形结构中的每个节点叫做Znode
3) 每个Znode都有数据(byte[]类型),也可以有子节点,设置SEQUENTIAL属性,会自动在节点名后面追加一个整型数字,上线为整型的最大值
-持久节点:一旦创建,除非主动调用删除操作,否则一直存储在zk中
-临时节点:与客户端的会话绑定,一旦客户端会话失效,该客户端创建的所有临时节点都会被移除
4) 节点路径使用斜线分隔,没有相对路径
5) 通过数据结构stat来存储数据变化
6) 数据发生变化时,版本号会递增
7) 可以对Znode中的数据进行读写操作
二、Zookeeper特点
1) 顺序一致性:按照客户端发送请求的顺序更新数据。
2) 原子性:更新要么成功,要么失败,不会出现部分更新。
3) 单一性 :无论客户端连接哪个server,都会看到同一个视图。
4) 可靠性:一旦数据更新成功,将一直保持,直到新的更新。
5) 及时性:客户端会在一个确定的时间内得到最新的数据。
三、使用场景介绍
1.数据发布/订阅
数据发布/订阅即所谓的配置中心:发布者将数据发布到zk的一个或者一系列节点上,订阅者进行数据订阅,当数据有变化时,可以及时得到数据的变化通知
2.负载均衡
本质是利用zookeeper的配置管理功能,涉及的步骤:
1) 服务提供者把自己的域名及IP端口的映射注册到zk中
2) 服务费者通过域名从zk中获取到对应的IP及端口,这个IP及端口有多个,但是获取其中一个
3) 当服务提供者宕机时,对应的域名与IP的对应就会减少一个映射
4 )阿里的dubbo服务框架就是基于zk来实现服服路由和负载
3.命名服务
在分布式系统中,命名服务Name Service也是很重要的应用场景,通过zk也可以实现类似于J2EE中的JNDI的效果。分布式环境下,命名服务更多是资源定位,并不是真正的实体资源,其本质也是用到zk的集中配置管理和查找
4.分布式通知/协调
ZooKeeper中特有watcher注册与异步通知机制,能够很好的实现分布式环境下不同系统之间的通知与协调,实现对数据变更的实时处理。使用方法通常是不同系统都对ZK上同一个znode进行注册,监听znode的变化(包括znode本身内容及子节点的),其中一个系统update了znode,那么另一个系统能够收到通知,并作出相应处理
5.分布式锁
Zookeeper能保证数据的强一致性,用户任何时候都可以相信集群中每个节点的数据都是相同的。一个用户创建一个节点作为锁,另一个用户检测该节点,如果存在,代表别的用户已经锁住,如果不存在,则可以创建一个节点,代表拥有一个锁。