ZAB (Zookeeper Atomic Broadcast ) zookeeper原子消息广播协议
保证:分布式数据一致性
所有事务请求必须由一个全局唯一的服务器来协调处理,这样的服务器被称为Leader服务器,而余下的其它服务器则称为Follower服务器。Leader 服务器负责将一个客户端请求转换成一个事务Proposal(提议),并将该Proposal分发给集群中所有的Follower服务器。之后Leader 服务器需要等待所有 Follower 服务器的反馈,一旦超过半数的 Follower 服务器进行了正确的反馈后, 那么 Leader 就会再次向所有的 Follower 服务器分发 Commit 消息,要求其将前一个 Proposal 进行提交。
一、消息广播
类似于2PC,针对客户端的事务请求,Leader 服务器会为其生成对应的事务 Proposal ,该Proposal 对应一个全局单调递增的唯一ID (事务ID,ZXID,用于确保顺序性), 并将其发送给集群中其余的所有机器,然后再分别收集各自的选票,最后进行事务的提交。
保证事务顺序性的具体做法:Leader 服务器会为每一个 Follower 服务器都分配一个单独的队列,然后将需要广播的事务 Proposal 依次放入队列中,再根据FIFO策略进行消息的发送。
Follower 服务器接收到消息后,将消息写入事务日志中,在成功写入后给 Leader 服务器发送 Ack 回应。
当Ack 回应过半后, Leader 服务器再发送 Commit 消息给所有的 Follower 。
Follower 服务器接收到Commit 请求后,完成事务的提交。
二、崩溃恢复
Leader 崩溃后,将从 Follower 中选取 ZXID 最大的作为新的 Leader 。(原因为:ZXID最大,说明事务最新,最齐全。称为 Leader 后,不需要进行额外的同步操作。)
数据同步:
在新的Leader选举完成后,需要将所有的Follower服务器同步至Leader的状态,才开始接收处理请求。
ZXID:
1、总共 64 位
2、低 32 位,仅简单的递增。(新的请求累加1)
3、高 32 位,根据最大的ZXID进行计算+1。(每次更换新的Leader 才会变动,且将低32位置0。)
当旧的Leader 恢复后,加入到新的集群时,对比高32位的值,谁高谁做主。因此将旧的Leader作为新的Leader的Follower,同步至新的Leader的状态,然后加入集群接收请求处理。
三、ZAB 与 Paxos 对比
ZAB 的发现阶段,确定那个Follower 为Leader时,会根据最大的ZXID确保新的Leader是当前最新最全的事务服务器。而Paxos没有这一步,它先随机选取一个Follower作为Leader,然后再收集所有的Follower事务获取最新的状态,完成自身的同步,再完成Follower的同步。