Raft是一种易于理解的分布式系统一致性算法(弱一致性,最终一致性)。它在容错性和性能上相当于Paxos。不同之处在于,它被分解成相对独立的子问题,并且清晰地处理了实际系统所需的所有主要部分。
系统角色
leader follower candidate(leader失败以后 follower的一种竞选中间状态 成功后变为leader状态)
主要子问题
Leader Election:
timeout竞选机制 同票情况(随机timeout)最先达到timeout的服务器给自己投票 并且让其他服务器给自己投票 然后term+1 用于分区融合和宕机重启的服务器能同步最新数据
Log Replication:
通过leader向follower同步log (只能由leader发出)当大多数服务器已经向leader确认log写入成功后 代表写入成功 leader会进一步通知集群进行commit操作 真正写入成功
Safety:
log sync + commit + majority 多数成功则成功 此时宕机的服务器也可以在之后通过term同步最新数据
S1为leader 橙色球为心跳包可携带日志数据 每次心跳达到会更新timeout 此时S4宕机数据落后于系统整体
https://raft.github.io/slides/raftuserstudy2013.pdf
动态演示: