女朋友也能看懂的Zookeeper分布式锁原理

女朋友也能看懂的Zookeeper分布式锁原理
前言

关于分布式锁，在互联网行业的使用场景还是比较多的，比如电商的库存扣减，秒杀活动，集群定时任务执行等需要进程互斥的场景。而实现分布式锁的手段也很多，大家比较常见的就是redis跟zookeeper，今天我们主要介绍的是基于zookeeper实现的分布式锁。

这篇文章主要借用Curator框架对zk分布式锁的实现思路，大家理解了以后完全可以自己手动实现一遍，但是在工作中还是建议使用成熟的开源框架，很多坑别人已经帮我们踩好了，除非万不得已，需要高度定制符合自己项目的需求的时候，才开始自行封装吧。

正文

zookeeper简单介绍

既然是基于zookeeper的分布式锁，首先肯定要对这个zookeeper有一定了解，这里就不过多的进行讲解，只对其跟分布式锁有关联的特性做一个简单的介绍，更多详细的功能特性大家可以参阅官方文档。

zookeeper维护着类似文件系统的数据结构，它总共有四种类型的节点
- PERSISTENT：持久化的节点。一旦创建后，即使客户端与zk断开了连接，该节点依然存在。
- PERSISTENT_SEQUENTIAL：持久化顺序编号节点。比PERSISTENT节点多了节点自动按照顺序编号。
- EPHEMERAL：临时节点。当客户端与zk断开连接之后，该节点就被删除。
- EPHEMERAL_SEQUENTIAL：临时顺序编号节点。比EPHEMERAL节点多了节点自动按照顺序编号。（分布式锁实现使用该节点类型）
Curator实现分布式锁原理

好，当我们简单了解了zk的节点类型以后，现在正式的分析Curator分布式锁的实现原理。这里我们定义了一个“/curator_lock”锁节点用来存放相关客户端创建的临时顺序节点。

假设两个客户端ClientA跟ClientB同时去争夺一个锁，此时ClientA先行一步到达zk，那么它将会在我们的zk上创建一个“/curator_lock/xxxxx-0000000000”的临时顺序节点。

接着它会获取到“/curator_lock/”锁节点下的所有子节点，因为这些节点是有序的，这时候会判断它所创建的节点是否排在第一位（也就是序号最小），由于ClientA是第一个创建节点的的客户端，必然是排在第一位，所以它也就拿到了锁。我们用zkCli查看节点信息如下。
```
[zk: localhost:2182(CONNECTED) 4] ls /curator_lock
[_c_f3f38067-8bff-47ef-9628-e638cfaad77e-lock-0000000000]
```
　　

这个时候ClientB也来了，按照同样的步骤，先是在“/curator_lock/”下创建一个临时顺序节点“/curator_lock/xxxxx-0000000001”，这个节点的序号是递增的，接着也是获得该节点下的所有子节点，并比对自己当前生成的节点序号是否在这些子节点中是最小的，由于此时序号最小的节点是ClientA创建的，并且还没释放掉，所以ClientB自己就拿不到锁。
```
[zk: localhost:2182(CONNECTED) 4] ls /curator_lock
[_c_2a8198e4-2039-4a3c-8606-39c65790d637-lock-0000000001,
_c_f3f38067-8bff-47ef-9628-e638cfaad77e-lock-0000000000]
```
　　

既然ClientB拿不到锁，也不会放弃，它会对自己的前一个节点加上监听器（zk提供的api实现），只要监听到前一个节点被删除了，也就是释放了锁，就会马上重新执行获取锁的操作。

当后面的ClientC，ClientD...过来的时候也是如此，变化的只是节点上的编号，它会根据Client连接的数量而不断增加。

可能大家还会担心，万一我的获取到锁的客户端宕机了怎么办，会不会不释放锁？其实上面已经解答了这个问题，由于Curator使用的是临时顺序节点来实现的分布式锁，只要客户端与zk连接断开，该节点也就消失了，相当于释放了锁。

下面代码展示了Curator的基本使用方法，仅作为参考实例，请勿在生产环境使用的这么随意。
```
CuratorFramework client = CuratorFrameworkFactory.newClient("127.0.0.1:2182",
                5000,10000,
                new ExponentialBackoffRetry(1000, 3));
        client.start();
        InterProcessMutex interProcessMutex = new InterProcessMutex(client, "/curator_lock");
        //加锁
        interProcessMutex.acquire();
        
        //业务逻辑
        
        //释放锁
        interProcessMutex.release();
        client.close();
```
总结

我们在搞懂了原理之后，就可以抛弃Curator,自己动手实现一个分布式锁了，相信有一定经验的工程师实现基本的功能都是没问题的，但是要做到生产级别，可能还是要在细节上下功夫，比如说一些异常处理，性能优化等因素要考虑。

该文章首发于微信公众号《深夜里的程序猿》，转载请注明出处，侵权必究。
相关阅读:
图解MySQL | [原理解析] MySQL使用固定的server_id导致数据丢失【转】
故障分析 | 记一次 MySQL 主从双写导致的数据丢失问题【转】
MySQL8.0之XtraBackup【转】
使用pt-table-checksum校验MySQL主从复制【转】
MySQL基于 GTID 的多源复制【转】
pyenv虚拟环境管理python多版本和软件库【转】
MySQL SQL编写笔记
 linux安装oracle客户端【转】
spring-cloud-gateway获取post请求body参数以及响应数据
 spring-webflux中Flux<DataBuffer> 转String
原文地址：https://www.cnblogs.com/coding-night/p/10681246.html

女朋友也能看懂的Zookeeper分布式锁原理

前言

正文

zookeeper简单介绍

Curator实现分布式锁原理

总结