提到锁,想必大家可能最先想到的是Java JUC中的synchronized关键字或者可重入锁ReentrantLock。它能够保证我们的代码在同一个时刻只有一个线程执行,保证数据的一致性和完整性。但是它仅限于单体项目,也就是说它们只能保证单个JVM应用内线程的顺序执行。
如果你部署了多个节点,也就是分布式场景下如何保证不同节点在同一时刻只有一个线程执行呢?场景的业务场景比如秒杀、抢优惠券等,这就引入了我们的分布式锁,本文我们主要讲解利用Zookeeper的特性如何来实现我们的分布式锁。
利用Zookeeper的临时顺序节点和监听机制两大特性,可以帮助我们实现分布式锁。

/locks, 路径服务于某个使用场景,如果有多个使用场景建议路径不同。/locks创建临时有序节点,所有会看到在/locks下面有seq-000000000, seq-00000001 等等节点。/locks路径下面最小的节点,如果是,获取锁,不是,阻塞线程,同时设置监听器,监听前一个节点。大家有没有想过为什么要设置对前一个节点的监听?
主要为了避免羊群效应。所谓羊群效应就是一个节点挂掉,所有节点都去监听,然后做出反应,这样会给服务器带来巨大压力,所以有了临时顺序节点,当一个节点挂掉,只有它后面的那一个节点才做出反应。
通过原生zookeeper api方式的实现,可以加强我们对zk实现分布式锁原理的理解。
- public class DistributedLock {
-
- private String connectString = "10.100.1.176:2281";
-
- private int sessionTimeout = 2000;
-
- private ZooKeeper zk;
-
- private String rootNode = "lock";
-
- private String subNode = "seq-";
-
- private String waitPath;
-
- // 当前client创建的子节点
- private String currentNode;
-
- private CountDownLatch countDownLatch = new CountDownLatch(1);
-
- private CountDownLatch waitDownLatch = new CountDownLatch(1);
-
- public DistributedLock() throws IOException, InterruptedException, KeeperException {
- zk = new ZooKeeper(connectString, sessionTimeout, new Watcher() {
- @Override
- public void process(WatchedEvent event) {
- // 如果连接建立时,唤醒 wait 在该 latch 上的线程
- if(event.getState() == Event.KeeperState.SyncConnected) {
- countDownLatch.countDown();
- }
-
- // 发生了 waitPath 的删除事件
- if(event.getType() == Event.EventType.NodeDeleted && event.getPath().equals(waitPath)) {
- waitDownLatch.countDown();
- }
- }
- });
-
- // 等待连接建立,因为连接建立时异步过程
- countDownLatch.await();
- // 获取根节点
- Stat stat = zk.exists("/" + rootNode, false);
- // 如果根节点不存在,则创建根节点
- if(stat == null) {
- System.out.println("创建根节点");
- zk.create("/" + rootNode, new byte[0], ZooDefs.Ids.OPEN_ACL_UNSAFE, CreateMode.PERSISTENT);
- }
- }
-
- public void zkLock() {
- try {
- // 在根节点创建临时顺序节点
- currentNode = zk.create("/" + rootNode + "/" + subNode, null, ZooDefs.Ids.OPEN_ACL_UNSAFE, CreateMode.EPHEMERAL_SEQUENTIAL);
-
- // 获取子节点
- List
childrenNodes = zk.getChildren("/" + rootNode, false); - // 如果只有一个子节点,说明是当前节点,直接获得锁
- if(childrenNodes.size() == 1) {
- return;
- } else {
- //对根节点下的所有临时顺序节点进行从小到大排序
- Collections.sort(childrenNodes);
- //当前节点名称
- String thisNode = currentNode.substring(("/" + rootNode + "/").length());
- //获取当前节点的位置
- int index = childrenNodes.indexOf(thisNode);
- if (index == -1) {
- System.out.println("数据异常");
- } else if (index == 0) {
- // index == 0, 说明 thisNode 在列表中最小, 当前client 获得锁
- return;
- } else {
- // 获得排名比 currentNode 前 1 位的节点
- this.waitPath = "/" + rootNode + "/" + childrenNodes.get(index - 1);
- // 在 waitPath节点上注册监听器, 当 waitPath 被删除时,zookeeper 会回调监听器的 process 方法
- zk.getData(waitPath, true, new Stat());
- //进入等待锁状态
- waitDownLatch.await();
- }
- }
- } catch (KeeperException e) {
- e.printStackTrace();
- } catch (InterruptedException e) {
- e.printStackTrace();
- }
- }
-
- public void zkUnlock() {
- try {
- zk.delete(this.currentNode, -1);
- } catch (InterruptedException e) {
- e.printStackTrace();
- } catch (KeeperException e) {
- e.printStackTrace();
- }
- }
- }
- 复制代码
测试代码如下:
- public class DistributedLockTest {
-
- public static void main(String[] args) throws IOException, InterruptedException, KeeperException {
- DistributedLock lock1 = new DistributedLock();
- DistributedLock lock2 = new DistributedLock();
-
- new Thread(() -> {
- // 获取锁对象
- try {
- lock1.zkLock();
- System.out.println("线程 1 获取锁");
- Thread.sleep(5 * 1000);
- System.out.println("线程 1 释放锁");
- } catch (Exception e) {
- e.printStackTrace();
- } finally {
- lock1.zkUnlock();
- }
- }).start();
-
- new Thread(() -> {
- // 获取锁对象
- try {
- lock2.zkLock();
- System.out.println("线程 2 获取锁");
- Thread.sleep(5 * 1000);
-
- System.out.println("线程 2 释放锁");
- } catch (Exception e) {
- e.printStackTrace();
- } finally {
- lock2.zkUnlock();
- }
- }).start();
- }
- }
- 复制代码
测试结果:
- 线程 2 获取锁
- 线程 2 释放锁
- 线程 1 获取锁
- 线程 1 释放锁
- 复制代码
获取锁和释放锁成对出现,说明分布式锁生效了。
在实际的开发钟,我们会直接使用成熟的框架Curator客户端,它里面封装了分布式锁的实现,避免我们去重复造轮子。
- <dependency>
- <groupId>org.apache.curatorgroupId>
- <artifactId>curator-recipesartifactId>
- <version>5.2.1version>
- dependency>
- 复制代码
InterProcessLock实现分布式锁- public class CuratorLockTest {
-
- private String connectString = "10.100.1.14:2181";
-
- private String rootNode = "/locks";
-
- public static void main(String[] args) {
-
- new CuratorLockTest().testLock();
-
- }
-
- public void testLock() {
- // 分布式锁1
- InterProcessLock lock1 = new InterProcessMutex(getCuratorFramework(), rootNode);
- // 分布式锁2
- InterProcessLock lock2 = new InterProcessMutex(getCuratorFramework(), rootNode);
- // 第一个线程
- new Thread(() -> {
- // 获取锁对象
- try {
- lock1.acquire();
- System.out.println("线程 1 获取锁");
- // 测试锁重入
- lock1.acquire();
- System.out.println("线程 1 再次获取锁");
- Thread.sleep(5 * 1000);
- lock1.release();
- System.out.println("线程 1 释放锁");
- lock1.release();
- System.out.println("线程 1 再次释放锁");
- } catch (Exception e) {
- e.printStackTrace();
- }
- }).start();
-
- // 第二个线程
- new Thread(() -> {
- // 获取锁对象
- try {
- lock2.acquire();
- System.out.println("线程 2 获取锁");
- // 测试锁重入
- lock2.acquire();
- System.out.println("线程 2 再次获取锁");
- Thread.sleep(5 * 1000);
- lock2.release();
- System.out.println("线程 2 释放锁");
- lock2.release();
- System.out.println("线程 2 再次释放锁");
- } catch (Exception e) {
- e.printStackTrace();
- }
- }).start();
- }
-
- public CuratorFramework getCuratorFramework() {
- CuratorFramework client = CuratorFrameworkFactory.builder()
- .connectString(connectString).connectionTimeoutMs(2000)
- .sessionTimeoutMs(2000)
- .retryPolicy(new ExponentialBackoffRetry(3000, 3)).build();
- // 连接
- client.start();
- System.out.println("zookeeper 初始化完成...");
- return client;
- }
- }
- 复制代码
- 线程 1 释放锁
- 线程 1 再次释放锁
- 线程 2 获取锁
- 线程 2 再次获取锁
- 线程 2 释放锁
- 线程 2 再次释放锁
- 复制代码
有兴趣的看下源码,它是通过wait、notify来实现阻塞。
ZooKeeper分布式锁(如InterProcessMutex),能有效的解决分布式锁问题,但是性能并不高。
因为每次在创建锁和释放锁的过程中,都要动态创建、销毁瞬时节点来实现锁功能。大家知道,ZK中创建和删除节点只能通过Leader服务器来执行,然后Leader服务器还需要将数据同不到所有的Follower机器上,这样频繁的网络通信,性能的短板是非常突出的。
在高性能,高并发的场景下,不建议使用ZooKeeper的分布式锁,可以使用Redis的分布式锁。而由于ZooKeeper的高可用特性,所以在并发量不是太高的场景,推荐使用ZooKeeper的分布式锁。
