今天我们来探讨一下分布式锁的4种实现:
1、通过MySQL实现分布式锁
2、通过redis实现分布式锁
3、通过zookeeper实现分布式锁
4、通过etcd实现分布式锁
如何确保共享资源在同一时刻只能被一个线程访问?
大家可能觉得这个很简单吧,在一个jvm中,通过synchronized或者ReentrantLock是很容易实现的。
确实,单个jvm中确实没有问题。
但是,通常我们的系统会采用集群的方式部署,此时集群中的每个节点都是一个jvm环境,那么通过synchronized或者ReentrantLock是无法解决共享资源访问的问题了。
此时就要用到分布式锁了:分布式锁就是解决分布式环境中共享资源顺序访问的问题,同一时刻,集群中所有节点中,只允许有一个线程可以访问共享资源。
下面我们来看一下分布式锁的4种实现。
锁的获取过程
假如:一个集群环境中有n个系统,每个系统中有一个jvm,每个jvm中有m个线程去获取分布式锁,那么同时可能就有n*m个线程去获取分布式锁,此时分布式锁的压力是比较大的,每个jvm中多个线程同时去获取锁其实是没有意义的,可以在每个jvm中先加一把本地的锁,获取分布式锁之前需要先获取jvm本地的锁,本地锁获取成功之后,才可以尝试获取分布式锁,此时n个系统中最多有n个线程尝试获取分布式锁,获取锁的步骤主要2步:
- 1、先尝试获取jvm本地锁
- 2、jvm本地锁获取成功之后尝试获取分布式锁
超时时间
获取锁的时候可以传递获取锁最大等待时间,在指定的时间内多次尝试获取锁,获取失败之后,休眠一会,再继续尝试获取,直到时间耗尽。
锁有效期
获取锁的时候需要指定有效期,有效期就是获取锁之后,使用者希望使用多长时间,为什么需要有效期?
如果没有有效期,当使用者获取成功之后,系统突然down机了,那么这个锁就无法释放,其他线程就再也无法获取到这个锁了。
所以需要有有效期,超过了有效期,锁将失效,其他线程将可以尝试获取锁。
锁续命
什么是锁续命?
比如:使用者获取锁的时候,指定有效期是5分钟,但是5分钟之后,使用者事情还未干完,还想继续使用一会,那么可以使用续命功能,延迟锁的有效期。
可以启动一个子线程,自动完成续命的操作,比如:原本有效期是5分钟,当使用4分钟的时候,续命2分钟,那么有效期是7分钟,这个比较简单,大家可以随意发挥。
- create table t_lock(
- lock_key varchar(32) PRIMARY KEY NOT NULL COMMENT '锁唯一标志',
- request_id varchar(64) NOT NULL DEFAULT '' COMMENT '用来标识请求对象的',
- lock_count INT NOT NULL DEFAULT 0 COMMENT '当前上锁次数',
- timeout BIGINT NOT NULL DEFAULT 0 COMMENT '锁超时时间',
- version INT NOT NULL DEFAULT 0 COMMENT '版本号,每次更新+1'
- )COMMENT '锁信息表';
注意:表中有个版本号字段,版本号主要用于乐观锁的方式更新数据,确保并发情况下更新数据的正确性。
代码比较简单,大家主要看获取锁的lock方法和释放锁的unlock方法,注释比较详细,大家看看就懂了。
代码中的重点是更新数据的时候,通过比对版本号,采用cas的方式,确保并发情况下更新数据的正确性。
本代码实现了获取锁和释放锁的操作,续命操作未实现,大家可以尝试实现一下。
- package lock;
-
- import lombok.Builder;
- import lombok.Getter;
- import lombok.Setter;
- import lombok.extern.slf4j.Slf4j;
-
- import java.sql.*;
- import java.util.Map;
- import java.util.Objects;
- import java.util.UUID;
- import java.util.concurrent.ConcurrentHashMap;
- import java.util.concurrent.TimeUnit;
- import java.util.concurrent.locks.ReentrantLock;
-
- @Slf4j
- public class DbLockUtil {
-
- //将requestid保存在该变量中
- static ThreadLocal<String> requestIdTL = new ThreadLocal<>();
- //jvm锁:当多个线程并发获取分布式锁时,需要先获取jvm锁,jvm锁获取成功,则尝试获取分布式锁
- static Map<String, ReentrantLock> jvmLockMap = new ConcurrentHashMap<>();
-
- /**
- * 获取当前线程requestid
- *
- * @return
- */
- public static String getRequestId() {
- String requestId = requestIdTL.get();
- if (requestId == null || "".equals(requestId)) {
- requestId = UUID.randomUUID().toString();
- requestIdTL.set(requestId);
- }
- log.info("requestId:{}", requestId);
- return requestId;
- }
-
- /**
- * 获取锁
- *
- * @param lockKey 锁key
- * @param lockTimeOut(毫秒) 持有锁的有效时间,防止死锁
- * @param getTimeOut(毫秒) 获取锁的超时时间,这个时间内获取不到将重试
- * @return
- */
- public static boolean lock(String lockKey, long lockTimeOut, int getTimeOut) throws Exception {
- log.info("start");
- boolean lockResult = false;
-
- /**
- * 单个jvm中可能有多个线程并发获取一个锁
- * 此时我们只允许一个线程去获取分布式锁
- * 所以如果同一个jvm中有多个线程尝试获取分布式锁,需要先获取jvm中的锁
- */
- ReentrantLock jvmLock = new ReentrantLock();
- ReentrantLock oldJvmLock = jvmLockMap.putIfAbsent(lockKey, jvmLock);
- oldJvmLock = oldJvmLock != null ? oldJvmLock : jvmLock;
- boolean jvmLockSuccess = oldJvmLock.tryLock(getTimeOut, TimeUnit.MILLISECONDS);
- //jvm锁获取失败,则直接失败
- if (!jvmLockSuccess) {
- return lockResult;
- } else {
- //jvm锁获取成功,则继续尝试获取分布式锁
- try {
- String request_id = getRequestId();
- long startTime = System.currentTimeMillis();
- //循环尝试获取锁
- while (true) {
- //通过lockKey获取db中的记录
- LockModel lockModel = DbLockUtil.get(lockKey);
- if (Objects.isNull(lockModel)) {
- //记录不存在,则先插入一条
- DbLockUtil.insert(LockModel.builder().lock_key(lockKey).request_id("").lock_count(0).timeout(0L).version(0).build());
- } else {
- //获取请求id,稍后请求id会放入ThreadLocal中
- String requestId = lockModel.getRequest_id();
- //如果requestId为空字符,表示锁未被占用
- if ("".equals(requestId)) {
- lockModel.setRequest_id(request_id);
- lockModel.setLock_count(1);
- lockModel.setTimeout(System.currentTimeMillis() + lockTimeOut);
- //并发情况下,采用cas方式更新记录
- if (DbLockUtil.update(lockModel) == 1) {
- lockResult = true;
- break;
- }
- } else if (request_id.equals(requestId)) {
- //如果requestId和表中request_id一样表示锁被当前线程持有者,此时需要加重入锁
- lockModel.setTimeout(System.currentTimeMillis() + lockTimeOut);
- lockModel.setLock_count(lockModel.getLock_count() + 1);
- if (DbLockUtil.update(lockModel) == 1) {
- lockResult = true;
- break;
- }
- } else {
- //锁不是自己的,并且已经超时了,则重置锁,继续重试
- if (lockModel.getTimeout() < System.currentTimeMillis()) {
- DbLockUtil.resetLock(lockModel);
- } else {
- //如果未超时,休眠100毫秒,继续重试
- if (startTime + getTimeOut > System.currentTimeMillis()) {
- TimeUnit.MILLISECONDS.sleep(100);
- } else {
- break;
- }
- }
- }
- }
- }
- } finally {
- //释放jvm锁,将其从map中异常
- jvmLock.unlock();
- jvmLockMap.remove(lockKey);
- }
- }
- log.info("end");
- return lockResult;
- }
-
- /**
- * 释放锁
- *
- * @param lock_key
- * @throws Exception
- */
- private static void unlock(String lock_key) throws Exception {
- //获取当前线程requestId
- String requestId = getRequestId();
- LockModel lockModel = DbLockUtil.get(lock_key);
- //当前线程requestId和库中request_id一致 && lock_count>0,表示可以释放锁
- if (Objects.nonNull(lockModel) && requestId.equals(lockModel.getRequest_id()) && lockModel.getLock_count() > 0) {
- if (lockModel.getLock_count() == 1) {
- //重置锁
- resetLock(lockModel);
- } else {
- lockModel.setLock_count(lockModel.getLock_count() - 1);
- DbLockUtil.update(lockModel);
- }
- }
- }
-
- /**
- * 重置锁
- *
- * @param lockModel
- * @return
- * @throws Exception
- */
- private static int resetLock(LockModel lockModel) throws Exception {
- lockModel.setRequest_id("");
- lockModel.setLock_count(0);
- lockModel.setTimeout(0L);
- return DbLockUtil.update(lockModel);
- }
-
- /**
- * 更新lockModel信息,内部采用乐观锁来更新
- *
- * @param lockModel
- * @return
- * @throws Exception
- */
- private static int update(LockModel lockModel) throws Exception {
- return exec(conn -> {
- String sql = "UPDATE t_lock SET request_id = ?,lock_count = ?,timeout = ?,version = version + 1 WHERE lock_key = ? AND version = ?";
- PreparedStatement ps = conn.prepareStatement(sql);
- int colIndex = 1;
- ps.setString(colIndex++, lockModel.getRequest_id());
- ps.setInt(colIndex++, lockModel.getLock_count());
- ps.setLong(colIndex++, lockModel.getTimeout());
- ps.setString(colIndex++, lockModel.getLock_key());
- ps.setInt(colIndex++, lockModel.getVersion());
- return ps.executeUpdate();
- });
- }
-
- private static LockModel get(String lock_key) throws Exception {
- return exec(conn -> {
- String sql = "select * from t_lock t WHERE t.lock_key=?";
- PreparedStatement ps = conn.prepareStatement(sql);
- int colIndex = 1;
- ps.setString(colIndex++, lock_key);
- ResultSet rs = ps.executeQuery();
- if (rs.next()) {
- return LockModel.builder().
- lock_key(lock_key).
- request_id(rs.getString("request_id")).
- lock_count(rs.getInt("lock_count")).
- timeout(rs.getLong("timeout")).
- version(rs.getInt("version")).build();
- }
- return null;
- });
- }
-
- private static int insert(LockModel lockModel) throws Exception {
- return exec(conn -> {
- String sql = "insert into t_lock (lock_key, request_id, lock_count, timeout, version) VALUES (?,?,?,?,?)";
- PreparedStatement ps = conn.prepareStatement(sql);
- int colIndex = 1;
- ps.setString(colIndex++, lockModel.getLock_key());
- ps.setString(colIndex++, lockModel.getRequest_id());
- ps.setInt(colIndex++, lockModel.getLock_count());
- ps.setLong(colIndex++, lockModel.getTimeout());
- ps.setInt(colIndex++, lockModel.getVersion());
- return ps.executeUpdate();
- });
- }
-
- private static <T> T exec(SqlExec<T> sqlExec) throws Exception {
- Connection conn = getConn();
- try {
- return sqlExec.exec(conn);
- } finally {
- closeConn(conn);
- }
- }
-
- @FunctionalInterface
- public interface SqlExec<T> {
- T exec(Connection conn) throws Exception;
- }
-
- @Getter
- @Setter
- @Builder
- public static class LockModel {
- private String lock_key;
- private String request_id;
- private Integer lock_count;
- private Long timeout;
- private Integer version;
- }
-
- private static final String url = "jdbc:mysql://localhost:3306/dlock?useSSL=false"; //数据库地址
- private static final String username = ""; //数据库用户名
- private static final String password = ""; //数据库密码
- private static final String driver = "com.mysql.jdbc.Driver"; //mysql驱动
-
- /**
- * 连接数据库
- *
- * @return
- */
- private static Connection getConn() {
- Connection conn = null;
- try {
- Class.forName(driver); //加载数据库驱动
- try {
- conn = DriverManager.getConnection(url, username, password); //连接数据库
- } catch (SQLException e) {
- e.printStackTrace();
- }
- } catch (ClassNotFoundException e) {
- e.printStackTrace();
- }
- return conn;
- }
-
- /**
- * 关闭数据库链接
- *
- * @return
- */
- private static void closeConn(Connection conn) {
- if (conn != null) {
- try {
- conn.close(); //关闭数据库链接
- } catch (SQLException e) {
- e.printStackTrace();
- }
- }
- }
- }
过程分析,先看图左边过程:
1、A尝试去获取锁lockkey,通过setnx(lockkey,currenttime+timeout)命令,对lockkey进行setnx,将value值设置为当前时间+锁超时时间;
2、如果返回值为1,说明redis服务器中还没有lockkey,也就是没有其他用户拥有这个锁,A就能获取锁成功;
3、在进行相关业务执行之前,先执行expire(lockkey),对lockkey设置有效期,防止死锁;因为如果不设置有效期的话,lockkey将一直存在于redis中,其他用户尝试获取锁时,执行到setnx(lockkey,currenttime+timeout)时,将不能成功获取到该锁;
4、执行相关业务
5、释放锁,A完成相关业务之后,要释放拥有的锁,也就是删除redis中该锁的内容,del(lockkey),接下来的用户才能进行重新设置锁新值
再看右边过程
6、当A通过setnx(lockkey,currenttime+timeout)命令不能成功设置lockkey时,这是不能直接断定获取锁失败;因为我们在设置锁时,设置了锁的超时时间timeout,当当前时间大于redis中存储键值为lockkey的value值时,可以认为上一任的拥有者对锁的使用权已经失效了,A就可以强行拥有该锁;具体判定过程如下;
7、A通过get(lockkey),获取redis中的存储键值为lockkey的value值,即获取锁的相对时间lockvalueA
8、lockvalueA!=null && currenttime>lockvalue,A通过当前的时间与所设置的时间做比较,如果当前时间已经大于锁设置的时间临界,即可以进一步判断是否可以获取锁,否则说明该锁还在被占用,A就还不能获取该锁,结束,获取锁失败;
9、步骤4返回结果为true后,通过getSet设置新的超时时间,并返回旧值lockvalueB,以作判断,因为在分布式环境,在进入这里时可能另外的进程获取到锁并对值进行了修改,只有旧值与返回的值一致才能说明中间未被其他进程获取到这个锁
10、lockvalueB == null || lockvalueA==lockvalueB,判断:如果lockvalueB为null,说明该锁已经被释放了,此时该进程可以获取锁;旧值与返回的lockvalueB一致说明中间未被其他进程获取该锁,可以获取锁;否则不能获取锁,结束,获取锁失败。
留给给大家,按照上面的过程实现下。
zookeeper是什么?是一个开源的中间件,可以做高可用配置中心使用,简单点理解:可以用来保存用户的一些数据。
zookeeper有3个特点比较重要,这2个特点是实现分布式锁的关键。
第1个特点:节点天然有序
zookeeper中存储数据是树结构,树下面可以创建很多节点,节点中可以存储用户的数据。
在每一个节点下面创建子节点时,只要选择的创建类型是有序类型,那么,此节点将自动在客户端指定的节点名后面添加一个单调递增序号,重点是,并发创建子节点的情况下,也可以确保多个子节点的有序性。
比如并发在/lock/lock1下面创建4个有序的节点,如下:
客户端可以判断创建的节点序号是不是最小的,如果编号是子节点中最小的,则获取锁成功。
第2个特点:临时节点
客户端操作zookeeper,需要和zookeeper之间建立连接,如果客户端请求在zookeeper上创建的节点类型是临时节点,那么当客户端和zookeeper之间连接断开的时候,创建的临时节点自动会被zookeeper删除。
这个可以防止死锁多功能,比如客户端获取锁之后挂了,那么节点会自动被删除,此时锁的其他获取者才有机会获取锁。
第3个特点:监听器
客户端可以对某个节点添加监听器,当节点信息发生变化的时候,zookeeper会通知客户端,比如节点数据被修改、节点被删除等等,都会通知客户端;
这个特性特别牛逼:这个特别爽,后面的节点只需要监听他前面的一个节点,当前面的一个节点被删除时,zookeeper会通知监听者,监听者可以判断自己创建的节点编号是不是最小的,如果是最小的,即获取锁成功,这个是不是比上面数据库和redis的方式好一些,db和redis的方式需要自旋(获取失败了,休眠稍许,继续循环尝试),而zookeeper不需要自旋,锁被释放的时候,zookeeper会通知等待者。
重点理解原理,代码大家可以在网上找找,比较多,这里就不贴出来了。
etcd 和 zookeeper功能差不多,也可以作为高可用配置中心,不过etcd基于Go语言实现,也可以用来实现分布式锁,实现原理上和zookeeper差不多,这里就不细说了。
本文主要介绍了4种方式实现分布式锁,大家重点要理解每种方式的原理。
db和redis的方式原理差不多,内部在获取失败的情况下,都需要采用自旋的方式重新尝试获取锁,而zookeeper采用监听的方式。
redis和zookeeper这2种方式用的比较多,性能上面redis更好一些,并发量比较大的可以采用redis的方式。
设计中还有一点:获取锁的时候分2步走,先获取jvm中的锁,然后再尝试获取分布式锁。