目录
1.分布式锁起源
2.分布式锁分类
2.1 Redisson分布式锁
2.2 Zookeeper
2.3 Database实现分布式锁
3. 分布式锁对比
在分布式出现之前,一般多线程操作,为了防止高并发产生的问题,使用Synchronize和ReentrantLock等加锁方式解决。因为项目服务采用的是单进程的多线程操作。而如今,集群和微服务化兴起的时代,单进程锁已经无法满足我们的业务需求。于是,也就出现了今天我们要讲到的分布式锁的概念。
对于分布式锁的设计,主要需要满足一下几个点:
分布式锁目前大体可以分为三类:Redisson、Zookeeper、Database
说到Redisson,大家应该都不陌生。Redisson是基于Redis内存数据库封装而来的框架。在集成Redis大部分功能的同时,且实现了类似ReentrantLock的锁功能。
原理:Redisson的锁,其实是通过Redis的setnx和del等方法结合lua脚本语言来实现的。其中获取锁和释放锁的流程如下:
加锁代码解读:
使用过程中,我们通过getLock()方法获取到一个RLock对象,其lock()方法中实际执行方法是lockInterruptibly()
@Override
public void lockInterruptibly(long leaseTime, TimeUnit unit) throws InterruptedException {
// 1.尝试获取锁
Long ttl = tryAcquire(leaseTime, unit);
// 2.获得锁成功
if (ttl == null) {
return;
}
// 3.如果没有获得锁,则需等待锁被释放,并通过 Redis 的 channel 订阅锁释放的消息,这里的具体
// 实现本文也不深入,只是简单提一下 Redisson 在执行 Redis 命令时提供了同步和异步的两种实
// 现,但实际上同步的实现都是基于异步的,具体做法是使用 Netty 中的异步工具 Future 和
// FutureListener 结合 JDK 中的 CountDownLatch 一起实现。
long threadId = Thread.currentThread().getId();
Future future = subscribe(threadId);
get(future);
try {
//订阅锁的释放消息成功后,进入一个不断重试获取锁的循环,循环中每次都先试着获取锁,并得到已存
在的锁的剩余存活时间。
while (true) {
// 4.重试获取锁
ttl = tryAcquire(leaseTime, unit);
// 5.成功获得锁
if (ttl == null) {
break;
}
// 6.等待锁释放
//如果锁当前是被占用的,那么等待释放锁的消息,具体实现使用了 JDK 并发的信号量工具
//Semaphore 来阻塞线程,当锁释放并发布释放锁的消息后,信号量的 release() 方法会被
//调用,此时被信号量阻塞的等待队列中的一个线程就可以继续尝试获取锁了。
if (ttl >= 0) {
getEntry(threadId).getLatch().tryAcquire(ttl, TimeUnit.MILLISECONDS);
} else {
getEntry(threadId).getLatch().acquire();
}
}
} finally {
// 7.取消订阅
unsubscribe(future, threadId);
}
}
接着看下另一个核心方法tryAcquire():
private Long tryAcquire(long leaseTime, TimeUnit unit) {
// 1.将异步执行的结果以同步的形式返回
//Redisson 实现的执行 Redis 命令都是异步的,但是它在异步的基础上提供了以同步的方式获得执行结果的封装。
return get(tryAcquireAsync(leaseTime, unit, Thread.currentThread().getId()));
}
private Future tryAcquireAsync(long leaseTime, TimeUnit unit, long threadId) {
if (leaseTime != -1) {
return tryLockInnerAsync(leaseTime, unit, threadId, RedisCommands.EVAL_LONG);
}
// 2.用默认的锁超时时间去获取锁
//分布式锁要确保未来的一段时间内锁一定能够被释放,因此要对锁设置超时释放的时间,在我们没有指
//定该时间的情况下,Redisson 默认指定为30秒。
Future ttlRemainingFuture = tryLockInnerAsync(LOCK_EXPIRATION_INTERVAL_SECONDS,
TimeUnit.SECONDS, threadId, RedisCommands.EVAL_LONG);
ttlRemainingFuture.addListener(new FutureListener() {
@Override
public void operationComplete(Future future) throws Exception {
if (!future.isSuccess()) {
return;
}
Long ttlRemaining = future.getNow();
// 成功获得锁
if (ttlRemaining == null) {
// 3.锁过期时间刷新任务调度
//为了避免业务中对共享资源的操作还未完成,锁就被释放掉了,需要定期(锁失效时间的
//三分之一)刷新锁失效的时间,这里 Redisson 使用了 Netty 的 TimerTask、
//Timeout 工具来实现该任务调度。
scheduleExpirationRenewal();
}
}
});
return ttlRemainingFuture;
}
Future tryLockInnerAsync(long leaseTime, TimeUnit unit, long threadId,
RedisStrictCommand command) {
internalLockLeaseTime = unit.toMillis(leaseTime);
// 3.使用 EVAL 命令执行 Lua 脚本获取锁
return commandExecutor.evalWriteAsync(getName(), LongCodec.INSTANCE, command,
"if (redis.call('exists', KEYS[1]) == 0) then " +
"redis.call('hset', KEYS[1], ARGV[2], 1); " +
"redis.call('pexpire', KEYS[1], ARGV[1]); " +
"return nil; " +
"end; " +
"if (redis.call('hexists', KEYS[1], ARGV[2]) == 1) then " +
"redis.call('hincrby', KEYS[1], ARGV[2], 1); " +
"redis.call('pexpire', KEYS[1], ARGV[1]); " +
"return nil; " +
"end; " +
"return redis.call('pttl', KEYS[1]);",
Collections.
而在加锁关键,又在于lua脚本代码(使用lua代码执行可保证操作的原子性)。加锁时的lua脚本说明如下:
加锁需要以下三个参数:
KEYS[1] :需要加锁的key,这里需要是字符串类型。
ARGV[1] :锁的超时时间,防止死锁
ARGV[2] :锁的唯一标识,id(UUID.randomUUID()) + “:” + threadId
//如果通过
exists
命令发现当前 key 不存在,即锁没被占用,则执行hset
写入 Hash 类型数据 key:全局锁名称(例如共享资源ID), field:锁实例名称(Redisson客户端ID:线程ID), value:1,并执行pexpire
对该 key 设置失效时间,返回空值nil
,至此获取锁成功。"if (redis.call('exists', KEYS[1]) == 0) then " +
"redis.call('hset', KEYS[1], ARGV[2], 1); " +
"redis.call('pexpire', KEYS[1], ARGV[1]); " +
"return nil; " +
"end; " +// 如果通过
hexists
命令发现 Redis 中已经存在当前 key 和 field 的 Hash 数据,说明当前线程之前已经获取到锁,因为这里的锁是可重入的,则执行hincrby
对当前 key field 的值加一,并重新设置失效时间,返回空值,至此重入获取锁成功。
"if (redis.call('hexists', KEYS[1], ARGV[2]) == 1) then " +
"redis.call('hincrby', KEYS[1], ARGV[2], 1); " +
//锁重入重新设置超时时间
"redis.call('pexpire', KEYS[1], ARGV[1]); " +
"return nil; " +
"end; " +
// 最后是锁已被占用的情况,即当前 key 已经存在,但是 Hash 中的 Field 与当前值不同,则执行pttl
获取锁的剩余存活时间并返回,至此获取锁失败。
"return redis.call('pttl', KEYS[1]);",
解锁实现方法解析:
@Override
public void unlock() {
// 1.通过 EVAL 和 Lua 脚本执行 Redis 命令释放锁
Boolean opStatus = commandExecutor.evalWrite(getName(), LongCodec.INSTANCE,
RedisCommands.EVAL_BOOLEAN,
"if (redis.call('exists', KEYS[1]) == 0) then " +
"redis.call('publish', KEYS[2], ARGV[1]); " +
"return 1; " +
"end;" +
"if (redis.call('hexists', KEYS[1], ARGV[3]) == 0) then " +
"return nil;" +
"end; " +
"local counter = redis.call('hincrby', KEYS[1], ARGV[3], -1); " +
"if (counter > 0) then " +
"redis.call('pexpire', KEYS[1], ARGV[2]); " +
"return 0; " +
"else " +
"redis.call('del', KEYS[1]); " +
"redis.call('publish', KEYS[2], ARGV[1]); " +
"return 1; "+
"end; " +
"return nil;",
Arrays.
解锁的lua代码说明:
KEYS[1] :需要加锁的key,这里需要是字符串类型。
KEYS[2] :redis消息的ChannelName,一个分布式锁对应唯一的一个channelName:“redisson_lock__channel__{” + getName() + “}”
ARGV[1] :reids消息体,这里只需要一个字节的标记就可以,主要标记redis的key已经解锁,再结合redis的Subscribe,能唤醒其他订阅解锁消息的客户端线程申请锁。
ARGV[2] :锁的超时时间,防止死锁
ARGV[3] :锁的唯一标识,也就是刚才介绍的 id(UUID.randomUUID()) + “:” + threadId
// key不存在,说明锁已释放,直接执行publish命令发布释放锁消息并返回1。 "if (redis.call('exists', KEYS[1]) == 0) then " + "redis.call('publish', KEYS[2], ARGV[1]); " + "return 1; " + "end;" + //key存在,但是field在Hash中不存在,说明自己不是锁持有者,无权释放锁,返回nil。 "if (redis.call('hexists', KEYS[1], ARGV[3]) == 0) then " + "return nil;" + "end; " + //因为锁可重入,所以释放锁时不能把所有已获取的锁全都释放掉,一次只能释放一把锁,因此执行hincrby对锁的值减一。 "local counter = redis.call('hincrby', KEYS[1], ARGV[3], -1); " + // 如果counter>0说明锁在重入,不能删除key,则刷新锁的失效时间并返回0; "if (counter > 0) then " + "redis.call('pexpire', KEYS[1], ARGV[2]); " + "return 0; " + "else " + //否则刚才释放的已经是最后一把锁,则执行del命令删除锁的key,并发布锁释放消息,返回1。 "redis.call('del', KEYS[1]); " + "redis.call('publish', KEYS[2], ARGV[1]); " + "return 1; "+ "end; " + "return nil;"
Redisson特点:
Redisson具体使用方式请参考官方文档:https://github.com/redisson/redisson/wiki/%E7%9B%AE%E5%BD%95
对于zookeeper,之前很多业务是结合Dubbo作为分布式服务调用框架来设计的。在此过程中,zookeeper作为注册中心的角色负责各个服务接口的注册与调度。但其实zookeeper还有很多其他用途,比如配置管理,集群管理,队列管理以及我们今天要说到的分布式锁。(zookeeper其他用途了解参考:https://blog.csdn.net/lingbo229/article/details/81052078)
zookeeper实现分布式锁的原理:
原理就是多个节点同时在一个指定的节点下面创建临时会话顺序节点,谁创建的节点序号最小,谁就获得了锁,并且其他节点就会监听序号比自己小的节点,一旦序号比自己小的节点被删除了,其他节点就会得到相应的事件,然后查看自己是否为序号最小的节点,如果是,则获取锁。(zk有重试机制,一旦zk集群检测不到客户端的心跳,就会重试,Curator客户端支持多种重试策略。多次重试之后还不行的话才会删除临时节点。)
java有集成zookeeper作为锁的实现类,可以直接使用zookeeper第三方库Curator客户端,这个客户端中封装了一个可重入的锁服务。
public boolean tryLock(long timeout, TimeUnit unit) throws InterruptedException {
try {
return interProcessMutex.acquire(timeout, unit);
} catch (Exception e) {
e.printStackTrace();
}
return true;
}
public boolean unlock() {
try {
interProcessMutex.release();
} catch (Throwable e) {
log.error(e.getMessage(), e);
} finally {
executorService.schedule(new Cleaner(client, path), delayTimeForClean, TimeUnit.MILLISECONDS);
}
return true;
}
Curator提供的InterProcessMutex是分布式锁的实现。acquire方法用户获取锁,release方法用于释放锁。
使用Zookeeper实现分布式锁的优点
使用Zookeeper实现分布式锁的缺点
具体实现可参考:https://my.oschina.net/yangjianzhou/blog/1930493
实现原理:采用数据库表的唯一键的形式。如果同一个时刻,多个线程同时向一个表中插入同样的记录,由于唯一键的原因,只能有一个线程插入成功。待业务逻辑代码执行完后,删除这条记录,来释放锁。
CREATE TABLE `methodLock` (
`id` int(11) NOT NULL AUTO_INCREMENT COMMENT '主键',
`method_name` varchar(64) NOT NULL DEFAULT '' COMMENT '锁定的方法名',
`desc` varchar(1024) NOT NULL DEFAULT '备注信息',
`update_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '保存数据时间,自动生成',
PRIMARY KEY (`id`),
UNIQUE KEY `uidx_method_name` (`method_name `) USING BTREE
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='锁定中的方法';
当我们想要锁住某个方法时,执行以下SQL:
insert into methodLock(method_name,desc) values (‘method_name’,‘desc’)
因为我们对method_name
做了唯一性约束,这里如果有多个请求同时提交到数据库的话,数据库会保证只有一个操作可以成功,那么我们就可以认为操作成功的那个线程获得了该方法的锁,可以执行方法体内容。
当方法执行完毕之后,想要释放锁的话,需要执行以下Sql:
delete from methodLock where method_name ='method_name'
数据库方式实现分布式锁有如下几个问题点:
1、这把锁强依赖数据库的可用性,数据库是一个单点,一旦数据库挂掉,会导致业务系统不可用。
2、这把锁没有失效时间,一旦解锁操作失败,就会导致锁记录一直在数据库中,其他线程无法再获得到锁。
3、这把锁只能是非阻塞的,因为数据的insert操作,一旦插入失败就会直接报错。没有获得锁的线程并不会进入排队队列,要想再次获得锁就要再次触发获得锁操作。
4、这把锁是非重入的,同一个线程在没有释放锁之前无法再次获得该锁。因为数据中数据已经存在了。
参考链接:
https://blog.csdn.net/qq_26620259/article/details/84292965
https://blog.csdn.net/loushuiyifan/article/details/82497455
https://www.jianshu.com/p/de5a69622e49
https://blog.csdn.net/zxp_cpinfo/article/details/53692922