1 分布式锁
2 强推: 怎样实现redis分布式锁?
与大多数工具一样,分布式锁的选择需要根据业务场景确定。
比如在注重性能的场景,比如使用分布式锁
直接使用单机版但是能保证主从复制性质的redission分布式锁,是一种比较好的选择。
但是在注重安全的场景下,需要保证数据的强一致性,就肯定不能使用redission(下面提到了),而应该选用基于raft,paxos等强一致性算法的etcd,zookeeper分布式锁。
使用Redisson单机主从复制版的分布式锁的场景:
订单系统:在电商平台的订单系统中,当用户进行抢购操作时,为了避免超卖,可以使用Redisson的分布式锁对库存进行加锁操作。此时,因为抢购操作的并发量极高,性能是非常关键的,而对于一致性的要求相对较低,因为即使出现一定的超卖,也可以通过后续的补偿措施来解决。
缓存更新:在使用缓存时,如果多个请求同时对同一数据进行修改,可能会出现脏数据。可以使用Redisson的分布式锁来对更新操作进行串行化,从而避免脏数据的产生。此时,因为并发更新的概率较低,所以对性能的要求较高,而一致性的要求较低。
在下单系统中,使用Redisson的分布式锁主要是为了防止超卖,也就是说,防止在并发很高的情况下,多个请求同时扣减库存,导致库存变为负数。缓存击穿和缓存穿透是缓存系统中的问题,通常不是下单系统需要解决的问题
是的,你的理解是正确的。在处理下单的场景中,商品库存的扣减是一个并发操作,使用数据库的锁机制可能会因为锁竞争导致并发量降低,对数据库造成较大压力。因此,为了提高系统的并发处理能力,降低对数据库的压力,可以使用Redisson提供的分布式锁来控制并发的扣减库存操作。由于Redis的性能较高,使用Redisson的分布式锁可以有效地提高系统的并发处理能力。
在处理缓存击穿的场景中,确实可以使用分布式锁来保护数据库,确保同一时刻只有一个请求去数据库中查询数据。当缓存失效的时候,所有来的请求并不是都去数据库中查询数据,而是使用一个请求去查询数据,其他的请求等待,这样可以防止在缓存失效的瞬间,大量的请求直接涌向数据库,保护了数据库的正常运行。一般来说,对于大部分系统,稍微多查询一次数据库,并不会对系统造成太大影响。但是具体还要根据系统的实际情况来考虑。
使用ZooKeeper的分布式锁的场景:
分布式系统的选举:在分布式系统中,往往需要通过选举来选出一个领导者来协调各个节点的操作。此时,为了保证一致性,可以使用ZooKeeper的分布式锁进行选举。比如,Kafka的Broker选举就使用了ZooKeeper的分布式锁。
金融系统:在金融系统中,如银行转账,因为涉及到金钱,所以对一致性的要求非常高。此时,可以使用ZooKeeper的分布式锁来对转账操作进行加锁,确保每个转账操作都能正确执行。
在分布式系统中,选举通常用于确定系统中的主节点或者领导者。比如在Kafka中,ZooKeeper的分布式锁机制被用于选举。当一个Kafka broker启动时,它会在ZooKeeper的指定路径下创建一个临时节点,如果这个broker是第一个启动并创建节点的,那么它就会被选为Controller。Controller是负责管理整个Kafka集群中Topic partition和replica的分配和重新分配。如果在过程中Controller宕机,ZooKeeper会因为临时节点消失而触发通知,剩余的Broker会重新进行选举。在这个过程中,ZooKeeper的分布式锁被用于保证在任何时刻只有一个Controller。
使用Etcd的分布式锁的场景:
Kubernetes:Kubernetes是一个开源的容器编排系统,它使用Etcd作为其键值存储后端。Kubernetes中的各种操作,如创建、更新和删除Pod,都会使用Etcd的分布式锁来保证一致性。
分布式配置管理:在分布式系统中,往往需要进行配置管理,如动态更新服务的配置信息。此时,可以使用Etcd的分布式锁来对配置信息进行加锁,确保每次只有一个请求能更新配置信息,避免出现配置信息的不一致。
你说的这种场景是对的,这也是很多分布式系统更新配置的常见方式。但是,在某些场景下,也可能存在多个实例或服务自己更新配置的情况。例如:
在一些自动化的环境中,可能有一些服务实例会根据运行情况动态调整自己的配置,然后将新的配置回写到配置中心,以供其他服务实例参考。
在某些大规模的系统中,可能有多个不同的管理节点,这些节点可能会并发地对配置进行更新。这样的场景可能会发生在,比如有多个管理员在同时进行一些需要改动配置的操作,或者有一些自动化的管理任务在并发执行。
在这些情况下,如果没有合适的并发控制机制,可能会导致配置更新的混乱,进而引发系统错误。这就是为什么在配置管理中需要使用分布式锁的原因。
但是需要注意的是,这种情况并不是每个系统都会遇到,只有在有并发配置更新需求的情况下,才需要考虑使用分布式锁。对于大部分只需要从配置中心读取配置的服务来说,是不需要使用分布式锁的。
如果在使用Redisson分布式锁时发生了主从切换,可能会导致锁标识丢失。这主要是因为Redis的主从复制是异步的,也就是说,主节点上的修改不会立即被复制到从节点。因此,如果在主节点上创建了一个锁,这个锁被某一个线程持有,但这个锁的信息还没来得及复制到从节点,此时如果发生了主从切换,新的主节点上就没有这个锁的信息;随后如果还有线程来申请取锁操作时,也能申请到一把锁,这个时候就存在两把锁。
背景设定:某一件秒杀商品的库存数是20,且在redis缓存中的数量也是20,redis用来预减库存,预下单操作,如果预减成功则会将真正的下单操作放入到消息队列中。那么到达消息队列中的真实下单请求数量是20吗还是20+?
(1)如果redis端没有发生主从故障转移且正常工作,那么到达消息队列的请求数应该是20,
(2)但是如果redis的leader发生了故障转移操作,则有可能到达消息队列的请求数超过20,举个例子,5个扣减库存的请求在leader中执行成功并且返回给业务服务器,业务服务器判定为预扣库存成功并且将下单操作加入到消息队列,随后leader节点在将成功扣减库存的日志同步给从节点时发生了故障,即同步失败 ,redis的哨兵选举了一个从节点替换故障节点,但是从节点的库存还是20,后续新来的20请求都会向新的leader节点请求执行预减库存,而且都成功了,20个新的下单操作又可以到达消息队列,也就是说最终到达消息队列的请求数量是超过25个的。
没有
Martin用一个进程暂停(GC)的例子,指出了Redlock安全性问题:
1.客户端1请求锁定节点A、B、C、D、E
⒉.客户端1的拿到锁后,进入GC(时间比较久)
3.所有Redis节点上的锁都过期了
4.客户端⒉获取到了A、B、C、D、E上的锁
5.客户端1GC结束,认为成功获取锁
6.客户端2也认为获取到了锁,发生「冲突」
推荐观看链接:分布式锁:高可用、强一致数据库 Etcd
Raft算法接收多个客户端修改同一个键值对的请求时,确实不存在并发安全问题。这是因为Raft算法会对写操作进行序列化,所有写操作会被按顺序添加到日志中,并且所有的节点都会按照相同的顺序执行这些写操作。这样,即使多个客户端同时发送修改同一个键值对的请求,它们最终都会被按顺序执行,确保了并发安全性。
1 多个客户端发送put请求到raft集群
2 raft的leader节点接收到多个加锁请求(体现为给一个叫lock的key设置一个与请求绑定的唯一标识符uuid),并且按照到达的先后顺序将他们的put操作放入日志中
3 各个raft状态机执行这几个请求的日志时,对于第一个申请加锁的日志也即最先到达的请求,lock设置成功,即加锁成功,并且会设置这个锁的过期时间,对于后续的多个申请加锁的请求,会查看这个lock是否存在且是否过期,如果存在且没过期则状态机拒绝加锁。
4 各个客户端会开启一个loop定期去检测锁是否到期,在即将到期之间,给它续期。
下面描述使用 Etcd 实现分布式锁的业务流程,假设对某个共享资源设置的锁名为:/lock/mylock
步骤 1: 准备
客户端连接 Etcd,以 /lock/mylock 为前缀创建全局唯一的 key,假设第一个客户端对应的 key=“/lock/mylock/UUID1”,第二个为 key=“/lock/mylock/UUID2”;客户端分别为自己的 key 创建租约 - Lease,租约的长度根据业务耗时确定,假设为 15s;
步骤 2: 创建定时任务作为租约的“心跳”
当一个客户端持有锁期间,其它客户端只能等待,为了避免等待期间租约失效,客户端需创建一个定时任务作为“心跳”进行续约。此外,如果持有锁期间客户端崩溃,心跳停止,key 将因租约到期而被删除,从而锁释放,避免死锁。
步骤 3: 客户端将自己全局唯一的 key 写入 Etcd
进行 put 操作,将步骤 1 中创建的 key 绑定租约写入 Etcd,根据 Etcd 的 Revision 机制,假设两个客户端 put 操作返回的 Revision 分别为 1、2,客户端需记录 Revision 用以接下来判断自己是否获得锁。
步骤 4: 客户端判断是否获得锁
客户端以前缀 /lock/mylock 读取 keyValue 列表(keyValue 中带有 key 对应的 Revision),判断自己 key 的 Revision 是否为当前列表中最小的,如果是则认为获得锁;否则监听列表中前一个 Revision 比自己小的 key 的删除事件,一旦监听到删除事件或者因租约失效而删除的事件,则自己获得锁。
步骤 5: 执行业务
获得锁后,操作共享资源,执行业务代码。
步骤 6: 释放锁
完成业务流程后,删除对应的key释放锁。
Etcd引入Revision机制是为了实现数据的历史版本跟踪和观察。每次对Etcd进行写操作(如put、delete等),Etcd会为对应的键值对递增一个全局唯一的Revision号。这些Revision号形成了一个全局有序的历史版本记录,使得用户可以通过指定特定的Revision号来获取某个时间点之后的所有数据变化。这在构建一些历史查询、实现数据版本对比、以及实现高级特性如监听(watch)等场景时非常有用。
Etcd利用Revision机制来实现高级特性如监听(watch)功能。监听是etcd中的一项强大功能,它允许客户端监视特定键的变化,以实时获得数据更新的通知。
当客户端创建一个监听时,它可以指定要监听的键(或键的前缀),并指定一个起始的Revision号。Etcd将记录下这个监听请求的Revision号,并开始跟踪从指定Revision号之后的所有数据变化。
当有新的写操作(如put、delete等)对被监听的键进行修改时,Etcd会为该写操作递增一个全局唯一的Revision号,并将新的键值对变化通知所有相关的监听器。
具体步骤如下:
客户端A创建一个监听,指定要监听的键为/data/foo
,并指定一个起始的Revision号。
Etcd记录下监听请求的Revision号,称为startRevision
。
当客户端B进行一个PUT操作,修改了键/data/foo
的值。Etcd会为这个写操作递增一个新的Revision号,并通知所有监听了键/data/foo
的客户端。
Etcd比较写操作的Revision号与startRevision
,发现该写操作是在startRevision
之后进行的,因此将数据变化通知客户端A。
客户端A收到通知,可以执行相应的操作,获取最新的键值对。
通过这种机制,Etcd实现了监听功能,让客户端能够在数据发生变化时实时获得通知。监听对于实现分布式系统中的事件触发和协调非常有用,它让客户端能够更好地响应数据的变化,实现实时的数据同步和处理。这是Etcd作为一个分布式键值存储系统的一大特色和优势。
是的,你说得对!“监听”(watch)功能是etcd的一项高级特性,在作为配置中心时非常有用。当配置发生变更时,etcd可以自动将更新的配置推送给所有订阅该配置的节点。
以下是作为配置中心时"监听"功能的应用场景:
设置配置数据:初始时,配置数据被存储在etcd中作为键值对。例如,你可能会有诸如/config/app_name
、/config/database
、/config/logging_level
等键,分别表示应用程序配置的不同方面。
订阅节点:对于想要接收更新的节点(客户端),它们可以订阅指定键或键前缀的变更。例如,一个节点可能订阅了/config
前缀的变更,这表示它希望接收在/config
层级下所做的任何更改的通知。
配置变更:当配置发生变更时,例如将/config/app_name
的值更新为新值,etcd会为此更改分配一个新的Revision号。
监听通知:然后,etcd会通知所有订阅的节点关于此更改的情况,发送一个监听事件。监听事件将包含更新的键(例如/config/app_name
)以及其新的值。
节点更新配置:订阅的节点收到监听通知后,可以根据更新的配置采取相应的行动。例如,节点可以根据/config/app_name
的新值重新加载应用程序设置。
借助etcd的"监听"功能,你可以构建一个强大而实时的配置中心,实现配置变更在整个分布式系统中的自动分发和同步。这使得可以无需手动干预就能在整个系统中保持一致且最新的配置。
发布订阅(Pub/Sub)机制的实现不一定基于特定的协议,但常见的实现方式之一是使用WebSocket协议。
WebSocket是一种提供全双工通信的协议,它允许在客户端和服务器之间建立持久性的连接,而不需要像HTTP协议那样频繁地发起请求。这使得WebSocket非常适合用于实现实时通信和实时数据传输,包括发布订阅机制。
在WebSocket中,客户端可以通过建立连接订阅一个或多个特定的主题(topics)或频道(channels)。当有新的消息发布到这些主题或频道时,服务器将直接向订阅的客户端推送消息,而无需客户端主动请求。
使用WebSocket实现发布订阅机制的优点包括:
实时性:WebSocket提供持久性连接,消息可以即时推送到客户端,实现实时的发布订阅通信。
双向通信:WebSocket支持双向通信,客户端和服务器都可以推送消息,从而实现实时互动。
节省资源:相较于传统的HTTP轮询,WebSocket减少了不必要的请求和响应,节省了网络带宽和服务器资源。
低延迟:由于连接的持久性,消息可以直接推送到客户端,减少了传输和处理的延迟。
尽管WebSocket是一个常见的选择,但实现发布订阅机制的方式还可以有其他的选择,例如使用长轮询(Long Polling)等技术。具体的实现方式取决于系统需求、技术栈以及开发者的选择。
在Java中使用etcd实现分布式锁,你可以借助etcd的Java客户端库来进行操作。一个常用的Java客户端库是etcd4j,它提供了与etcd的交互接口。
以下是一个使用etcd4j实现分布式锁的示例代码:
<dependency>
<groupId>io.etcdgroupId>
<artifactId>jetcd-coreartifactId>
<version>0.12.0version>
dependency>
import io.etcd.jetcd.ByteSequence;
import io.etcd.jetcd.Client;
import io.etcd.jetcd.KV;
import io.etcd.jetcd.Lock;
import io.etcd.jetcd.lock.LockResponse;
import java.util.concurrent.CompletableFuture;
import java.util.concurrent.ExecutionException;
public class EtcdDistributedLock {
public static void main(String[] args) throws ExecutionException, InterruptedException {
String key = "/myLock";
String leaseName = "myLockLease";
Client client = Client.builder().endpoints("http://localhost:2379").build();
KV kvClient = client.getKVClient();
Lock lockClient = client.getLockClient();
ByteSequence lockKey = ByteSequence.from(key.getBytes());
// Acquire the lock
LockResponse lockResponse = lockClient.lock(lockKey).get();
long leaseId = lockResponse.getLockKey().getLease();
try {
System.out.println("Acquired lock. Lease ID: " + leaseId);
// Perform critical section operations here
// Simulate some delay to hold the lock
Thread.sleep(3000);
} finally {
// Release the lock when done
CompletableFuture<io.etcd.jetcd.lock.UnlockResponse> unlockFuture = lockClient.unlock(lockKey);
unlockFuture.whenComplete((response, throwable) -> {
System.out.println("Released lock. Lease ID: " + leaseId);
client.getLeaseClient().revoke(leaseId);
client.close();
});
}
}
}
在这个示例中,我们使用etcd4j库创建了一个分布式锁。首先,我们创建一个etcd客户端,然后获取kvClient和lockClient。然后,我们通过调用lock()
方法来获取锁,并在获取锁后执行一些需要保护的关键操作(即临界区)。最后,在完成临界区操作后,我们通过调用unlock()
方法释放锁,并使用revoke()
方法撤销相应的租约。
请注意,上述代码是一个简单示例,实际应用中,你可能需要处理更多的异常情况和错误处理。此外,在生产环境中,可能需要设置适当的超时和重试机制,以及处理锁的可重入性等情况。