【分布式锁第二篇 基于DB的分布式锁】

一、基于数据库表记录的增删实现
要实现分布式锁,最简单的方式可能就是直接创建一张锁表,然后通过操作该表中的数据来实现了。当我们要锁住某个方法或资源的时候,我们就在该表中增加一条记录,想要释放锁的时候就删除这条记录。

首先,创建这样一张数据库表:

CREATE TABLE 'methodLock' (
  'id' int(11) NOT NULL AUTO_INCREMENT COMMENT '主键',
  'method_name' varchar(64) NOT NULL DEFAULT '' COMMENT '锁定的方法名',
  'desc' varchar(1024) NOT NULL DEFAULT '备注信息',
  'update_time' timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '保存数据时间,自动生成',
  PRIMARY KEY ('id'),
  UNIQUE KEY 'uidx_method_name' ('method_name ') USING BTREE
)
 ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='锁定中的方法';

当我们要锁住某个方法时,执行以下SQL:

insert into methodLock(method_name,desc) values ('method_name','desc')

因为我们对method_name做了唯一性约束,这里如果有多个请求同时提交到数据库的话,数据库会保证只有一个操作可以成功,那么我们可以认为操作成功的那个线程获得了该方法的锁,可以执行具体内容。

当方法执行完毕之后,想要释放锁的话,需要执行以下sql:

 delete from methodLock where method_name ='method_name'

上面这种简单的实现有以下几个问题:

  1. 这把锁依赖数据库的可用性,数据库是一个单点,一旦数据库挂掉,会导致业务系统不可用。
  2. 这把锁没有失效时间,一旦解决操作失败,就会导致记录一直在数据库中,其他线程无法在获得锁。
  3. 这把锁只能是非阻塞的,因为数据的insert操作,一旦插入失败就会直接报错。没有获得锁的线程并不会进入排队队列,要想再次获得锁就要再次触发获得锁的操作。
  4. 这把锁是非重入的,同一个线程在没有释放锁之前无法再次获得该锁。因为数据库表中数据已经存在了。

当然,我们也可以有其它方式解决上面的问题:

  1. 数据库是单点?那就搞两个数据库,数据库之前双向同步,一旦挂掉快速切换到备库上。
  2. 没有失效时间?可以做一个定时任务,每隔一定时间把数据库中的超时数据清理一遍。
  3. 非阻塞?可以写一个while循环,直到insert成功再返回成功。
  4. 非重入?可以在数据库表中加一个字段,记录当前获得锁的机器的主机信息和线程信息,那么下次再获取锁的时候先查询数据库,如果当前机器的主机信息和线程信息在数据库中可以查到的话,就直接把锁分配给它即可。

二、基于数据库表做悲观锁(排它锁)

除了可以通过增删操作数据库表中的记录以外,还可以借助数据库中自带的锁来实现分布式锁。

我们还用上面创建的数据库表,可以通过数据库的排它锁来实现分布式锁。基于MySQL的InnoDB引擎,可以使用以下方法来实现加锁操作:

 public boolean lock(){
         Connection.setAutoCommit(false);
         while (true) {
               try {
                     result = select * from MethodLock where methodName = 'xxxx' for update;
                     if (result == null) {
                           return false;
                     }
               } catch (Exception e) {
 
               }
               sleep(1000);
         }
         returnType false;
   }

在查询语句后面增加for update,数据库会在查询过程中给数据库表增加排他锁(这里再多提一句,InnoDB引擎在加锁的时候,只有通过索引进行检索的时候才会使用行级锁,否则会使用表级锁。这里我们希望使用行级锁,就要给method_name添加索引,值得注意的是,这个索引一定要创建成唯一索引,否则会出现多个重载方法之间无法同时被访问的问题。重载方法的话建议把参数类型也加上)。当某条记录被加上排他锁之后,其他线程无法再在该行记录上增加排他锁。

我们可以认为获得排它锁的线程即可获得分布式锁,当获取到锁之后,可以执行方法的业务逻辑,执行完方法之后,再通过connection.commit()操作来释放锁:

public void unlock(){
    connection.commit();
}

这里还可能存在另外一个问题,虽然我们对method_name 使用了唯一索引,并且显示使用for update来使用行级锁。但是,MySql会对查询进行优化,即便在条件中使用了索引字段,但是否使用索引来检索数据是由 MySQL 通过判断不同执行计划的代价来决定的,如果 MySQL 认为全表扫效率更高,比如对一些很小的表,它就不会使用索引,这种情况下 InnoDB 将使用表锁,而不是行锁。如果发生这种情况就悲剧了。

还有一个问题,就是我们要使用排他锁来进行分布式锁的lock,那么一个排他锁长时间不提交,就会占用数据库连接。一旦类似的连接变得多了,就可能把数据库连接池撑爆。

这种方法可以有效的解决上面提到的无法释放锁和阻塞锁的问题:

  1. 阻塞锁?for update语句会在执行成功后立即返回,在执行失败时一直处于阻塞状态,直到成功。
  2. 锁定之后服务宕机,无法释放?使用这种方式,服务宕机之后数据库会自己把锁释放掉。

但是还是无法解决数据库单点和可重入的问题。

优点:

  • 直接借助数据库容易理解;

缺点:

  • 会有各种各样的问题,在解决问题的过程中会使整个方案变的越来越复杂。
  • 操作数据库需要一定的开销,性能问题需要考虑。

总结

因为单实例DB的TPS一般为几百,所以基于DB的分布式性能上限一般也是1k以下,一般在并发量不大的场景下该分布式锁是满足需求的,不会出现性能问题。不过DB作为分布式锁服务需要考虑单点问题,对于分布式系统来说是不允许出现单点的,一般通过数据库的同步复制,以及使用vip切换Master就能解决这个问题。

使用数据库来实现分布式锁,这三种方式都是依赖数据库中的一张表,一种是通过表中的记录存在情况确定当前是否有锁存在,另外两种是通过数据库的乐观锁和排它锁/悲观锁来实现分布式锁。

参考资料

  1. 基于数据库的分布式锁实现

你可能感兴趣的:(【分布式锁第二篇 基于DB的分布式锁】)