数据库死锁问题是我们老生常谈的问题了,在我们实际开发过程中经常会遇到,为了尽量避免出现死锁,我们需要了解出现死锁的场景。同时,如果线上出现了死锁之后怎么去分析、排查和解决,下面我就这两点介绍一下。
数据库的死锁是指:不同的事务在获取资源时相互等待,导致无法继续执行的一种情况。当发生死锁时,数据库系统会自动中断其中一个事务,以解除死锁。在数据库中,事务可以分为读事务和写事务。读事务只需要获取读锁,而写事务需要获取写锁。当多个事务同时操作同一组数据时,可能会引发死锁的出现。
2-1、事务同时更新多个表
当一个事务同时更新多个表并且使用了不同的顺序,可能会导致死锁的发生。例如,事务 A 首先更新表 X,此时获取到了 X 表的锁,并在未释放该锁的情况下尝试更新表 Y;而事务 B 首先更新表Y,此时获取到了 Y 表的锁,并在未释放锁的情况下尝试更新表 X。这种情况下,两个事务会相互等待对方的锁释放,从而形成死锁。
2-2、事务嵌套
当一个事务内部开启了另一个事务,并在内层事务中更新了某个表,而外层事务也需要更新该表的同一行记录时,就有可能发生死锁。因为外层事务需要等待内层事务释放锁,而内层事务需要等待外层事务释放锁。
2-3、索引顺序不一致
当多个事务按照不同的顺序访问相同的数据行,并且使用了不同的索引时,可能会发生死锁。例如,事务 A 按照索引 1 的顺序访问数据行,事务 B 按照索引 2 的顺序访问同一组数据行,这样两个事务之间就会产生死锁。
2-4、不同事务同时更新相同的索引
当多个事务同时更新相同的索引时,可能会导致死锁。这是因为事务在更新索引时会获取对应的锁,并在未释放锁的情况下尝试更新其他数据,从而形成死锁。
如果线上发生了死锁,我们应该采取以下步骤进行处理:
正常情况下我们都会建立死锁监控机制,以便及时掌握死锁情况;同时设置相应的预警机制,以便在死锁发生时能够及时处理。
通过数据库的监控工具或命令可以查看是否存在死锁情况,如果出现则了解死锁的具体情况,包括死锁的事务和死锁的资源。
根据监控结果,找到造成死锁的事务,并手动选择其中一个事务终止。可以根据事务的执行时间、影响行数、优先级等因素进行终止决策。可以通过 select * from information_schema.innodb_trx
语句查看死锁情况。
在 innodb 中,有三张表可以帮助我们更好去分析死锁信息:
系统自动解除死锁:
正常情况下,当发生死锁时,MySQL 系统会自动解除死锁,至于解除哪个事务的锁,需要亏了一个代价,在解除死锁方面,会选择回滚事务产生影响最小的一个进行回滚。
这里就要提一下两个概念了,一个是事务的权重(trx_weight),另外一个是事务的调度权重(trx_schedule_weight):
终止死锁事务后,需要重新执行被终止的事务。这可能需要一些逻辑处理,例如对数据进行回滚或者重新执行一些操作。
通过数据库的日志和监控信息,分析死锁的原因。下面是查看死锁日志的命令语句:
show engine innodb status;
分析死锁日志然后根据死锁原因对数据库的设计和代码进行优化,以尽量减少死锁的发生。
同时也可以根据分析结果,针对性地进行数据库结构调整、索引优化、事务隔离级别调整等措施,以降低死锁的概率。