在40岁老架构师 尼恩的读者交流群(50+)中,最近有小伙伴拿到了一线互联网企业如滴滴、阿里、极兔、有赞、shein 希音、百度、网易的面试资格,遇到很多很重要的面试题:
什么是数据库事务?
说说 InnoDB一次事务的执行过程?
小伙伴 没有回答好,导致面试挂了,来求助尼恩,如何才能回答得很漂亮, 让面试官刮目相看、口水直流。
所以,尼恩给大家做一下系统化、体系化的梳理,使得大家内力猛增,可以充分展示一下大家雄厚的 “技术肌肉”,让面试官爱到 “不能自已、口水直流”,然后实现”offer直提”。
当然,这道面试题,以及参考答案,也会收入咱们的 《尼恩Java面试宝典》V136版本PDF集群,供后面的小伙伴参考,提升大家的 3高 架构、设计、开发水平。
《尼恩 架构笔记》《尼恩高并发三部曲》《尼恩Java面试宝典》的PDF,请到文末公号【技术自由圈】取
数据库事务( transaction) 是指作为一个逻辑工作单元执行的一系列数据库操作,这些操作要么全部成功,要么全部失败,是一个不可分割的工作单元。
事务是在事务开始和事务结束之间执行的一系列数据库操作。
事务的目的是确保数据库操作的一致性和完整性,同时提供对并发访问的隔离性和恢复能力。
注意:请点击图像以查看清晰的视图!
事务具有四个核心特性,也被称为ACID特性:
原子性(Atomicity):事务中的操作要么全部成功,要么全部失败,不存在部分成功的情况。例如,在转账操作中,要么全部完成,要么全部取消,以确保资金的一致性。
如果事务失败,系统会回滚到事务开始前的状态,保证数据的一致性。回滚操作会将数据库恢复至事务开始前的状态,以消除任何可能的不一致性。
一致性(Consistency):事务执行前后,数据库必须保持一致性状态。
这意味着事务要将数据库从一个一致性状态转移到另一个一致性状态。一致性确保了数据始终处于有效且符合业务规则的状态。如果事务成功提交,数据库将处于有效状态;若事务失败,数据将回滚至事务开始前的状态。一致性是数据库事务的核心目标,因为它确保了数据在事务执行过程中的正确性。
例如,在转账操作中,转账前后的账户余额总和应该保持不变。
隔离性(Isolation):并发执行的多个事务之间应该相互隔离,互不干扰。
隔离性确保每个事务都是独立的,不受其他事务的影响。每个事务都应该感知不到其他事务的存在,以避免数据的不一致和并发访问的问题。隔离级别可以控制事务之间的隔离程度,如读未提交(Read Uncommitted)、读已提交(Read Committed)、可重复读(Repeatable Read)和串行化(Serializable)等。
持久性(Durability):一旦事务提交成功,对数据库的修改应该永久保存,即使系统发生故障或重启。
持久性确保了事务的最终一致性,即使系统在执行过程中出现故障,事务提交后的数据也应保持不变。系统应该能够恢复到事务提交后的状态,保证数据的持久性。
这四个特性被称为ACID特性,是保证数据库事务正确执行的基本要素。通过这些特性,确保了数据库操作的一致性、完整性和可靠性。在此基础上,事务可以更好地满足并发控制、数据稳定和故障恢复等方面的需求。
在计算机科学中,ACID(原子性、一致性、隔离性、持久性)是数据库事务处理的基本特性,它在保证数据正确性和完整性方面起着至关重要的作用。我们可以通过一个常见的例子——银行转账来解释ACID的概念。
假设有一个银行数据库,其中包含两个表:信用卡表和储蓄表。
现在,用户A要将信用卡中的100元转移到储蓄账户中。这个转账过程需要遵循ACID特性。
转账过程中的操作要么全部成功,要么全部失败。
以银行转账为例,如果用户A要将信用卡中的100元转移到储蓄账户中,那么转账过程中的所有操作(包括扣款和存款)要么全部成功,要么全部失败。如果其中一个操作失败,例如扣款成功但存款失败,那么系统会回滚到事务开始前的状态,之前的所有操作都将回滚,以保证数据的一致性。
转账过程中,数据库必须保持一致性状态。这意味着转账前后的账户余额总和应该保持不变。
例如在转账之前,信用卡和储蓄账户中共有500+500=1000元钱。
如果转账成功,信用卡余额减少100元,储蓄账户余额增加100元,在转账之后,两个账户中共有400+600=1000元。保持了数据的一致性。
在转账过程中,多个用户可能同时进行转账操作。
隔离性确保每个用户的转账操作互不干扰,彼此独立进行。
例如,如果用户B同时也要将100元从信用卡转移到储蓄账户,他的转账操作应该与用户A的转账操作相互隔离,互不干扰。
一旦转账操作成功提交(即事务提交),两个账户中的金额就会真正发生变化,并将数据写入数据库以进行持久化保存。
系统应该能够恢复到转账提交后的状态,保证数据的持久性。
通过遵循ACID特性,银行可以确保转账操作的正确执行,保证数据的一致性和完整性。总之,事务处理在需要保证数据一致性和完整性的场景中具有广泛的应用,如银行转账、在线支付等。使用事务可以简化应用程序的开发和维护,提高数据的可靠性和安全性。
注意:请点击图像以查看清晰的视图!
InnoDB的一次更新事务涉及到多个组件和步骤,包括Buffer Pool、BinLog、UndoLog、RedoLog以及物理磁盘。
下面是一次完整的事务更新操作过程:
在进行数据更新时,InnoDB首先在缓冲池(Buffer Pool)中查找待更新记录是否已经在内存中。若记录不在内存中,InnoDB会将记录从磁盘文件读取到缓冲池(Buffer Pool)中。
缓冲池是InnoDB存储引擎提供的临时存储区,用于提升数据读取和修改的速度。将数据加载到缓冲池后,后续的更新操作均在缓冲池内进行。这样可以减少磁盘I/O操作,从而提高事务处理速度。缓冲池在内存中存储数据,可以降低磁盘I/O的开销,提高数据读取和写入的速度,从而优化事务处理性能。
在更新数据之前,InnoDB会将原始数据的副本写入Undo Log(回滚日志)。
Undo Log是保证事务回滚和并发控制的关键部分,也是确保事务原子性和一致性的重要机制。Undo Log记录了事务开始前的数据状态,以便在需要回滚时进行数据恢复。通过记录撤销日志,InnoDB能够实现事务的滚动回滚,提高事务处理的灵活性。撤销日志在事务处理过程中起到了关键作用,它记录了事务的修改过程,使得事务能够在需要时回滚到之前的状态,保证数据的一致性和完整性。
接下来,InnoDB会在缓冲池中更新数据。
这意味着,当执行update语句时,InnoDB会先更新已经读取到Buffer Pool中的数据,修改操作会直接在内存中进行,而不是立即写入磁盘。
此时,缓冲池中的数据被标记为"脏页",表示与磁盘上的数据不一致。脏页是缓冲池中已经被修改但尚未写入磁盘的数据页,它需要后续的处理才能将修改同步到磁盘,保证数据的持久性。
为了保证事务的持久性,InnoDB在Buffer Pool中记录修改操作的同时,InnoDB会先将更新操作写入Redo Log(重做日志)。
Redo Log是一种物理日志,它记录了事务对数据库的修改操作。通过Redo Log,即使系统发生故障,也可以通过重做日志来恢复事务修改后的状态。这一机制保证了事务的可靠性,降低了系统故障带来的风险。重做日志是保证数据持久性和恢复性的关键,它记录了事务的修改过程,使得事务的修改能够在故障恢复后得到恢复。
当事务完成所有的更新操作后,事务被提交。在提交事务时,InnoDB会将事务标记为"准备提交"状态。
此时,事务的修改操作仍然在缓冲池中,尚未写入磁盘。事务提交是事务处理的重要环节,它标志着事务处理完毕,可以进行后续的提交操作。在提交之前,事务的修改操作需要得到处理,保证数据的完整性和一致性。
在事务提交之后,InnoDB会将事务的修改操作写入BinLog(归档日志)。
BinLog是MySQL的二进制日志,用于记录数据库的所有修改操作。在归档日志中记录的信息包括:事务开始的时间、数据库名、表名、事务ID、SQL语句等。它可以用于数据恢复、主从复制、数据分析和同步等场景。归档日志在数据库中起到了关键作用,它记录了数据库的修改过程,使得数据库的修改能够在故障恢复后得到恢复。
最后,在提交过程完成后,InnoDB会将缓冲池(Buffer Pool)中的脏页刷新到物理磁盘上的数据文件中。
这个过程称为"刷脏"。通过刷脏操作,将缓冲池中的修改操作同步到磁盘,确保数据的持久性。
然而,这个写入过程并非立即执行,而是由后台线程异步执行的,因此可能会有一定的延迟。总而言之,MySQL会在适当的时机选择将数据写入磁盘以进行持久化。
InnoDB的数据更新事务涉及多个关键环节和步骤,包括数据预处理、记录撤销日志、更新内存数据、记录重做日志、事务提交、记录归档日志以及刷新脏页到磁盘。这些步骤确保事务具备原子性、一致性、隔离性和持久性,保障数据库操作正确执行和数据完整性。在实际应用中,了解这些细节有助于更好地优化数据库性能和事务处理。
注意:请点击图像以查看清晰的视图!
数据库事务面试题,是非常常见的面试题。
以上的内容,如果大家能对答如流,如数家珍,基本上 面试官会被你 震惊到、吸引到。
在面试之前,建议大家系统化的刷一波 5000页《尼恩Java面试宝典PDF》,并且在刷题过程中,如果有啥问题,大家可以来 找 40岁老架构师尼恩交流。
最终,让面试官爱到 “不能自已、口水直流”。offer, 也就来了。
……完整版尼恩技术圣经PDF集群,请找尼恩领取
《尼恩 架构笔记》《尼恩高并发三部曲》《尼恩Java面试宝典》PDF,请到下面公号【技术自由圈】取↓↓↓