Binary Oracle

简单聊聊Innodb崩溃恢复那些事

Buffer Pool 整体架构
Buffer Pool 管理策略
- redo 日志
- - redo log file
  - Mini-Transaction
  - CheckPoint
  - - 部分写出问题
  - 崩溃恢复
- undo日志
- - 整体结构
  - 日志格式
  - 记录格式
  - purge
  - 回滚
总结
额外参考

本文想用简单精炼的语言将Innodb崩溃恢复那些事情好好拾到拾到，本文主要参考以下三本书和我个人一些感想而作:

Innodb技术内幕第二版
Mysql运维内参
从根上理解Mysql

关于一些辅助资料有:

CMU 15-445 数据库基础课程
Mit 6.830 数据库基础课程
Aries论文
数据库系统概念-原书第6版

还有一些额外参考的博客，链接已在文章末尾贴出。

本文作为一篇闲谈文章，细节不会深入讲解，后续会考虑出源码解析文章，结合源码深入聊聊崩溃恢复的整个过程。

Buffer Pool 整体架构

Innodb中的Buffer Pool作为磁盘数据页在内存中的页缓存池，负责管理索引页，数据页，undo页，插入缓存，自适应哈希索引，锁信息，数据字典信息等。

Mysql 5.7.5 之前，Buffer Pool大小在运行时不支持动态调整大小，而 5.7.5 版本后将Buffer Pool调整为由多个chunk组成，当需要扩容Buffer Pool大小时，只需要单独向操作系统以chunk为单位进行空间申请即可，无需再向操作系统申请一大片连续内存空间，然后再将旧的Buffer Pool内容复制过去。

每个chunk由若干缓存页与其对应的控制块组成，控制块具体包含如下四个部分:

其对应的页面地址frame
页信息结构buf_page_t ，该结构用来描述一个页面的信息，包括所属表空间ID，页面号，被修改时产生的LSN(newest_modification 和 oldest_modification)，使用状态等
保护该页面的互斥量mutex
访问页面时对该页面上的锁lock(read/write)等

Buffer Pool通过free链表管理空闲页，通过Flush链表管理脏页，通过LRU链表存放所有被访问或者修改过的页，同时Buffer Pool内部还持有一把mutex锁，用于确保一个实例只能由一个线程访问。

Buffer Pool实际分配过程中，页面从后往前分配，而控制结构从前往后分配，因此，在一般情况下，中间的会剩余一部分没有被使用，因为剩余空间不能再放得下一个控制结构和页面了。

在初始化每一个页面之后，都需要将每个页面加入到Free链表中去。

同时为了通过表空间号+页号快速定位一个Page，Buffer Pool还需要以表空间号+页号作为key，缓存页作为value创建一个哈希表，在需要访问某个页数据时，先从哈希表中根据表空间+页号看看有无对应的缓存页，如果有，直接使用，否则，从free链表中选择一个空闲的缓存页，然后把磁盘中对应的页加载到该缓存页的位置即可。

关于LRU链表的组织，分别针对预读和全表扫描做了对应的优化:

预读: 将LRU链表分为冷数据区域和热数据区域，初次从磁盘加载到Buffer Pool的页面会被加入old区域头部，如果这些预读页面后续不被访问，那么会渐渐从old区域逐出，而不会影响young区域中被频繁使用的页
全表扫描: 由于innodb将从页面读取一条记录算作对页面的一次访问，所以针对全表扫描这种场景，每个被加载上来的页面短时间内都会被多次访问，但是访问完后，就不会再被访问了，因此我们可以通过时间限制来判断是否需要将某个被多次访问页面移动到热数据区域
热点页面: 热点页面需要频繁被访问，所以对应页面需要频繁调整到LRU链表头部，此时我们限制只有当被访问的缓存页位于热点区域后面3/4区域时，才会被移动到LRU链表头部，以此来降低调整LRU链表的频率。

Buffer Pool作为一个共享资源，在并发环境下必定存在资源竞争问题，此时我们可以借助分而治之思想，采用多缓冲池实例的方式，将用户请求根据访问页的哈希值不同平均负载到不同的缓冲池实例上:

Buffer Pool 管理策略

当我们修改数据时，DBMS需要保证两点:

事务成功提交前，数据必须已经持久化成功
如果事务中止，任何修改都不应该持久化

如果遇上了事务故障或者系统故障，DBMS需要通过相关恢复手段来确保数据一致性，通常有以下两种思路:

undo : 将中止或未完成的事务中已经指向的操作回滚
redo : 将提交的事务执行的操作重做

DBMS 如何支持 undo/redo 取决于它如何管理 buffer pool , 我们可以从两个角度来分析一下buffer pool的管理策略:

steal policy : 是否允许一个未提交事务修改持久化到磁盘
- steal : 允许，崩溃恢复过程中需要将最新一次checkpoint时间点时活跃的未提交事务做出的修改操作进行回滚
- no_steal : 不允许，每次checkpoint时可能都需要等待当前所有活跃事务结束，同时禁止新的事务开始，确保不会产生部分写出问题
force policy : 事务提交是否需要把所有更新立刻持久化到磁盘
- force : 事务提交时必须把相关更新立刻持久化到磁盘
- no_force : 事务提交时需要把相关更新持久化到磁盘，可以采用异步批量更新，因此我们需要记录redo log日志，防止此过程中系统崩溃，导致已经提交的事务修改丢失

Innodb采用的是 steal + no_force 策略，这也符合Aries这篇论文的核心思想，简单来说可以总结为三点:

Write - Ahead Logging (WAL)
- 数据落盘前，所有写操作都必须记录在日志中并落盘
- 必须使用steal + no_force 缓存管理策略
Redo Log
- 当DBMS重启时，按照日志记录的内容重做数据，恢复到故障发生前的状态
Undo Log
- 在undo过程中记录undo操作到日志中，确保在崩溃恢复期间再次出现故障时不会执行多次相同的undo操作

Innodb 具体实现与Aries这篇论文的思想还是有些区别的，具体区别简述如下:

innodb不会通过redo log记录checkpoint时的活跃事务列表，innodb在崩溃恢复过程分为两段: redo 和 undo
- redo阶段: 从最新一次checkpoint lsn往后进行扫描，依次进行重放，确保redo阶段结束后，数据库的完整性，但是此时数据库还可能存在脏数据，因为有未提交事务的修改提前落盘了，这些修改需要进行回滚
- undo阶段: 扫描undo日志，判断哪些undo日志在崩溃时还处于活跃状态，将这些undo日志进行重放，即回滚这些未提交事务已经做出的修改
aries论文中提到的redo日志会在checkpoint时的redo日志中记录当前时刻的活跃事务列表，然后崩溃恢复阶段会做以下事情:
- 从最新一次checkpoint lsn往后扫描所有redo日志，同时区分区分哪些活跃事务在崩溃前提交了，哪些未提交
- 将崩溃前完成了事务提交的活跃事务redo日志进行重放
- 将崩溃前未完成事务提交的活跃事务，根据其redo日志进行回滚，同时回滚期间记录下对应的CLR(Compensation Log Records)，防止崩溃恢复期间重复执行多次相同的undo操作

redo 日志

redo日志作用有哪些:

崩溃恢复
通过延迟脏页刷新，可以合并多次写入，省去了大量磁盘IO操作

redo日志记录的是针对页面的做出的物理修改，所以其日志基本格式为:

虽然说redo记录的是对页面做出的物理层面修改记录，但是，比如一条简单的插入语句都可能会涉及多个页面的修改，如果真的是完全记录在页面哪个偏移量上做出了什么修改，可能会产生比原页面数据还要大的redo日志。

因此innodb引入了多种redo日志类型，实际来说还是逻辑日志，但是更偏向底层，使得日志占用空间比全物理日志要少很多，同时我们也可以自己编写REDO解析工具，了解数据库做了什么，类似canal监听binlog一样，所以总结一下就是:

物理层面看，这些redo日志指明了对哪个表空间的哪个页进行了修改
逻辑层面看，崩溃恢复过程中，并不能直接根据这些日志里的记载，将页面内的某个偏移量恢复为某个数据，而是需要根据日志类型调用一些事先准备好的函数，执行完这些函数后才可以将页面恢复成系统崩溃前的样子

逻辑日志最大缺点就是需要首先保障日志对应页面的正确性，否则会造成逻辑日志执行不成功，或者造成数据不一致的问题，这个问题在Innodb中的解决方式，就是常说的Double Write机制，核心思想就是:

脏页刷盘过程是先写入double write file中，写入成功后，再将脏页刷回表空间文件中
崩溃恢复中，数据库都会检查页面是否合法，如果发现一个页面校验结果不一致，则此时会用到两次写机制，用两次写空间中的数据来恢复异常页面的数据

redo log file

redo log buffer 在内存中是一段连续的内存空间，被划分为了若干512字节大小的block，而对应的redo log file 也是由若干512字节大小的block组成的:

关于每个redo log file 头信息块构成如下图所示:

Innodb 日志文件组默认包括2个日志文件，日志最小增量为一个MTR(下节会讲)，日志文件轮询一圈，采用循环写入的方式。

在InnoDB中，通过日志组来管理日志文件，是一个逻辑定义，包含若干个日志文件，一个组中的日志文件大小相等，大小通过参数来设置。现在InnoDB只持一个日志组。在MySQL 5.5及之前的版本中，整个日志组的容量不能大于4GB（实际上是3.9GB多，因为还有一些文件头信息等），到了MySQL 5.6.3版本之后，整个日志组的容量可以设置得很大，最大可以达到512GB。

日志组中的每一个日志文件，都有自己的格式，内部也是按照大小相等的页面切割，但这里的页面大小是512个字节，由于历史的原因，考虑到机械硬盘的块大小是512字节，日志块大小也如此设计。这是因为写日志其实就是为了提高数据库写入吞吐量，如果每次写入是磁盘块大小的倍数，效率才是最高的，并且日志将逻辑事务对数据库的分散随机写入转化成了顺序的512字节整数倍数据的写入，这样就大大提高了数据库的效率。

Mini-Transaction

写日志是一个物理操作，它也需要一个完整性，比如在底层页面插入一条记录，如果只修改页头信息而没有修改页尾信息，其实对于这个页面来说是不完整的，所以这个物理操作还是需要一个机制来保证它的完整性的。在Innodb中，这个机制也被称为MTR，可以理解为物理事务，因为它也是用来保证完整性的。

物理事务既然也被称为事务，那么其同样有事务的开始和提交，物理事务的开始就是对mtr_struct结构体的初始化，其包含下列属性：

memo : 动态数组空间，用于存储当前物理事务访问到的所有页面，这些页面都被当前物理事务加上了锁(读锁或者写锁) --> 这里说的是latch
log : 动态数组空间，用于存储当前物理事务在访问修改数据页面过程中产生的所有日志，也就是redo日志
n_log_recs : 物理事务产生的日志量
log_mode : 物理事务的日志模式，包括MTR_LOG_ALL(写日志)，MTR_LOG_NONE(不写日志) 等
start_lsn : 物理事务开始前的LSN
end_lsn : 物理事务提交后产生的新的LSN

物理事务执行过程中，需要对访问到的页面加上对应的latch锁，页面当前是否上锁，可以通过页面控制块中记录的锁信息获知，如果获取某个页面锁成功，则将当前页面加入memo数组，否则需要等待直到锁释放。

物理事务执行过程中涉及到写操作(MTR_LOG_ALL)，则需要对写操作记录日志，这里的日志就是逻辑事务中提到的Redo日志。写下相应的日志后，同样将其存储到上面的log动态数组中，同时将n_log_recs计数器自增。

下面聊聊物理事务提交的过程，首先redo日志不完全是物理日志，它包含了部分逻辑意义在里面，比如插入一行记录的时候，MTR记录的是在一个页面中写入这条记录，内容大致包括页面号，文件号及这条记录每列的值，这样就有了逻辑概念。需要注意的是，在Redo恢复时，需要保证这个页面是正确的，完整的，不然这个REDO就会失败，这也真是DOUBLE WRITE存在的意义。 如果记录的是纯物理的REDO，日志内容应该会拆分的更散，比如：插入一条记录，它会记录页面号，表空间号，页内偏移值，并且有多条这也的记录，因为会涉及多个位置的修改，这就没有任何逻辑内容了。而针对一个插入操作，需要在一个页面内的不同位置写入不同的数据，当然如果是纯物理REDO，相应地会产生多条REDO记录，这是物理与逻辑的简单区别。

对于MTR的提交而言，一个逻辑事务是由多个物理事务组成的，物理事务可以保证一次物理修改的原子性，比如插入一条记录的过程中，会包括写一条回滚记录及插入时写入一个页面等，这些逻辑上是一个动作的物理写入，可以被认为是一个独立的物理事务，也就是写回滚记录时只需mtr_start ，写完之后只需mtr_commit ，真正插入时写入一个页面也是同样的道理。

物理事务和逻辑事务一样，也是可以保证数据库操作的完整性的。一般说来，一个操作必须要在一个物理事务中完成，也就是说要么这个操作已经完成，要么什么也没有做，否则就有可能造成数据不完整的问题，因为在数据库系统做REDO操作时是以一个物理事务为单位做的，如果一个物理事务的日志是不完整的，则它对应的所有日志都不会重做。那么，如何辨别一个物理事务是否完整呢？这个问题是在物理事务提交时用了一个很巧妙的方法来保证的。在提交前，如果发现这个物理事务有日志，则在日志最后再写一些特殊的日志，这些特殊的日志就是一个物理事务结束的标志，提交时一起将这些特殊的日志写入，在重做时如果当前这一批日志信息最后面存在这个标志，则说明这些日志是完整的，否则就是不完整的，就不会重做。

一个事务可以包含多个SQL语句，每条语句由若干mtr组成，每一个mtr又可以保护若干redo日志:

MTR提交时将物理事务产生的日志写入到InnoDB日志系统的日志缓冲区中，然后等待后台master线程定时将日志系统的日志缓冲区数据刷到日志文件中，这会涉及到日志刷盘时机的问题。Mtr ，日志缓冲区与日志文件之间的关系如下:

如上图所示，左边的若干MTR产生了各自的REDO LOG，有些MTR已经提交了，有些正在写入，正在写入日志的MTR，它们的日志都存储在自己的MTR结构的log动态数组中，这个MTR还是不完整的，所以还是自己保存着，而对于那些已经提交的MTR，它们对应的日志已经在提交的时候转存到了日志缓冲区中，相当于这些日志已经落盘了，除非此时数据库挂了。

物理事务提交时还有一项很重要的工作就是处理上面结构体中动态数组memo中的内容，现在已经知道这个数组中存储的是这个物理事务访问过的所有页面，并且都已经上了锁。在它提交时，如果发现这些页面中已经有被修改过的，这些页面就成了脏页，这些脏页需要被加入到InnoDBBuffer Pool中的flush链表中（讲BUFFER时已经讲过）。当然，如果已经在flush链表中，则直接跳过（不能重复加入），svr_master_thread线程会定时检查这个链表，将一定数目的脏页刷到磁盘中，加入之后还需要将这个页面上的锁释放掉，表示这个页面已经处理完成；如果页面没有被修改，或者只是用来读取数据的，则只需要直接将其共享锁（S锁）释放掉即可。

日志缓冲区也是有大小的，当多个MTR提交时，缓冲区被占满了，那么此时系统会将日志缓冲区的日志刷到日志文件中（这里涉及的另一个问题就是日志刷盘时机，这里只是一种情况，其他的后面做专门介绍），为其他新的MTR释放空间。此时，日志的流向就是从中间的日志缓冲区向右边的日志文件转移，转移其实是平移，在缓冲区是什么内容，写入文件也是什么内容，也是完全连续的，且在日志文件中，还是一个个的MTR连续存储。

最新写入日志文件的那个MTR产生的LSN值，也就是日志最新写入文件的LSN值，这个值的意义很重大，表示的是，到这个LSN为止，所有的修改都是完整的了，如果此时数据库挂了，写到这个位置的数据都是可以恢复的，而不需要去关心Buffer页面是不是被刷到磁盘。但此时在日志缓冲区中的日志所对应的操作就丢失了，这里是否会丢失事务数据与参数innodb_flush_log_at_trx_comm it有关系：

如果将参数innodb_flush_log_at_trx_comm it设置为1，当前事务的提交肯定会将日志缓冲区中的日志刷到日志文件中；
如果设置为2，那么日志只是写入了操作系统缓存，并没有写入磁盘，那么此时有可能丢失部分已经提交的事务，丢失多少由操作系统决定，这种情况下，即使数据库挂了，只要机器不挂，就问题不大，因为操作系统还会将它对应的缓存写入磁盘；
但如果设置为0的话，就无能为力了，因为InnoDB只负责将事务对应的日志写入到日志缓冲区中，无论是操作系统，还是数据库，都不能保证日志的安全性，所以最好不要设置成这样。

CheckPoint

redo log日志文件大小是有限的，不可能无限量将日志写入日志文件中，并且redo log file本身采用循环写入，一旦日志文件填满了，就不能继续写入了，因此我们需要定时刷新脏页到磁盘，从而释放掉那些无用的redo日志，这个过程被称为checkpoint。

Innodb 通过后台Master线程定时将flush链表中的脏页刷回磁盘，脏页刷回磁盘时，会触发对应的checkpoint，推进全局checkpoint LSN的值，同时更新log file头信息块中的对应的checkpoint块。checkpoint LSN之前的redo日志对应的脏页都已经刷回磁盘，而之后的日志对应的脏页还未刷入磁盘，所以如果此时系统崩溃，重启时，需要从log file头信息块中记录的checkpoint LSN为起点，向后扫描所有redo日志，依次进行重放。

flush链表中的脏页会按照页面第一次修改时间从大到小进行排序，每个页面关联的控制块中都有以下两个属性用于记录页面何时被修改的信息:

oldest_modification : 如果某个页面被加载到buffer pool后进行第一次修改，那么就将该次修改关联的mtr开始时对应的LSN值赋值给该属性
newest_modification ：每修改一次页面，都会将修改该页面的mtr结束时对应的lsn值写入这个属性，也就是说该属性代表页面最近一次修改后对应的系统的lsn值

日志是循环使用的，不能跳着写，因此每次checkpoint的时候是从LSN值最小的日志开始，按照从小到大的顺序不断让这些日志失效，因此刷脏时，也是从flush链表尾部往前进行刷脏，同时将当前flush链表尾部最早被修改的脏页的oldest_modification赋值给当前checkpoint lsn，也就是完成了checkpoint指针的推进过程。

例如: 本次刷新脏页c，然后脏页a称为了最早被修改的脏页，此时将脏页a的oldest_modification赋值给当前checkpoint lsn，此时我们可以确保凡是lsn小于该值的脏页都已经落盘了，那么也意味着小于该lsn的redo日志占用空间都可以被回收了。

部分写出问题

innodb每次checkpoint时，都是从flush链表尾部取出最早被修改的脏页进行刷盘，那么这是否存在部分写出问题呢？checkpoint lsn 之前的redo日志中是否包含当前未提交事务产生的修改呢？

答: 部分写出问题肯定是存在，即便是checkpoint lsn之前的redo日志也有可能包含未提交事务做出的修改

举例:

假设缓存池中目前存在三个脏页，其对应的事务都未提交，此时我们想要加载page 4到缓存池中，然后此时需要淘汰最早被修改的page 1
此时checkpoint被更新为0
此时再将page 1加载到缓存池中，然后此时需要淘汰最早被修改的page 2
此时checkpoint被更新为120

最终可以看到checkpoint lsn被更新为了120，只是说明checkpoint lsn之前的脏页都已经落盘了，但是无法确保此时磁盘上不存在未提交事务做出的修改。

但是我们不需要担心这个问题，因为innodb对于redo日志的定位就是确保我们可以利用redo日志重放，将数据库状态恢复到崩溃前的样子，然后再利用undo日志完成未提交事务产生修改的回滚操作。

崩溃恢复

崩溃恢复整个过程由redo和undo两个阶段完成，本节我们先来看看redo阶段是如何将数据库恢复到其崩溃前的模样的。

Innodb会维护一个全局LSN变量用于记录已经向redo log buffer写入的redo日志大小，同时维护一个全局flushed_to_disk_lsn变量用于记录已经刷到磁盘上的redo log日志大小，如下图所示:

关于崩溃恢复，首先我们需要确定崩溃恢复的起点：

checkpoint lsn之前的redo日志都可以被覆盖，因为这些redo日志对应的脏页都已经刷新到磁盘中了;
checkpoint lsn之后的redo日志，它们对应的脏页可能还没有刷盘，也可能刷盘了，因此需要重放这些redo日志来恢复页面；
获取redo log日志文件的checkpoint block中存储的最新一次checkpoint lsn ，该值为崩溃恢复的起点

下一步是确定崩溃恢复的终点:

普通block的log block header部分有一个称之为LOG_BLOCK_HDR_DATA_LEN的属性，该属性值记录了当前block里使用了多少字节的空间，对于被填满的block来说，该值永远为512。
如果该属性的值不为512，那么它就是此处崩溃恢复中需要扫描的最后一个block。

最后一步就是确定如何进行恢复了:

从checkpoint lsn为起点往后依次扫描每一条redo日志

根据redo日志的表空间id和页面号计算出散列值，把表空间号和页面号相同的redo日志放到哈希表同一个槽里，也就是将属于同一个页面的redo日志采用链表的形式，按照生成的先后顺序链接起来

遍历哈希表，因为对同一个页面进行修改的redo日志都放在了一起，所以可以一次性将一个页面修复好，因此这里只需要依次修复每个页面即可
每个页面对应的控制块存在一个o_m和n_m，每个页面的File Header中的FIL_PAGE_LSN也会保存当前页面最近一次修改产生的lsn，该值与n_m是对应的；每个脏页被刷盘时，其FIL_PAGE_LSN的值很大概率是比checkpoint lsn的值大的，因此我们在对当前页面进行修复时，可以跳过比FIL_PAGE_LSN小的redo日志的重放。

之所以说当前被刷脏页的FIL_PAGE_LSN可能比checkpoint lsn大，一个场景就是不断有事务更新该脏页，但是该脏页确实是最早被修改的脏页。

崩溃恢复在经过了redo阶段后，就将数据库恢复到了崩溃恢复前的模样，下一步我们就需要进入undo阶段，将崩溃恢复前未提交的事务进行回滚了。

InnoDB的REDO是在UNDO之前做的，是等到物理的数据库操作都完成之后，才能在物理数据一致的基础上去做一些逻辑的操作，即UNDO回滚操作

undo日志

undo日志的作用有如下三点:

rollback回滚
mvcc非锁定读
崩溃恢复的undo阶段用于回滚未提交事务产生的修改

InnoDB存储引擎对undo的管理采用段的方式。首先InnoDB存储引擎有rollback segment，每个回滚段中记录了1024个undo log segment，而在每个undo log segment段中进行undo页的申请。共享表空间偏移量为5的页（0，5）记录了所有rollback segment header所在的页，这个页的类型为FIL_PAGE_TYPE_SYS。

在InnoDB1.1版本之前（不包括1.1版本），只有一个rollback segment，因此支持同时在线的事务限制为1024。虽然对绝大多数的应用来说都已经够用，但不管怎么说这是一个瓶颈。从1.1版本开始InnoDB支持最大128个rollback segment，故其支持同时在线的事务限制提高到了128*1024。

事务在undo log segment分配页并写入undo log的这个过程同样需要写入重做日志。当事务提交时，InnoDB存储引擎会做以下两件事情：

将undo log放入History列表中，以供之后的purge操作
判断undo log所在的页是否可以重用，若可以分配给下个事务使用

事务提交后并不能马上删除undo log及undo log所在的页。这是因为可能还有其他事务需要通过undo log来得到行记录之前的版本。故事务提交时将undo log放入History链表中，是否可以最终删除undo log及undo log所在页由purge线程来判断。

此外，若为每一个事务分配一个单独的undo页会非常浪费存储空间，特别是对于OLTP的应用类型。因为在事务提交时，可能并不能马上释放页。假设某应用的删除和更新操作的TPS（transaction per second）为1000，为每个事务分配一个undo页，那么一分钟就需要1000*60个页，大约需要的存储空间为1GB。若每秒的purge页的数量为20，这样的设计对磁盘空间有着相当高的要求。

因此，在InnoDB存储引擎的设计中对undo页可以进行重用。具体来说，当事务提交时，首先将undo log放入History链表中，然后判断undo页的使用空间是否小于3/4，若是则表示该undo页可以被重用，之后新的undo log记录在当前undo log的后面。由于存放undo log的列表是以记录进行组织的，而undo页可能存放着不同事务的undo log，因此purge操作需要涉及磁盘的离散读取操作，是一个比较缓慢的过程。

整体结构

Innodb使用5号页面来存储事务相关信息:

5号页面格式解释如下:

TRX_SYS_TRX_ID_STORE：用来存储事务号
- 在每次新启动一个事务时，都会去检查当前最大事务号是不是达到了TRX_SYS_TRX_ID_WRITE_MARGIN（256）的倍数，如果达到了，就会将最大的事务号写入这个位置，在下次启动时，将这个值取出来，再加上一个步长（256），来保证事务号的唯一性，其实就是一个经典取号器的实现原理。
TRX_SYS_FSEG_HEADER：用来存储事务段信息。
TRX_SYS_RSEGS：这是一个数组，InnoDB有128个回滚段，那这个数组的长度就是128，每一个元素占用8个字节，对应的一个回滚段存储的内容包括回滚段首页面的表空间ID号及页面号。

针对每个回滚段，即上面数组中的一个元素，也有其自己的存储格式:

TRX_RSEG_MAX_SIZE：回滚段管理页面的总数量，即所有undo段页面之和，一般为ULINT_MAX，即无上限。
TRX_RSEG_HISTORY_SIZE：这个表用来表示当前InnoDB里，在History List中有多少个页面，即需要做PURGE的回滚段页面的个数。
TRX_RSEG_HISTORY：用来存储History List的链表首地址，事务提交之后，其对应的回滚段如果还不能PURGE，就都会加入到这个链表中。
TRX_RSEG_FSEG_HEADER：用来存储回滚段的Inode位置信息，通过这个地址，就可以找到这个段的详细信息。
TRX_RSEG_UNDO_SLOTS：这个位置所存储的是一个数组，长度为1024，每一个元素是一个页面号，初始化为FIL_NULL，即空页面。

Innodb采用分段锁思想，类似JDK 7中CourrentHashMap采用大Hash内部管理多个小Hash的分段思想，单个回滚段中最后一个位置的数字，才算真正存储回滚段的位置。

因此，Innodb总共支持的回滚段个数为128 * 1024 = 131072 个，TRX_RSEG_UNDO_SLOTS数组中每个元素指向一个页面，该页面对应一个段，该页面号就是段首页的页面号。

每个事务开始时，都会分配一个rollback segment，就是从长度为128的数字中，根据最近使用情况，找到一个临近位置的rollback segment ，在这个事务的生命周期中，被分配的rollback segment都会被这个事务所使用。

在事务执行的过程中，会产生两种回滚日志：

一种是INSERT的UNDO记录
一种是UPDATE 的UNDO记录

可能有人会问DELETE哪去了？其实是包含在UPDATE的回滚记录中，因为InnoDB把UNDO分为两类，一类就是新增，也就是INSERT，一类就是修改，就是UPDATE，分类的依据就是事务提交后要不要做PURGE操作，因为INSERT是不需要PURGE的，只要事务提交了，那这个回滚记录就可以丢掉了，而对于更新和删除操作而言，如果事务提交了，还需要为MVCC服务，那就需要将这些日志放到History List中去，等待去做PURGE，以及MVCC的多版本查询等，所以分为两类。

所以，一个事务被分配了一个rollback segment之后，通常情况下，如果一个事务中既有插入，又有更新（或删除），那么这个事务就会对应两个UNDO段，即在一个rollback segment的1024个槽中，要使用两个槽来存储这个事务的回滚段，一个是插入段，一个是更新段。

在事务要存储回滚记录的时候，事务就要从1024个槽中，根据相应的更新类型（插入或者更新）找到空闲的槽来作为自己的UNDO段。如果已经申请过相同类型的UNDO段，就直接使用，否则就需要新创建一个段，并将段首页号写入这个rollback segment长度为1024的数组的对应位置（空闲位置）中去，这样就将具体的回滚段与整个架构联系起来了。

如果在1024个槽中找不到空闲的位置，那么这个事务就会被回滚掉，报出错误：“Toomany active concurrent transactions”，错误号为1637的异常。当然，这种情况一般不会见到，如果能把这个用完，估计数据库已经根本动不了了。

日志格式

关于undo日志中的回滚段头信息部分已经介绍过了，下面介绍一下undo段头信息内容，每个undo页面头信息内容以及单条undo日志头信息内容:

undo段头信息内容如下:

TRX_UNDO_STATE：用来存储当前UNDO段的状态，状态包括TRX_UNDO_ACTIVE，TRX_UNDO_CACHED、TRX_UNDO_TO_FREE、TRX_UNDO_TO_PURGE、TRX_UNDO _PREPARED五种。
TRX_UNDO_LAST_LOG：用来存储最后一个UNDO日志的偏移位置，用来在一个UNDO段中，找到最后一个UNDO日志。
TRX_UNDO_FSEG_HEADER：这个位置，就是用来存储当前UNDO段的Inode信息的，通过这个信息可以知道本UNDO段的详细信息。
TRX_UNDO_PAGE_LIST：段内所有的页面都是通过链表连接起来的，这个位置是链表的首地址，用来管理这个链表，上面已经介绍的TRX_UNDO_PAGE_NODE则是每个节点的双链指针。

undo页面头信息内容如下:

TRX_UNDO_PAGE_TYPE：这个在上面已经解释过了，就包括两个值，分别是TRX_ UNDO_INSERT和TRX_UNDO_UPDATE。
TRX_UNDO_PAGE_START：用来表示当前页面中，从什么位置开始存储了UNDO日志。
TRX_UNDO_PAGE_FREE：与上面的START相对，这个用来表示当前页面中，UNDO日志的结束位置，也表示从这个位置开始，可以继续追加UNDO日志，直到页面存储满为止。
TRX_UNDO_PAGE_NODE：一个UNDO段中所有的页面，通过一个双向链表来管理，这个位置存储的就是双向链表的指针。

undo页面中每条undo日志头信息内容如下:

TRX_UNDO_TRX_ID：用来存储当前UNDO日志对应事务的事务ID号。
TRX_UNDO_TRX_NO：事务序列号，在恢复时使用，这个序列号就是前面讲的TRX_ SYS_TRX_ID_STORE位置存储的ID值。这个与上面ID的区别是，NO用来在回滚时保持顺序使用，而ID是在事务运行时使用的。
TRX_UNDO_DEL_MARKS：用来表示当前UNDO日志中有没有通过打标志删除过记录的操作，并决定是不是要做PURGE操作。
TRX_UNDO_LOG_START：用来存储当前页面中，第一个UNDO日志的开始位置。
TRX_UNDO_XID_EXISTS：用来标志当前日志中有没有包含Xid事务。
TRX_UNDO_DICT_TRANS：用来标志当前日志对应的事务是不是DDL的，用来在回滚时判断如何操作。
TRX_UNDO_TABLE_ID：与上一个相关，如果上面的标志是真的，则这个标志的是DDL的表ID。
TRX_UNDO_NEXT_LOG：用来链接当前UNDO段中所有的UNDO日志，这个是指向下一个UNDO日志。
TRX_UNDO_PREV_LOG：与上一个对应，这个用来指向上一个UNDO日志，从而构成双向链表。
TRX_UNDO_HISTORY_NODE：用来存储在History List中的双向链表指针。而这个链表的首地址，是在之前介绍的TRX_RSEG_HISTORY位置，可以回到前面去查看相关信息。

到目前为止，关于具体一个UNDO段中每个页面及页面内容是如何管理的已经讲清楚了。当一个事务需要写入UNDO日志时，就可以直接从对应的UNDO段中找到一个页面及对应的追加日志的偏移位置，然后将对应的UNDO日志写入即可。

记录格式

UNDO日志有多个类型，针对不同的类型，其格式也不尽相同，UNDO日志的类型有下面四种:

TRX_UNDO_INSERT_REC：记录插入的UNDO日志类型，插入记录用于回滚时，只需要通过其主键就可以实现回滚操作，所以在UNDO日志中，只记录了表ID及主键信息。回滚时，只需要通过记录中存储的主键，在原B+树中找到对应的记录，然后将其删除即可。
TRX_UNDO_UPD_EXIST_REC：更新一条存在记录的UNDO日志类型。在日志内容中，需要记录的除了表ID信息之外，还需要记录每一个被更新的列的原始值和新值，同时还需要记录主键信息用于回滚时的检索。回滚时，还是根据主键信息，找到对应的记录，然后以旧换新，恢复原值即可。
TRX_UNDO_UPD_DEL_REC：更新一条已经打了删除标志记录的UNDO日志类型。格式与上面是一样的，回滚方法也同上。
TRX_UNDO_DEL_MARK_REC：删除记录时对记录打删除标志的UNDO日志类型，格式与上面插入操作的UNDO日志格式一样，只需要存储主键信息和表ID信息，用来在回滚或者PURGE时找到对应的记录即可。回滚时，根据主键信息，找到对应的记录，然后将删除标志去掉即完成回滚。

除了上面说到的Table ID信息、主键信息之外，还会包括一些公有的信息，比如回滚段指针、最近更新事务号，这样方便MVCC在回溯记录时可以找到以前的版本，关于MVCC的内容在这里就不详细展开了。

下面简单以TRX_UNDO_INSERT_REC类型的undo日志举例进行说明:

需要注意的一点是，假如一个表中有多个索引，在修改一行数据时，回滚日志中也只会记录聚簇索引中的信息，而其他二级索引是不会被记录的。这是因为聚簇索引和二级索引中的每一行都是一一对应的，所以不同操作对聚簇索引操作时，也都会对二级索引有相应的操作，这样就没必要对二级索引写回滚日志了。

purge

purge用于最终完成delete和update操作。这样设计是因为InnoDB存储引擎支持MVCC，所以记录不能在事务提交时立即进行处理。这时其他事物可能正在引用这行，故InnoDB存储引擎需要保存记录之前的版本。而是否可以删除该条记录通过purge来进行判断。若该行记录已不被任何其他事务引用，那么就可以进行真正的delete操作。可见，purge操作是清理之前的delete和update操作，将上述操作“最终”完成。而实际执行的操作为delete操作，清理之前行记录的版本。

在前面介绍过，为了节省存储空间，InnoDB存储引擎的undo log设计是这样的：

一个页上允许多个事务的undo log存在。虽然这不代表事务在全局过程中提交的顺序，但是后面的事务产生的undo log总在最后。
此外，InnoDB存储引擎还有一个history列表(每个rollback segment一个)，它根据事务提交的顺序，将undo log进行链接。

history list表示按照事务提交的顺序将undo log进行组织。在InnoDB存储引擎的设计中，先提交的事务总在尾端。undo page存放了undo log，由于可以重用，因此一个undo page中可能存放了多个不同事务的undo log。

下面举例说明innodb的purge过程:

在执行purge的过程中，InnoDB存储引擎首先从history list中找到第一个需要被清理的记录，这里为trx1
清理之后InnoDB存储引擎会在trx1的undo log所在的页中继续寻找是否存在可以被清理的记录，这里会找到事务trx3，接着找到trx5，但是发现trx5被其他事务所引用而不能清理
故去再次去history list中查找，发现这时最尾端的记录为trx2，接着找到trx2所在的页，然后依次再把事务trx6、trx4的记录进行清理。
由于undo page2中所有的页都被清理了，因此该undo page可以被重用。

trx5的灰色阴影表示该undo log还被其他事务引用。

InnoDB存储引擎这种先从history list中找undo log，然后再从undo page中找undo log的设计模式是为了避免大量的随机读取操作，从而提高purge的效率。

关于purge这块，比较有意思的一点是: 如何判断某条undo日志不再被任何事物所引用了呢？为什么说长事务会占用大量undo日志资源呢？

每个回滚段都有一个History链表，一个事务在某个回滚段中写入的一组update undo日志会在该事务提交之后，加入到当前回滚段的History链表中。这些存在于History链表中的undo日志需要等到当前系统中最早产生的那个ReadView不再访问它们时，才能被purge回收掉。

一个ReadView在什么时候才肯定不会访问到某个事务执行过程中产生的undo日志呢？

在该RedaView生成前已经提交的事务，那么该ReadView肯定不会访问该事务运行过程中产生的undo日志了，因为该事务所改动的记录的最新版本均对该ReadView可见。
innodb提交时，会为当前事务生成一个no值，该值用来表示事务提交的顺序，先提交的事务的事务no值小，后提交的事务的事务no值大。
undo日志头信息部分有一个TRX_UNDO_TRX_NO属性，当事务提交时，就把该事务对于的事务no值填入到该属性中。
因为事务no代表各个事务提交的顺序，而History链表又是按照事务提交的顺序来排列各组undo日志的，所以History链表中的各组undo日志也是按照对应的事务no来排序的。
ReadView中也会保护当前事务的no属性，在生成一个ReadView时，会把当前系统中最大事务no值+1的值赋值给该属性。
innodb中把当前系统中所有ReadView按照创建时间连成了一个链表，当执行purge操作时，只需要取出最早生成的ReadView，然后从各个回滚段的History链表中取出事务no值较小的各组undo日志。
如果一组undo日志的事务no值小于当前系统中最早生成的ReadView的事务no属性值，那么意味着该组undo日志可以被purge，将其从Hisotry链表中移除，并且如果当前undo日志包含delete mark标记，还需要将对应标记为删除的记录彻底删除掉。

当前系统中最早生成的ReadView决定了purge操作可以清理哪些update undo日志以及打了删除标记的记录，如果某个事务使用了可重复读隔离级别，那么该事务会一直复用最初产生的ReadView。假如该事务运行了很久，一直没有条件，那么最早生成的ReadView会一直不释放，系统中的undo日志会越积越多，表空间对应的文件也会越来越大，一条记录的版本链会越来越长，从而影响系统性能。

回滚

前面已经介绍过，UNDO日志的正确性是通过REDO的恢复来保证的，在REDO日志恢复完成之后，UNDO操作就可以安全地进行了。数据库启动过程中，执行了用于REDO恢复的函数recv_recovery_from_checkpoint_start之后，就可以处理UNDO的数据了，InnoDB通过函数trx_sys_init_at_db_start来将所有回滚段相关的128*1024个UNDO扫描出来（如果存在就找到，不存在就忽略），找到之后，每一个UNDO段的状态都已经清楚了，然后将它们都缓存起来。

然后再通过函数trx_lists_init_at_db_start依次处理每一个UNDO段，根据UNDO段的状态，决定后面将采取什么措施，如果状态为TRX_UNDO_PREPARED和TRX_UNDO_ACTIVE，则这个UNDO段是需要做回滚操作的，否则是不需要的。决定回滚需求之后，再将最多128*1024个UNDO段按照上面提到的TRX_UNDO_TRX_NO从大到小的顺序排序。

最后在nnoDB存储引擎启动时的函数recv_recovery_from_checkpoint_finish中，来做回滚的相关工作。在这个函数的最后可以看到以下内容：

它根据参数innodb_force_recovery来决定要不要做回滚操作，如果设置为3或3以上，就不回滚了，这样可能导致数据库逻辑上的不一致。

最终，InnoDB通过trx_rollback_or_clean_recovered来做回滚操作，通过扫描上面排序之后的链表，发现其还是以从大到小的顺序遍历，这个顺序很重要，因为UNDO是反向操作，所以应该是先处理新产生的事务，后处理老的事务，通过事务号来区分新老关系。

针对每一个UNDO段，InnoDB会将所有状态为ACTIVE的事务的UNDO日志扫描出来，然后一条一条地做回滚操作，UNDO日志记录格式已经明确，扫描所有的日志就变得非常简单，并且针对不同的操作，对应的回滚方式也已经清楚，等待所有的回滚段处理完成之后，整个数据库的回滚操作也就完成了。

到这里，InnoDB就可以继续启动了，此时的数据库处于一个完整的、可以正确提供线上服务的状态。

总结

本文简单聊了聊Innodb崩溃恢复的整个流程，参考资料在本文开始和结束处都已给出，当然，本文含有笔者主观理解，希望大家理性看待，如果有认为不对的地方，欢迎评论区留言或私信与我讨论

额外参考

MySQL · 引擎特性 · WAL那些事儿

MySQL · 源码分析 · 庖丁解 InnoDB 之 Buffer Pool

数据库故障恢复机制的前世今生

B+树数据库加锁历史

MySQL · 源码解析 · InnoDB中undo日志的组织及实现

InnoDB 的 Redo Log 分析

源码解读：MySQL 8.0 InnoDB无锁化设计的日志系统

你可能感兴趣的:(#,Innodb存储引擎,数据结构)

Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
HashMap的Get(),Put()源码解析 Ttang23 哈希算法散列表算法
1、什么是HashMap？HashMap是Java中用于存储键值对（Key-Value）的集合类，它实现了Map接口。其核心特点是：无序性：不保证元素的存储顺序，也不保证顺序恒定不变。唯一性：键（Key）不能重复，若插入重复键会覆盖原有值。允许null：允许一个null键和任意数量的null值。非线程安全：相比HashTable，HashMap不支持同步，性能更高。2.核心数据结构：哈希表（Has
C++STL-queue s15335 C++STL c++开发语言
一.基本概念和数据结构里面的队列一样，只支持先进先出，队尾插，队头删。二.基本用法1.queue对象创建1.默认构造函数queueq1;2.拷贝构造函数queueq2(q1);2.queue赋值操作queueq1;queueq2;q2=q1;3.queue入队queueq;q.push(5);//5q.push(4);//54q.push(3);//543q.push(2);//5432q.pus
zookeeper etcd区别 sun007700 zookeeper etcd 分布式
ZooKeeper与etcd的核心区别体现在设计理念、数据模型、一致性协议及适用场景等方面。‌ZooKeeper基于ZAB协议实现分布式协调，采用树形数据结构和临时节点特性，适合传统分布式系统；而etcd基于Raft协议，以高性能键值对存储为核心，专为云原生场景优化，是Kubernetes等容器编排系统的默认存储组件。‌‌1‌‌2‌架构与设计目标差异‌‌ZooKeeper‌。‌设计定位‌:专注于分
数据结构：导论梁辰兴数据结构学习笔记数据结构导论算法时间复杂度空间复杂度
目录一，数据结构的研究内容二，基本概念与术语（一）数据、数据元素、数据项与数据对象（二）数据结构（三）数据类型与抽象数据类型️三，抽象数据类型的表示与实现⚙️四，算法与算法分析⚖️（一）算法的定义及特性（二）评价算法优劣的基本标准⏱️（三）算法的时间复杂度（四）算法的空间复杂度章结一，数据结构的研究内容数据结构是计算机科学的核心基础，其研究内容可概括为三大维度：数据组织形式：探索如何将现实世界中的
redis中什么是bigkey？会有什么影响？ Vic2334 redis
什么是bigkey？会有什么影响？bigkey是指key对应的value所占的内存空间比较大，例如一个字符串类型的value可以最大存到512MB，一个列表类型的value最多可以存储23-1个元素。如果按照数据结构来细分的话，一般分为字符串类型bigkey和非字符串类型bigkey。字符串类型：体现在单个value值很大，一般认为超过10KB就是bigkey，但这个值和具体的OPS相关。非字符串
InnoDB引擎行存储结构
InnoDB引擎行存储结构文章目录InnoDB引擎行存储结构1.存储引擎2.InnoDB页的概念3.InnoDB行格式3.1指定行格式3.2COMPACT格式3.3REDUNDANT行格式3.4溢出列3.5DYNAMIC行格式和COMPRESSED行格式1.存储引擎[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Y7BY5kOU-1643188470321)(C:\U
项目开发日记
框架整理学习UIMgr：一、数据结构与算法1.1关键数据结构成员变量类型说明m_CtrlsList当前正在显示的所有UI页面m_CachesList已打开过、但现在不显示的页面（缓存池）1.2算法逻辑查找缓存页面：从m_Caches中倒序查找是否已有对应ePageType页面，找到则重用。页面加载：从资源管理器ResMgr加载prefab并绑定控制器/视图组件。页面关闭：从m_Ctrls移除，添加
上位机知识篇---常见的文件系统
文件系统是操作系统用于管理和组织存储设备上文件的机制，它决定了文件的存储方式、命名规则、访问权限、数据结构等。以下是常见的文件系统及其应用场景、优势和劣势的详细介绍：一、Windows常用文件系统1.FAT32（FileAllocationTable32）基本特点：采用32位文件分配表，是FAT系列的升级版，支持最大单文件4GB，最大分区容量理论上为8TB（实际常用2TB以内）。应用场景：U盘、存
《C++性能优化指南》 linux版代码及原理解读第一章 v俊逸 C++性能优化指南性能优化 C++性能优化性能优化
概述：目录概述：性能优化的必要性：C++代码优化策略总结用好的编译器并用好编译器使用更好的算法使用更好的库减少内存分配和复制移除计算使用更好的数据结构提高并发性优化内存管理性能优化的必要性：按照当今的CPU运行速度来说，执行一条指令所需要的时间是10的-9次方的时间单位，如此快速的执行速度是否就没有性能优化的必要了呢？其实不然，性能优化与CPU的执行速度并无非常大的关系，试想一下，一段代码，如果用
pandas销售数据分析
pandas销售数据分析数据保存在data目录消费者数据：customers.csv商品数据：products.csv交易数据：transactions.csvcustomers.csv数据结构：字段描述customer_id客户IDgender性别age年龄region地区membership_date会员日期products.csv数据结构：字段描述product_id产品IDcategory
Go 语言 map 高级应用：优化技巧与复杂结构处理
Go语言map高级玩法全解析引言在Go语言的编程世界中，map是一种极为重要且强大的数据结构。它能够高效地存储和检索键值对，在众多场景中发挥着关键作用。对于初涉Go语言的开发者而言，掌握map的基本使用方法，如声明、初始化、插入、删除和查找元素等，是迈向编程之路的重要一步。然而，仅仅停留在基础层面，远远无法挖掘出map的全部潜力。在实际的工程项目里，面对复杂多变的业务需求和日益增长的数据量，深入理
四. go 常见数据结构实现原理之 map 苹果香蕉西红柿 #二.Go 常见数据结构实现原理数据结构 golang 哈希算法
目录一.基础hash的基本方案二.map初始化创建map的底层结构hmapbucket桶桶的细节总结minTopHash与是否迁移extra一些重要的常量标志初始化三.插入数据存储数据时key的定位策略四.查询数据五.删除六.扩容扩容策略与扩容大小扩容与数据迁移源码七.总结map底层结构相关问题总结初始化底层总结插入数据底层总结查询数据底层总结扩容底层总结常见问题一.基础在go基础入门十一map集
Golang map m0_67393686 java golang java 数据结构后端 apache
前言哈希表是一种巧妙并且实用的数据结构。它是一个无序的key/value对的集合，其中所有的key都是不同的，然后通过给定的key可以在常数时间复杂度内检索、更新或删除对应的value。在Go语言中，一个map就是一个哈希表的引用，map类型可以写为map[K]V，其中K和V分别对应key和value。map中所有的key都有相同的类型，所有的value也有着相同的类型，但是key和value之间
【go基础】4.基本数据结构之map 喝醉的小喵 go语言原理 golang 数据结构哈希算法后端
目录哈希表map-主要思想-特点-哈希函数-数据结构-map初始化-mapvalue为什么不能寻址-map为什么是无序的-map为什么是o(1)的-开发时应注意的哈希表map理解Golang哈希表Map的原理|Go语言设计与实现彻底理解GolangMap-知乎-主要思想1、桶map的底层存储结构式hmap,里面有一个桶数组，所有kv都是存在这些桶里的，每个桶的结构是bmap每个桶中最多可以存8个k
C#基础-区分数组与集合 yi碗汤园 C#开发语言 c#前端
目录区分数组与集合1.定义1）数组2）集合2.大小1）数组2）集合3.访问速度1）数组2）集合4.内存管理1）数组2）集合5.使用场景1）数组2）集合总结本篇文章来学习一下C#的数组（Array）与集合（Collection），数组和集合是两种常用的数据结构，均为引用类型，下面通过定义、大小、访问速度等方面比较数组和集合的不同，来进一步加深对它们的理解。区分数组与集合1.定义1）数组①数组是固定大
map数据结构在Golang中是无序的，并且键值对的查找效率较高的原因
map，map在Go语言中是无序的，是因为在Go语言中，map基于哈希表实现，它的遍历顺序依赖于哈希表内部存储状态，对并发编程的潜在影响包括可能引发数据一致性问题，也就是并发度写实易导致读到不一样的数据或遍历出错；还会导致结果可重复性的问题，即每次运行程序得到的依赖遍历顺序的计算结果可能不同。map的键值对查找效率高是由于：（1）哈希表的时间复杂度，哈希表的平均复杂度为O（1），最欢情况下为O（n
C#集合：从基础到进阶的全面解析阿蒙Armon C#继续学习 c#windows linux
C#集合：从基础到进阶的全面解析在C#编程中，集合是处理数据集合的核心工具。无论是存储一组对象、实现缓存机制，还是处理复杂的数据结构，都离不开集合的灵活运用。本文将全面深入地探讨C#集合体系，从基础概念到高级技巧，帮助开发者掌握集合的精髓，写出更高效、更优雅的代码。一、集合概述与分类C#集合框架是.NET类库的重要组成部分，它提供了一系列用于存储和操作数据的类和接口。与数组相比，集合具有动态扩容、
基于 Python 的图书管理系统（源码）
摘要：本论文详细阐述了利用Python语言开发一个简易图书管理系统的过程。该系统具备图书信息录入、删除、修改、查询以及借阅管理等核心功能，可有效提升图书管理的效率与便捷性。通过阐述系统的需求分析、设计思路、代码实现及测试过程，展示了Python在小型管理系统开发中的应用潜力，为相关领域的软件开发提供了有益参考。关键词：Python编程；图书管理系统；数据结构；代码实现一、引言（一）研究背景随着数字
SQL 索引与日志知识点详解及练习题
索引和日志在数据库的高效运行和数据安全中扮演着重要角色。下面我们详细梳理索引和日志的相关知识，并通过练习题加深理解。一、知识点梳理（一）索引基本概念：索引是为了加速查询的数据结构，其数据结构为B+树。B代表Balance（平衡），数据保存在叶子结点中。分类主键索引：唯一标识一行，不允许为空，一张表只能有一个主键。唯一索引：标识一行，允许为空，一张表可以有多个唯一索引。普通索引：允许重复和空值。联合
数据结构顺序表(2)---顺序表的实现
1.顺序表的实现为了能够实现顺序表这一个数据结构，小编是分别分为三个文件编写完成的。分别是一个头文件（.h），一个实现文件(.c)，一个测试文件(.c)。以下对这三个模块（头文件、顺序表实现文件、测试文件）的代码，按功能模块、函数逻辑等进行详细解释，帮助理解动态顺序表的完整实现：1.1头文件（SeqList.h）头文件（SeqList.h)——接口定义与类型声明:#include#include#
二叉搜索树（BST）海绵宝宝的好伙伴数据结构算法 c++
二叉搜索树（BinarySearchTree,BST），也称为二叉排序树，是一种重要的数据结构。它将树形结构的灵活性与有序性结合起来，使得查找、插入和删除等操作的平均时间复杂度都能达到O(logN)。二分搜索算法，其底层逻辑恰好对应在一棵隐形的二叉搜索树上的查找过程。例如，对有序数组[0,5,24,34,41,58,62,64,67,69,78]进行二分搜索，其过程完全可以可视化为在一棵以58（中
字典树前缀匹配 hi error.cn 经验分享
字典树前缀匹配什么是字典树（Trie）字典树（Trie），又称单词查找树或键树，是一种有序树结构的数据结构，常用于字符串关联查找的应用场景中。其主要特点是每个节点代表一个字符，并且从根到子节点的路径上的字符连起来构成所有在字典中的前缀。由于这种特性，字典树特别适合进行前缀匹配和自动补全等操作。字典树的基本结构字典树由节点（Node）和边（Edge）组成。每个节点表示一个字符或为空终结符，而边则代表
初阶数据结构之栈的实现 CodePracticer 数据结构数据结构开发语言笔记
前言：实现栈之前，先来了解一下什么是栈。1.栈的概念栈是一种特殊的线性表，只允许在固定一端插入和删除操作，进行数据插入和删除操作的一端称为栈顶，另一端称为栈底。栈中的数据元素遵守先进后出，后进先出LIFO（LastInFirstOut）的原则。压栈：栈的插入操作叫做进栈（压栈，入栈），入数据在栈顶。出栈：栈的删除操作叫做出栈，出数据也在栈顶。2.栈的底层结构如何选择现在我们已经了解了栈的结构特性了
STL之无序关联式容器&针对于自定义类型的操作宛西南浪漫戈命 STL c++算法数据结构 stl
关联式容器包括：unordered_set、unordered_multiset、unordered_map、unordered_multimap四种。它们的底层使用的数据结构都是哈希表。要学习它们的使用，也可以从：初始化、遍历、查找、插入、删除、针对自定义类型等方面进行学习。但是首先需要学习关于哈希表的几个概念：哈希函数、哈希冲突、解决哈希冲突的方法、装载因子(装填因子、负载因子)哈希相关概念哈
【Rust日报】使用Rust开发分布式系统的经验教训
Fjall-一个安全Rust的KV存储引擎Fjall是一个可嵌入的基于LSM的forbid-unsafeRust键值存储引擎。它的目标是成为一个可靠且可预测但性能优异的通用KV存储引擎，适用于小型数据集，尤其是大于内存大小的数据集。我刚刚发布了1.0版本，该版本稳定了其数据格式，适用于所有未来的1.x.x版本。它的设计受到了LevelDB/RocksDB架构的重大影响，并且通常具有相似的性能。它具
Pydantic 保姆级教程：Python 数据验证与设置管理的终极指南 JJJ@666 基础知识(Python)python Pydantic 数据验证设置管理库
Pydantic是一个强大的Python库，主要用于数据验证和设置管理。它通过Python类型注解来定义数据结构，并自动提供数据验证、序列化和文档生成功能。本教程将带你从基础到高级全面掌握Pydantic。核心概念Pydantic的核心是模型(Model)，它类似于Python的数据类(dataclass)，但提供了更多功能：类型验证：自动验证输入数据的类型数据转换：自动将输入数据转换为正确的类型
【Zephyr开发实践系列】06_存储块设备驱动开发（Nand Flash） jz-炸芯片的zero Zephyr实践开发驱动开发单片机嵌入式硬件 linux iot mcu 物联网
文章目录前言一、Flash驱动模型介绍1.1核心基础应用API（必须）1.2高级功能应用API（可选）1.3设置数据结构1.4硬件初始化1.5设备实例化二、数据结构定义2.1获取Flash块与页大小三、核心API函数实现3.1擦除函数3.2读取函数3.3写入函数4.4layout函数4.5坏区检测函数总结前言在嵌入式系统中，常见的Flash存储模块根据接口类型和用途可分为NOR、NAND、EMMC
升本计算机知识点多怎么记笔记,2017人大计算机帮助提升考研答题技巧的经验... Joanne zz 升本计算机知识点多怎么记笔记
2017人大计算机帮助提升考研答题技巧的经验很多同学对于计算机考研不清楚怎么复习，在这里凯程老师系统介绍一下高效率复习，供同学们参考。计算机专业的专业课都是统考408-计算机学科专业基础综合，包含计算机组成原理、数据结构、操作系统、计算机网络。凯程老师从每年的试题来看，风格都完全不一样，不深入理解计算机系统是很难考出好成绩的。所以凯程老师建议大家需要尽早复习计算机的专业课。每年的真题都非常灵活，所
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found