上一期我们聊了InnoDB的内存结构,那么我们这一期说一说磁盘结构。
一、前期回顾
二、InnoDB的磁盘结构
InnoDB磁盘主要包含Tablespace(表空间),Data Dictionary数据字典,Doublewrite Buffer(双写缓冲区)、redo log(重做日志) 和undo log(撤销日志)
2.1 表空间
用于存储表结构和数据。表空间又分为系统表空间、独立表空间、 通用表空间、临时表空间、Undo表空间等多种类型
2.1.1系统表空间(The System Tablespace)
系统表空间:系统表空间是存放change buffer的区域,Change Buffer是缓存那些不在buffer pool里的辅助索引的变化的特殊数据结构。在磁盘上,Change Buffer是system tablespace(系统表空间)的一部分,当数据库宕机时,索引的变更会被缓冲到磁盘的Change Buffer区域
如果表是在系统表空间中创建的,而不是单表单文件表空间或常规表空间,则系统表空间中还会保存表和索引的数据。
在早期的MySQL版本中,系统表空间包含InnoDB数据字典。在MySQL 8.0中,InnoDB数据存储在MySQL数据字典中
系统表空间可以有一个或多个数据文件,默认情况下,有一个单独的数据文件被创建在数据目录下,名称为:iddata1
MySQL8开始删除了原来的frm文件,并采用 Serialized Dictionary Information (SDI), SDI是MySQL8.0重新设计数据词典后引入的新产物,并开始已经统一使用InnoDB存储引擎来存储表的元数据信息。SDI信息源记录保存在ibd文件中
2.1.2 独立表空间(File-Per-Table Tablespaces)
默认开启,独立表空间是一个单表表空间,该表创建于自己的数据文件中,而非创建于 系统表空间中。当innodb_file_per_table选项开启时,表将被创建于表空间中。否则, innodb将被创建于系统表空间中。每个表文件表空间由一个.ibd数据文件代表,该文件 默认被创建于数据库目录中。表空间的表文件支持动态(dynamic)和压缩 (commpressed)行格式
2.1.3通用表空间(General Tablespaces)
是使用CREATE TABLESPACE语法创建的共享InnoDB表空间,和系统表空间类似,也是共享的表空间,一个文件能够存储多个表数据。
通过CREATE TABLESPACE创建的共享表空间
2.1.4 Undo表空间(Undo Tablespaces)
撤销日志又叫回滚表空间,用来保存回滚日志,即undo logs。记录数据更改前的快照(感觉就是备份),在数据需要回滚就可以根据undo log恢复。
那些undo log 记录关于在global temporary tablespace 的用户临时表的回滚信息,不会在回滚中恢复。
该表空间有rollback segments,rollback segments是用于存 undo log segments, 而undo log segments存的就是undo logs。
mysql启动的时候,默认初始两个undo tablespace。因为sql执行前必须要有rollback segments。而两个undo tablespace才支持automated truncation of undo。
truncating undo tablespaces
2.1.5 临时表空间(emporary Tablespaces)
InnoDB把 Temporary Tablespaces分为两种,session temporary tablespaces 和global temporary tablespace。
session temporary tablespaces存储的是用户创建的临时表和内部的临时表,一个session最多有两个表空间(用户临时表和内部临时表)。
global temporary tablespace储存用户临时表的回滚段(rollback segments )。
2.1.6 数据字典
InnoDB数据字典由内部系统表组成,这些表包含用于查找表、索引和表字段等对象的元数 据。元数据物理上位于InnoDB系统表空间中。由于历史原因,数据字典元数据在一定程度上 与InnoDB表元数据文件(.frm文件)中存储的信息重叠。
2.2 双写缓冲区(Doublewrite Buffer)
双写缓冲区是系统表空间中的一个存储区域。InnoDB在将从缓冲池中刷新的页面写入数据文件中的适当位置之前,将它们写入其中。只有在刷新页面并将其写入doublewrite缓冲区之后,InnoDB才会将页面写入其正确的位置。如果在页面写入过程中出现操作系统、存储子系统或mysqld进程崩溃,InnoDB可以在崩溃恢复期间从doublewrite缓冲区中找到页面的一个好副本。
尽管数据总是写两次,但doublewrite缓冲区不需要两倍的I/O开销或两倍的I/O操作。数据作为一个大的连续块写入doublewrite缓冲区,只需对操作系统进行一次fsync()调用。
在大多数情况下,默认情况下启用双写缓冲区。要禁用doublewrite缓冲区,请将 innodb_doublewrite设置为0。
如果系统表空间文件(“ibdata文件”)位于支持原子写入的Fusion io设备上,则会自动禁用doublewrite缓冲,并对所有数据文件使用Fusion-io原子写入。由于doublewrite缓冲区设置是全局的,因此也会对驻留在non-Fusion-io 硬件上的数据文件禁用doublewrite缓冲。此功能仅在 Fusion-io硬件上受支持,并且仅在Linux上为Fusion-io NVMFS启用。为了充分利用这一特性,建议将innodb_flush_method设置为O_DIRECT。
2.3 重做日志(Redo Log)
重做日志是一种基于磁盘的数据结构,用于在崩溃恢复期间更正不完整事务写入的数据。记录的DML操作的日志,可以用来宕机后的数据前滚。(在log buffer的redo log日志会在宕机中丢失)
要更改重做日志文件的数量或大小,请执行以下步骤:
停止MySQL服务器并确保它在没有错误的情况下关闭。
编辑my.cnf以更改日志文件配置。要更改日志文件大小,请配置innodb_log_file_size。
要增加日志文件的数量,请配置innodb_log_files_in_group。
重新启动MySQL服务器。
如果InnoDB检测到 innodb_log_file_size 与重做日志文件大小不同,它将写入日志检查点,关闭并删除旧的日志文件,以请求的大小创建新的日志文件,并打开新的日志文件。
Group Commit for Redo Log Flushing
与任何其他符合ACID的数据库引擎一样,InnoDB在提交事务之前刷新该事务的重做日志。InnoDB使用组提交功能将多个这样的刷新请求分组在一起,以避免每次提交都有一个刷新。对于组提交,InnoDB向日志文件发出一次写操作,以对几乎同时提交的多个用户事务执行提交操作,从而显著提高吞吐量。
好了,以上就是InnoDB的底层结构有关所有的了。更细节的东西可能需要大家自己在查查资料,翻翻文档去学习下了。本篇关于InnoDB的结构就说到这里。
下一篇,我们说一说MySQL的核心算法——LRU算法
(ps:可以说是核心吧!!,感觉必问的。(* ̄︶ ̄)……)
…………………………………分割线……………………………
不积跬步,无以至千里;不积小流,无以成江海。
关注我,每天分享一些小知识点。分享自己的小心得,包含但不限于初、中、高级面试题呦!!!
我都墨迹这么半天了 ,你不点关注,不点赞,不收藏,还不转发,你想干啥!!!!