InnoDB存储引擎表的逻辑存储结构

1.索引组织表:
    在InnoDB存储引擎中,表都是按照主键顺序组织存放的,这种存储方式的表称为索引组织表,在innodb存储引擎表中,每张表都有主键,如果创建的时候没有显式定义主键,则InnoDB会按照如下方式选择或者创建主键:
 1). 首先判断表中是否有非空的唯一索引,如果有,则该列就为主键。
 2).   如果不符合上述条件,则innodb会自动创建一个6字节大小的指针 
如果表中有多个非空唯一索引时,InnoDB将选择建表时第一个定义的非空唯一索引为主键,通过_rowid可以显示表的主键,但是只能查看单个列作为主键的情况,对于多列组成的主键则不可以。
 
2.InnoDB逻辑存储结构
   所有数据都会被逻辑的存放在一个空间中,称为表空间,表空间由段(segment)、区(extent)、页(page)组成,页有时候也成为块(block)。
     表空间:
            所有数据都存放在表空间,默认情况下有个共享表空间ibdata1,如果启用了参数innodb_file_per_table,则每张表的数据可以单独放到一个表空间中(默认为96kb),但是只存放一定的数据(数据、索引和插入缓冲bitmap页),其他的数据还是存放在共享表空间中,因此在启用这个参数后,共享表空间的大小还是会不断增大,而且innodb存储引擎不会在事务执行rollback时去收缩这个表空间,会判断这些信息是否还需要,不需要则标为可用空间供下次使用。
    段(segment):表空间由各个段组成,常见的段有数据段(B+树的叶子节点)、索引段(B+树的非叶子节点)、回滚段等,
                               存储引擎中对段的管理是自身完成的。
     区(extent): 区是由连续页组成的空间,任何情况下每个区的大小都为1MB,为了保证区中页的连续性,innodb一次从磁盘申请4-5个区,默认情况下innodb页的大小为16kb,即一个区有一共有64个连续的页。从innodb1.0.x版本开始引入压缩页,即每个页的大小可以通过参数KEY_BLOCK_SIZE设置为2K、4k、8k。innodb1.2.x版本开始新增参数innodb_page_size可以将默认页的大小设置为4k、8k,但是页中的数据库不是压缩。
              其中包含一个问题就是用户启用了innodb_file_per_table参数后,创建的表默认大小是96kb,但是区中是64个连续的页,创建的表的大小应该至少是1MB才对,因为在每个段开始时,先用32个页大小的碎片页来存放数据,使用完之后才申请64个连续页,为了节省磁盘容量的开销。
   页(page): 页是innodb磁盘管理的最小单位,默认每个页的大小为16KB,常见的页有:数据页、undo页、系统页、事务数据页、插入缓冲位图页等,
    行:每个页存放的行记录最多允许存放16kb/2-200行记录,
3.innodb行记录格式:
         innodb存储引擎中的记录是以行的形式存储的,这意味着页中保存着一行行的数据,在innodb1.0.x之前,提供了compact和redundant两种格式存放行记录数据,
   3.1. compact行记录格式:
          mysql5.0以后引入,为了高效的存储数据,一个页中存放的行数据越多,性能越高,其存储方式为:
 InnoDB存储引擎表的逻辑存储结构_第1张图片

 首部是一个非NULL变长字段长度列表,长度最大不超过2字节,第二部分是null标志位,指示该行数据是否含有null值,有就用1表示,记录头信息固定占用5字节(40位),最后就是实际存储每列的数据,特别注意,null不占用该部分任何空间,除了占用null标志位,还有就是每行数据除了用户自定义的以外,还包含隐藏列,事务id列和回滚指针列,分别是6字节和7字节的大小 ,如果没有主见,每行还会增加一个6字节的rowid列。
3.2. redundant行记录格式:
       是mysql5.0版本之前的行记录存储方式,之后仍然支持这个格式是为了兼容之前版本的页格式,其存储方式如下:
InnoDB存储引擎表的逻辑存储结构_第2张图片


 首部是一个字段长度偏移列表,也是按照列的顺序逆序放置的,第二部分记录头信息占用6字节,最后就是实际存储的每列的数据,

3.3. 行溢出树据
        innodb存储引擎可以将一条记录的某些数据存储在真正的数据页面之外,一般将blob、lob这类的大对象列类型的存储会把数据存放在数据页面之外,但是,这种理解有点偏差,可以将varchar列数据类型存放为行溢出数据,mysql数据库的varchar类型可以存放65535字节,但是实际上并不会存放65535字节,其中还有别的开销,实际只能存放65532字节,而且官方定义的65535长度是指所有varchar列的长度总和,如果列的长度总和超过这个长度,依然无法创建。
       Innodb存储引擎的数据都是存放在页类型的B-tree node中,但是当发生行溢出时,数据存放在页类型为uncompress BLOB页中,实际上只有768字节的前缀数据保存在数据页中,之后是偏移量,指向行溢出页(uncompress BLOB page),那么就引出多长的varchar是保存在单个数据页中,从多长开始保存在BLOIB页呢?思考:innodb是索引组织的,也就是B+ tree的结构,这样每个页中至少有两条行记录(否则就失去了B+ tree的意义,变成链表了),因此如果一个页只能存放一条记录,那么innodb存储引擎会自动将行数据存放在溢出页中,
3.4  compressed和dynamic格式
       inndob1.0.x开始引入新的文件格式,以前支持的compact和redundant格式称为antelope文件格式,新的文件格式称为barracuda文件格式,barracuda文件格式拥有两种新的行记录格式:compressed和dynamic格式。
    新的行记录格式对于存放在BLOB中的数据采用了完全的行溢出方式,在数据页中只存放20字节的指针,实际的数据都存放在off page中(不同于compact和redundant格式会存放768个前缀字节),
      compressed还有一个功能 就是存放在其中的数据会以zlib的算法进行压缩,因此对于BLOB、text这类大长度数据能够进行非常有效的存储。

3.5 char的行结构存储
      存储固定长度的字符类型,mysql4.1版本开始char(N)中的N指的是字符的长度,而不是之前的字节的长度,因此在不同的字符集下,char类型对应的列内部存储的可能不是定长的数据,因此对于多字节字符编码的char类型的存储,innodb在内部将其视为变长字符类型,

4.innodb数据页结构
  由以下7个部分组成:
      file header(文件头):定长 38字节
      page header(页头):56字节,用来记录数据页的状态信息,0x45BF表示数据页,
      infimum和supermum records:
               在每个数据页中有两个虚拟的行记录,用来限定记录的边界,infimum记录是比该页中任何主键都要小的值,supermum records是比任何可能大的值还要大的值,这两个值在页创建时被建立,并且任何情况下不会被删除,在两种不同的行记录格式下所占字节数不同。
      user records(用户记录,即行记录)和free space(空闲空间): 
              free space是链表数组结构,在一条记录被删除后,该空间就会被加入到空闲链表中     
      page directory(页目录):
                存放了页的相对位置,这些记录指针有时候也称为槽或者目录槽,在Innodb中,并不是每条记录拥有一个槽,innodb的槽是一个稀疏目录,即一个槽可能包含多个记录,当记录被删除或者被插入时,需要对槽进行分裂或平衡的维护操作,
      file trailer(文件结尾信息):定长 8字节    
              为了检测页是否已经完整写入了磁盘

你可能感兴趣的:(数据库)