前言:本文是自己的阅读《Mysql技术内幕——InnoDB存储引擎》的笔记,主要是为了将阅读和实践结合起来,途中会穿插自己的理解及自己工作中的实践。我理解阅读一本经典的书,无论是技术书籍还是生活数据,带着目的去读,知道书讲得是什么,并且结合自己的理解,输出一定的文字。
本篇文章主要详细介绍数据在表中是如何组织和存放的,表是特定实体的数据集合。
本文主要目录如下
在Innodb存储引擎中,数据在表中是按照主键的顺序存储的。如果没有显示的定义主键,则会按照如下方式选择或者创建主键:
下面是Innodb存储的整体结构
整体从高往低依次是:
表 —— 段 —— 区 —— 页
Innodb存储引擎逻辑结构的最高层,所有的数据都存放在表空间中。可以为每个表建立一个独立的表空间,也可以多个表共享一个表空间,一切取决于是否启用了innodb_file_per_table
。但是即使启用了该参数,向undo 信息,插入缓冲索引页、系统事务信息、二次写缓冲等信息还是会存放到共享表空间中。
常见的段有数据段、索引端、回滚段。
数据段:即为B+树的叶子节点。
索引段:为B+树的非叶子节点。
区是由连续页组成的空间,在任何情况下区的大小都是1M,默认情况下存储引擎页大小为64k,也就是说一个区中有63个连续的页。
当然也可以通过参数innodb_page_size
来指定页的大小。
注意:Innodb为了节省空间,对于小表或者零碎的undo字段,刚开始是用32页大小的碎片页去存储,只有碎片页用完了,才去申请64个连续的页空间。
页是Innodb磁盘管理的最小单位,默认情况下每个页的大小为16k。
其中页又分为很多种,比如
Innodb存储引擎数据是按照行存放。
Innodb提供两种存储行记录的方式Compact和Redundant格式。
可以通过如下命令查看表的存储格式:
SHOW TABLE STATUS LIKE 'table_name'\G;
Innodb1.0之后开始引入新的文件格式,compressed
和Dynamic
。
记住char存储的是字符的大小而不是字节的个数
该部分主要介绍页结构的组成,篇幅过长,本人也没有完全吃透,不在此处班门弄斧了。
Innodb本身提供以下几种约束:
为什么需要约束?
保证实体的完整性。
怎么创建或者查找约束
创建的方式如下:
CREATE TABLE `orders` (
`order_num` int(11) NOT NULL AUTO_INCREMENT,
`order_date` datetime NOT NULL,
`cust_id` int(11) NOT NULL,
-- 在创建表的时候设置约束
PRIMARY KEY (`order_num`)
) ENGINE=InnoDB AUTO_INCREMENT=20010 DEFAULT CHARSET=utf8;
-- 方法2
ALTER TABLE orders ADD UNIQUE KEY uk_id_or (order_num);
约束是一个逻辑的概念,保证数据实体的唯一性;索引是一个数据结构,既有逻辑的概念,同时在数据库中还代表物理存储的方式。
分区是将一个大的表分割成一些小的表关于管理。
如何查看当前数据库是否开启了分区呢?
SHOW VARIABLES LIKE '%partition%'\G;
Mysql数据库支持的分区类型:
如果一个表中存在主键或者唯一索引时,分区列必须是唯一索引的一部分。
用主键或者唯一索引的一部分来区分,如果id < x
,则划分为partition1
; id > x
,则划分为partition2
。
用途一般用于日期的分区:比如订单表按照年分区等。
CREATE TABLE t (
a int
) ENGINE=INNODB
PARITION BY list(b)(
PARITION p0 values less than (10),
PARITION p0 values less than (20)
);
主要针对于离散的元素进行分区。
比如
CREATE TABLE t (
a int,
b int
) ENGINE=INNODB
PARITION BY list(b)(
PARITION p0 values in (1,3,5,7,9),
PARITION p0 values in (2,4,6,8),
);
系统自动的帮我们计算分到哪个区,只需要定义好相应的函数即可。
CREATE TABLE t_hash(
a int ,
b datatime
) engine=Innodb
partition by hash(year(b)),
paritionts 4;
分区时,如何处理NULL值呢?
Mysql默认将null值视为小于任何的一个非null值。也就说当做是最小的值。
该部分主要讲解了,数据在表中是如何存储的,内部的结构是如何组成的,以及约束,分区的介绍。个人感觉这部分整体属于一个比较深层次的内容,推荐读者(如果真的有读者看的话)去看看《Mysql技术内幕-Innodb存储引擎》。