MySql分层结构:
1.MySQL中InnoDB与MyISAM的区别:
a.InnoDB引擎是MySql的默认引擎(从5.5.8版本开始),支持事务,采用行级锁,支持外键,默认非锁定读,其设计主要作为OLTP(Online Transaction Processing,即在线事务处理)的应用。
b.MyISAM引擎不支持事务和表锁设计,但支持全文索引,主要面向OLAP(Online Analytical Processing,即在线分析处理)。
2.InnoDB的体系结构
2.1.后台线程
主要负责刷新内存池中的数据,保存缓存池中的内存缓存的是最近的数据,还负责将修改的数据文件刷新的磁盘文件,同时保证数据库发生异常的情况下mysql能够恢复到正常运行状态。
2.1.1 Master Thread
作为核心后台线程,Master Thread 负责缓冲池中的数据异步刷新到磁盘,保证数据的一致性。
Master Thread的演进:
1.InnoDB 1.0.*之前
算法结构
public void masterThread() {
while(true) {
for(int i=0;i<10;i++) {
/**
1.将重做日志缓存刷到磁盘里的重做日志文件,即使事务还没有提交;
2.合并插入缓存(以当前1秒内IO次数是否小于5为界限,小于5在执行);
3.刷最多100个脏页到磁盘(脏页比例是否超过设置的阀值);
4.如果当前没有用户活动,则切换到background循环中。
*/
do thing per second;
Thread.sleep(1000*1);
}
/**
1.刷100个脏页到磁盘(在10秒内IO次数小于200次的情况下);
2.合并最多5个插入缓存;
3.将日志缓冲刷到磁盘;
4.删除无用的undo页;
5.刷100个或10个脏页到磁盘(当脏页比例大于70%时刷100个脏页,否则刷10个脏页)
*/
do thing per 10 seconds;
}
}
background循环:
1.删除无用的undo页;
2.合并20个插入缓冲;
3.调回到主循环
2.InnoDB 1.2.*之前
通过分析InnoDB 1.0.*版本,我们知道InnoDB采用硬编码的方式实现,InnoDB 1.2.*版本支持用户来自定义IO吞吐量,通过innodb_io_capacity参数来设置,这样就适应了高性能和低性能的磁盘,另外还有innodb_max_dirty_pages_pct来设置脏页在缓冲池的百分比。另外还可以配置innodb_adaptive_flushing和innodb_purge_batch_size可以设置。
3.InnoDB 1.2.*:
算法结构:
if(innodb is idle) {
do 10秒间隔的操作
} else {
do 1秒间隔的操作
}
另外,对于刷脏页的操作,innoDB从Master Thread 分离出了单独线程Page Cleaner Thread,减轻了Master Thread的工作。
2.1.2 IO Thread
InnoDB大量使用了Async IO 来处理IO请求,极大的提高了数据库性能,IO Thread主要负责这些IO请求的回调(call back)。
2.1.3 Purge Thread
当事务被提交之后,其所使用的undolog就不再需要了,Purge Thread主要负责回收这些undo数据所占用的空间。
2.1.4 Page Cleaner Thread
主要负责脏页(即缓冲池中的页和磁盘中的页数据不一致)的刷新操作,减轻Master Thread的负担,提高引擎性能。
2.2.内存
2.2.1 缓冲池
缓存为了解决CPU和磁盘之间速度的鸿沟,来提高基于磁盘的数据库系统的整体性能。针对数据库页的修改,InnoDB则先修改缓冲池中的页,然后再以一定的频率刷新到磁盘上,而不是每次页有修改就刷新到磁盘上。
2.2.2 重做日志缓冲
InnoDB首先将重做日志信息放入到缓冲区,然后按照一定的频率将其刷新到外部磁盘的重做日志文件。一般情况下1秒刷新就会刷新一次,因此重做日志缓冲缓冲的大小不需要很大,8MB基本都能够满足。在下列三种情况下会刷新重做日志缓冲到外部磁盘的重做日志文件:
a.Master Thread 每秒将重做日志缓冲刷新到重做日志文件;
b.每次事务提交时会将重做日志缓冲刷新到重做日志文件;
c.当重做日志缓冲剩余空间小于1/2时,将重做日志缓冲刷新到重做日志文件。
2.2.3 额外内存池
在InnoDB引擎中,对数据进行内存分配时,首先充额外的内存池中进行申请,当该区域的内存不够时,才会从缓冲池中申请。
2.3 CheckPoint(检查点)技术
为了协调CPU和磁盘速度的鸿沟,因此页的操作都是在缓冲池中进行的。若每一次的页变化都将其刷新到磁盘中,那么开销巨大。InnoDB在事务提交时,采用先写重做日志,再修改页,这样系统宕机时,可以通过重做日志来恢复,而不会导致数据丢失。CheckPoint实现了在数据库宕机时,不需要重做所有日志,因为在CheckPoint之前的数据都已经刷到了磁盘里,故数据库只需要对CheckPoint之后的重做日志进行恢复即可,这样极大地缩短了恢复时间,同样也减少了重做日志所占的磁盘空间(只需要保存CheckPoint之后的重做日志)。
CheckPoint刷数据的两种方式:
a.Sharp CheckPoint 每次发生数据库关闭时,将所有脏页刷到磁盘,对数据库可用性产生很大影响。
b.Fuzzy CheckPoint 每次发生数据库关闭时,将部分脏页刷到磁盘,而不是所有脏页。
2.4 InnoDB特性
2.4.1 插入缓存(Insert Buffer)
针对非聚集索引的更新和插入操作(要求是非聚集索引,且索引不是unique的,因为数据库不去查找索引页来判断插入记录的唯一性),不是每次都是直接插入到索引页中,而是先判断插入的非聚集索引页是否在缓冲池中,如果在,则直接插入;否则先放到一个Insert Buffer对象中,然后再以一定的频率和情况将Insert Buffer对象和非聚集索引叶子节点的进行合并(即多步合成一步),大大提高了非聚集索引的插入性能。缺点:遇到段时间内大量写的情况,Insert Buffer会占用使用过多的缓冲池空间,影响性能,如果此时宕机,会导致大量的Insert Buffer对象中的数据,没有合并到非聚集索引中,影响系统恢复效率。
Insert Buffer也是由一个B+树构成,MySql 4.1版本之后,每个数据库实例只有一个Insert Buffer对象。
2.4.2 两次写(Double Write)
在对系统重做日志前,用户需要一个页的副本,当写入失败时,先通过副业来还原对应的页,再执行重做日志。补充了重做日志只对页进行操作的粗粒度的弊端。
2.4.3 自适应Hash索引(Adaptive Hash Index)
Hash算法在不冲突的情况下,时间复杂度为O(1),效率明显高于B+树。InnoDB通过监控表上的索引页的查询,如果监控到通过建立Hash索引可以带来速度提升,则InnoDB会通过缓冲池的B+树页来构造,创建Hash索引,不需要人为控制调整,故称为自适应Hash索引。
2.4.4 异步IO(Asynchronous IO)
InnoDB中,read ahead方式的读取都是通过AIO实现的,另外脏页的刷新(写入到磁盘)也是由AIO完成。
3.数据存储
说明:
namespace表空间:所有数据都保存在namespace中,如果innodb_file_per_table停用(默认停用),所有的数据保存在共享表空间ibdata1中;innodb_file_per_table启用,每张表的表空间存放的有数据、索引和插入缓存Bitmap页数据,其他如回滚undo信息,插入缓存索引页,系统事务信息,二次写缓冲等还是保存在共享表空间ibdata1中。
segment段:namespace由segment构成,常见的有数据段(B+树的叶子节点),索引段(B+树的非叶子节点),回滚段等。segment由Innodb自动管理,DBA无法管理。
extent区:segment由extent构成,extent由连续的page组成的空间,大小都是1MB,不可设置。
page页:page是InnoDB磁盘管理的最小单位,默认大小为16KB,可设置。
row行: MySQL数据按行存放,即数据库中的一条数据记录。
4.事务(Transaction)
4.1 事务的特性:
原子性(Atomicity):由redo log和undo log实现;
一致性(Consistency):由undo log实现;
隔离性(Isolation):由锁实现;
持久性(Durability):由redo log实现。
4.2 事务隔离级别:
1.RU(Read UnCommitted) 读未提交;
2.RC(Read Commited) 不可重复读;
3.RR(Repeatable Read) 可重复读;
4.Serializable 串行化。
4.3 分布式事务:
分布式事务指允许多个独立的事务资源(Transactional Resources,如一个事务涉及到一个是MySQL,一个是Oracle,还有一个SQLServer)参与到一个全局事务中。
MySQL通过XA事务来支持分布式事务,XA事务允许不同数据库之间的分布式事务。在分布式事务时,InnoDB的事务隔离级别必须是最高级别,即Serializable 串行化。
分布式事务采用两段式提交(two-phase commit)方式:
第一阶段:所有参与全局事务的节点都开始准备,然后告诉事务管理器他们准备好提交了。
第二阶段:事务管理器告诉资源管理器执行commit或者rollback,如果任何一个节点显示不能commit,则所有节点都被告知需要rollback。
备注:应避免循环commit,自动commit和自动rollback。
5.索引
InnoDB支持的索引有:
5.1 B+(Balance+)树索引
B+树是平衡二叉树的扩展,B+树索引不能够找到一个给定键值的具体行,B+树索引找到的知识查找数据行所在的页(即InnoDB进行磁盘管理的最小单位,默认为16K),让后数据库把页读入到内存,再在内存中进行查找,最后得到要查找的数据。
在数据库中,B+树的一般高度都在2~4层,太高了会影响查询性能,毕竟搜索到每一层都需要IO。一般千万级别的数据量3层就足够了,如果数据量超过千万级别,那么最好的方式还是分库分表。
5.1.1 聚集索引
聚集索引(clustered index)按照每张表的主键构造一颗B+树,同时叶子节点(又称数据页)存放的即为整张表的行记录数据(注意:聚集索引的存储是逻辑上连续的,而不是物理上连续的),即叶子节点上保存了完整的每行的记录,而在非叶子节点中存放的只有键值和指向子节点的偏移量,每个聚集索引的叶子节点都通过一个双向链表连接。 因为叶子节点只能按照一颗B+树进行排序,因此每张表只能够创建一个聚集索引。
聚集索引和主键的关系与区别:
关系:
a.如果一个表定义了主键,那么这个主键就是聚集索引;
b.如果表没有定义主键,那么该表的第一个唯一非空索引作为聚集索引;
c.如果没有主键和唯一非空索引,那么innodb内部会生成一个隐藏的主键作为聚集索引(隐藏主键是一个6字节的自增列)。
区别:
属性 | 主键 | 聚集索引 |
---|---|---|
个数 | 一个表可以创建多个主键 | 一个表只能创建一个聚集索引 |
是否允许为NULL | 不可以 | 可以 |
是否要求唯一 | 要求 | 不要求,可以通过单独设置为否限制唯一 |
自增主键的优缺点:
优点:速度快,数字型空间小,数据库可以自己控制主键自动增长;
缺点:插入指定ID的数据时,很难保证主键冲突;分库和分表情况下,自增主键将是一个很大的挑战。
5.1.2 非聚集索引
非聚集索引的叶子节点并不包含行记录的所有数据,叶子节点包含了键值和书签(书签告诉InnoDB哪里可以找到与索引相应的行数据,即相应行数据的聚集索引键),因此效率和聚集索引没法比,几乎耗时是聚集索引的两倍,不过一张表上可以创建多个非聚集索引。
5.1.3 Cardinality值
Cardinality值表示索引中不重复记录的预估值,不是一个准确值,因为为了不影响数据库性能,Cardinality值是通过采样获得的。当Cardinality/Table_total_count值越大(最大值为1),B+树索引创建的价值越大;当值很小时,没有必要创建B+索引。
5.2 全文检索
为解决SQL的like '%XXX%' 不走索引的问题,MySQL使用了倒排索引(和Elastic Search一样),从MySQL 5.7.6开始已经支持中文了,但只能在CHAR、VARCHAR或者TEXT的字段上创建全文索引,而且要使用相同的字符集和排列规则,且每张表只能有一个全文索引。
正式由于这些问题,所以搜索很难达到Elastic Search的性能,故很少使用MySql的全文检索。
6.锁
锁用来管理对共享资源的并发访问,从而提供数据的完整性和一致性。
锁的类型:
共享锁:允许事务读一行数据;
排它锁:允许事务删除或更新一行数据。
行锁的算法:
1.Record Lock 单个行记录上的锁,总是锁住索引记录,如果没有索引,则锁定隐式主键;
2.Gap Lock 间隙锁 锁定一个范围,但不包含记录本身;
举例来说,假如student表中只有1001条记录,其student_id的值分别是1,2,...,1000,1001,下面的SQL:
SELECT * FROM student WHERE student_id > 1000 FOR UPDATE
是一个范围条件的检索,InnoDB不仅会对符合条件的student_id值为1001的记录加锁,也会对student_id大于101的“间隙”加锁,虽然这些记录并不存在。
3.Next-Key Lock 即Record Lock + Gap Lock 锁定一个范围,并包含记录本身。
6.1 脏读
脏读是指在不同的事务环境下,当前事务可以读到其他事务未提交的数据。
6.2 不可重复读
不可重复读是指在一个事务内,多次读取同一个数据集合,得到的结果集不一样(其他事务同时在做修改这个结果集包含的内容,并且已经commit)
6.3 幻读
幻读是指一个事务内,在前后两次范围查询(不是等于,如where age > 20)的时候,后一次查询看到了前一次查询没有看到的数据。
产生幻读的原因是,行锁只能够锁住行,但是针对插入数据这个动作,更新的是已有记录的间隙中,为解决幻读,MySql引入了间隙锁。
6.4 间隙锁(Next Key锁)
当我们的sql执行范围查询并请求共享锁或者排它锁的时候,InnoDB会给符合条件的已有数据记录的索引项加锁,对于健值在条件范围内但不存在的记录,称为间隙。InnoDB对间隙加的锁,称为间隙锁。间隙锁一方面解决了幻读,满足了隔离级别的要求;另一方面满足了恢复和复制的需要。
间隙锁的使用会导致符合条件范围的数据插入的阻塞,使用不当为导致严重的锁等待,因此在实际开发中,应避免使用范围条件,特别是并发较高的场景。
6.5 MVCC (Multi-Version Concurrency Control)
MySQL InnoDB通过版本号MVCC(Multi-Version Concurrency Control)实现事务隔离,实现可重复度,MVCC实现方式中,每行数据记录含有隐藏的两列数据
DATA_TRX_ID:事务的id,长度为6Byte
DATA_ROLL_PTR:表示回滚指针,指向该行回滚段 (rollback segment)的指针,长度为7 Byte,记录改行数据的所有未提交的旧版本数据,在undo中都通过链表的形式存储。
具体规则如下:
a.select情况:
InnoDB只会查找版本小于或者等于当前事务版本的数据行(即行的系统版本小于或等于事务的系统版本号),这样确保了事务读取的行是当前事务开始之前已经存在的行,或者是事务自己自身插入或者修改的行。
b.insert情况:
InnoDB为新插入的每一行记录保存事务的id作为DATA_TRX_ID的值。
c.delete情况:
InnoDB为删除的每一行记录保存事务的id作为DATA_TRX_ID的值,回滚指针指向旧的版本数据。
d.update情况:
InnoDB为新插入的每一行记录保存当前系统的版本号作为行版本号,同时保存当前系统版本号到原来的行作为行删除标示。
6.6 丢失更新
6.7 死锁
死锁是指两个或两个以上事务在执行过程中,因为相互争夺共享资源而造成的一种互相等待的现象。
解决死锁的方式:
1.超时阀值设置;
2.通过等待图来主动死锁检测,如果等待图中存在回路,就代表存在死锁。;
7 主从复制
MySQL主从复制的步骤:
+a.Master把数据修改记录保存到二进制日志binary log中;
+b.Slave把Master的binary log日志copy到自己的中继日志replay log中;
+c.Slave重做中继日志,将更改作用到自己的数据库上,以达到主从数据的最终一致性。
7.1复制的方式
a.基于SQL语句的复制
Master记录那些更改数据的SQL到日志文件,Slave获取该SQL日志文件,然后再执行一遍Master执行过的SQL。
优点:
实现简单,主从数据传输量很小,占用带宽很少。如果出现问题可以很好的根据SQL语句去定位。
缺点:
更新必须是串行的,另外,Master和Slave执行SQL的时间和环境不同,会出现Master执行成功,Slave执行失败的问题,而且错误具有累积性。如果在使用触发器或者存储过程,最好不要使用基于SQL的复制模式。
b.基于行的复制
Master将实际数据记录保存到Binary log中,Slave获取该Binary log文件,然后更改对应的数据行。
优点:
使用场景广,可以正确的复制每一行,错误不具有累加性。
缺点:
针对一次修改数据量很大的情况,该方法会保存大量的Binary log数据,给Master和复制造成很大的负载,影响数据库性能。由于没有记录SQL语句,出现问题后,无法判断是那些SQL导致的问题。
c.折中
MySQL能够在这两种复制模式间动态切换,默认情况下使用基于SQL语句的复制,如果发现SQL语句无法正确的复制,就切换到基于行的复制模式。
7.2 复制的常见问题
Master过大的包,过大的复制延迟,受限的宽带,磁盘空间,主从系统配置不一样,加锁引起的锁争用,数据损坏,以及不确定性更改(update ... limit 5)等问题。
8 MySql缓存
缓存的问题:
1.开启缓存之后,每次select开始之前先检查是否命中缓存,带来性能问题,特别是缓存命中率不高的情况时;
2.select结果被缓存时,也带来性能开销;
3.某个表被写入时,改表的所有缓存都会失效;
4.join操作会导致缓存失效;
5.事务也影响mysql缓存,在事务commit之后,数据才能够缓存。
9 MySql实践问题
9.1 varchar(n)保存数据长度问题
MySql 4.0 之前的版本
n指的是n个字节,如果存放utf-8格式只能保存 (n / 3)个汉字,即如果varchar(20) 那么只能保存6个汉字;
MySql 5.0 之后的版本
n指的是n个字符,如果存放utf-8格式,那么无论是数字,字母还是汉字,都可存放n个,即如果varchar(20) 那么可以保存20个汉字(自己亲测可以);
gbk类型:
varchar(n)中每个字符最多占2个字节,最大长度不能超过(65535 / 2);
utf-8类型:
varchar(n)中每个字符最多占3个字节,最大长度不能超过(65535 / 3);