Mysql的几个灵魂拷问（一）

开发对于数据库的了解可不能局限于CURD，数据库的技能复杂度也不是仅仅写几个复杂的sql语句，这个Mysql系列就是对数据库由浅到深的总结。

一、基础概念

myisam 和 innodb的区别吗？

myisam引擎是5.1版本之前的默认引擎，支持全文检索、压缩、空间函数等，但是不支持事务和行级锁，所以一般用于有大量查询少量插入的场景来使用，而且myisam不支持外键，并且索引和数据是分开存储的。系统奔溃后，MyISAM恢复起来很困难。

innodb是基于聚簇索引建立的，和myisam相反它支持事务、外键，并且通过MVCC来支持高并发，索引和数据存储在一起。

说了很多，最需要记住的InnoDB不同于MyISAM最大的两个特点就是：一是支持事务，二是支持行锁；毋庸置疑，因为这两个特性大部分都采用InnoDB引擎，其中的支持行锁就是InnoDB适合多并发优势所在，这个在第三篇锁和事务会重点讲到的。

mysql的索引有哪些，聚簇和非聚簇索引又是什么？

索引按照数据结构来说主要包含B+树和Hash索引。

主键索引的叶子节点存的是整行数据。在 InnoDB 里，主键索引也被称为聚簇索引（clustered index）。
非主键索引的叶子节点内容是主键的值。在 InnoDB 里，非主键索引也被称为二级索引（secondary index）。

聚簇索引查询相对会更快一些，因为主键索引树的叶子节点直接就是我们要查询的整行数据了。而非主键索引的叶子节点是主键的值，查到主键的值以后，还需要再通过主键的值再进行一次查询（这个过程叫做回表, 也就是查了两个索引树）。

什么是覆盖索引和回表吗？

回表就是先通过数据库索引扫描出数据所在的行，再通过行主键id取出索引中未提供的数据，即基于非主键索引的查询需要多扫描一棵索引树。

如果一个索引包含（或者说覆盖）所有需要查询的字段的值，我们就称之为“覆盖索引”。我们知道InnoDB存储引擎中，如果不是主键索引，叶子节点存储的是主键+列值。最终还是要“回表”，也就是要通过主键再查找一次。这样就会比较慢覆盖索引就是把要查询出的列和索引是对应的，不做回表操作！

而要确定一个查询是否是覆盖索引，我们只需要explain sql语句看Extra的结果是否是“Using index”即可。

最左前缀原则

对多个字段同时建立的索引(有顺序，ABC，ACB是完全不同的两种联合索引。)以联合索引(a,b,c)为例，建立这样的索引相当于建立了索引a、ab、abc三个索引。

所以在建立联合索引的时候，如何安排索引内的字段顺序？
这里我们的评估标准是，索引的复用能力。因为可以支持最左前缀，所以当已经有了 (a,b) 这个联合索引后，一般就不需要单独在 a 上建立索引了。因此，第一原则是，如果通过调整顺序，可以少维护一个索引，那么这个顺序往往就是需要优先考虑采用的。

索引下推

MySQL 5.6引入了索引下推优化，可以在索引遍历过程中，对索引中包含的字段先做判断，过滤掉不符合条件的记录，减少回表字数。

如果没有索引下推优化（或称ICP优化），当进行索引查询时，首先根据索引来查找记录，然后再根据where条件来过滤记录；在支持ICP优化后，MySQL会在取出索引的同时，判断是否可以进行where条件过滤再进行索引查询，也就是说提前执行where的部分过滤操作，在某些场景下，可以大大减少回表次数，从而提升整体性能

二、Mysql架构与原理

Mysql的架构图

Server层四大组件：连接器，解析器，优化器和执行器。
存储引擎层负责数据的存储和提取。其架构模式是插件式的，支持 InnoDB、MyISAM

Mysql的数据更新流程

1、加载磁盘文件到buffer Pool中；
2、更新数据之前，写入旧数据到undo日志，便于回退；
3、更新内存中的buffer pool数据；
4、将更新部分的redo log写入到redo log buffer中；
5、redo日志刷入磁盘
6、binlog日志刷入磁盘
7、将binlog文件和位置写入到redo日志文件中，并写入commit。
8、后台的IO线程某个时间随机将buffer pool中的脏数据同步到磁盘文件。

Mysql架构这一部分已经在另外一篇博客里Mysql篇之架构设计做了详细的讲解了。