每个客户端连接都会在服务器进程中拥有一个线程,该连接的所有查询只会在这个单独线程中执行。5.5版本后提供一个API来支持线程池插件。
锁
并发问题一般是通过实现一个由两种类型的锁组成的锁系统来解决问题,这两种类型的锁通常被称为共享锁(读锁)和排他锁(写锁)。读锁是共享的,也就是说同一时刻多个客户读取同一个资源将互不干扰;写锁时排他的,就是说只有一个客户在写入,且写入的时候必须防止其他用户读取正在写入的资源。
需要调整自己的锁策略,来在特定的应用场景下提供更好的性能(平衡并发性以及锁开销),而不是仅仅简单的使用行级锁,而MySQL的多个存储引擎都会自己的锁策略和锁粒度。
事务
事务的ACID特性。
事务的四种隔离级别:
未提交读:事务的修改对其他事务都是可见的,可能带来脏读
提交读:大多数数据库支持,事务只能看见已提交的事务所做的修改,这个级别也叫不可重复读,即两次执行同样的查询可能得到不同结果
可重复读:MySQL默认的事务隔离级别,解决了脏读,保证同一个事务多次读取同样的结果是一致的。但是无法解决幻读。(InnoDB和XtraDB存储引擎通过MVCC解决了幻读问题)
可串行化:最高隔离级别,强制事务串行执行。
除非事务中禁用了AUTOCOMMIT,否则任何时刻都不能显式地执行LOCK TABLES,不管使用的是什么存储引擎,否则如果LOCK TABLES和事务相互影响的话情况会变得很复杂。
MVCC
MySQL大多数存储引擎实现的并不是简单的行级锁,它们一般同时实现了多版本并发控制(MVCC)。MVCC是行级锁的一个变种,很多情况下都避免了加锁,因此开销更低,大多数MVCC都实现了非阻塞的读操作,写操作也只锁定必要的行。
InnoDB的MVCC是通过在每行记录后面保存两个隐藏的列来实现的,这两个列一个保存了行的创建时间,一个保存了行的过期时间即版本号,事务开始的系统版本号会作为事务版本号,用来和查询到的每行记录的版本号进行比较,来达到一定的隔离级别。
这样做可以使大多数读操作可以不用加锁,可以使得读操作简单且性能好,并且保证只会读取到符合标准的行。不足之处在于每行记录都需要额外的存储空间,需要做更多的行检查工作以及一些额外的维护工作。
MVCC只在提交读和可重复读两个隔离级别下工作,其他两个隔离级别都与MVCC不兼容。
存储引擎
使用.frm文件保存表的定义。
InnoDB存储引擎数据存储在表空间中;采用MVCC来支持高并发并实现了四个标准的隔离级别,并且使用间隙锁来防止出现幻读(间隙锁使得不仅仅锁定查询涉及的行,还会对索引中的间隙进行锁定,防止幻影行的插入);基于聚簇索引建立的,其对主键查询有很高的性能,但其二级索引必须包含主键列,所以表上索引过多的话主键必须尽可能小;内部优化很多,包括磁盘可预测性预读、内存中创建hash索引加速读、增加插入缓冲区等。
MyISAM存储引擎在只有只读数据,小表和可容忍修复操作的表依然可以使用。将表存储在两个文件中,数据文件(.MYD)和索引文件(.MYI);可以包含动态和静态行,动态行可处理的数据量默认是256TB,需要调节指针长度来实现调节数据量大小(通过修改表的MAX_ROWS和AVG_ROW_LENGTH选项的值来实现);对于不再修改的表可以使用压缩表提升查询性能。
其他存储引擎:
Archive引擎:只支持插入和查询,不是一个事务型引擎,而是对高速插入和压缩做了优化,每次查询都需要全表扫描,适用于日志和数据采集类应用。
Blackhole引擎:没有实现任何存储机制,会丢弃所有插入数据,不做任何保存,不推荐的引擎。
CSV引擎:可以将普通CSV文件(逗号分隔值的文件)作为MySQL的表来处理,不支持索引,可作为一种数据交换的机制。
Federated引擎:是访问其他MySQL服务器的一个代理,会创建一个到远程MySQL服务器的客户端连接,然后当一个中间人的作用,但是经常带来问题,默认禁用。
Memory引擎:用于那些需要快速地访问数据,并且数据不会被修改,重启后丢失也没关系的表可以使用Memory表,该引擎因为所有数据都保存在内存中,所以比MyISAM表快一个数量级(不需要进行磁盘I/O)。Memory表重启后结构会保存但是数据将丢失。存在表级锁,并发能力低,不支持BLOB或TEXT类型的列,并且每行长度是固定的。如果MySQL在执行查询的过程中需要使用临时表来保存中间结果,内部使用的临时表就是Memory表,但是当中间结果超过表的限制时,或者含有BLOB或TEXT类型,临时表会转换成MyISAM表。
Merge引擎:MyISAM引擎的变种,是多个MyISAM表合并而来的虚拟表。但当引入分区功能后,该引擎被弃用。
NDB集群引擎:MySQL集群引擎。
除非需要用到某些InnoDB不具备的特性,并且没有其他办法可以替代,否则都应该优先选择InnoDB引擎。除非万不得已,否则建议不要混合使用多种存储引擎,否则可能带来一系列复杂问题。
转换存储引擎的方式有:ALTER TABLE(严重消耗系统I/O能力)、导出与导入(注意可能导致的数据丢失操作)、创建与查询(CREATE...LIKE,ALTER TABLE,INSERT..SELECT,数据量大时需考虑分批,必要时可加表锁来保证强一致性)