Mysql2020最新教程(高级部分)之存储引擎与简单的sql优化

一   Mysql的体系结构概览

Mysql2020最新教程(高级部分)之存储引擎与简单的sql优化_第1张图片

 整个MySQL Server由以下组成

Connection Pool : 连接池组件

Management Services & Utilities : 管理服务和工具组件

SQL Interface : SQL接口组件

Parser : 查询分析器组件

Optimizer : 优化器组件

Caches & Buffers : 缓冲池组件

Pluggable Storage Engines : 存储引擎

File System : 文件系统

二  存储引擎概述 

和大多数的数据库不同, MySQL中有一个存储引擎的概念, 针对不同的存储需求可以选择优的存储引擎。 存储引擎就是存储数据,建立索引,更新查询数据等等技术的实现方式 。存储引擎是基于表的,而不是基于库的。 所以存储引擎也可被称为表类型。
Oracle,SqlServer等数据库只有一种存储引擎。MySQL提供了插件式的存储引擎架构。所以MySQL存在多种存储 引擎,可以根据需要使用相应引擎,或者编写存储引擎。
MySQL5.0支持的存储引擎包含 : InnoDB 、MyISAM 、BDB、MEMORY、MERGE、EXAMPLE、NDB Cluster、 ARCHIVE、CSV、BLACKHOLE、FEDERATED等,其中InnoDB和BDB提供事务安全表,其他存储引擎是非事务安 全表。

可以通过指定 show engines , 来查询当前数据库支持的存储引擎 :

Mysql2020最新教程(高级部分)之存储引擎与简单的sql优化_第2张图片
创建新表时如果不指定存储引擎,那么系统就会使用默认的存储引擎,MySQL5.5之前的默认存储引擎是 MyISAM,5.5之后就改为了InnoDB。 查看Mysql数据库默认的存储引擎 , 指令 :

 show variables like '%storage_engine%' ; 

Mysql2020最新教程(高级部分)之存储引擎与简单的sql优化_第3张图片

三  各种存储引擎特性 
 

Mysql2020最新教程(高级部分)之存储引擎与简单的sql优化_第4张图片

 InnoDB 

 InnoDB存储引擎是Mysql的默认存储引擎。InnoDB存储引擎提供了具有提交、回滚、崩溃恢复能力的事务安全。 但是对比   MyISAM的存储引擎,InnoDB写的处理效率差一些,并且会占用更多的磁盘空间以保留数据和索引。

事务控制

Mysql2020最新教程(高级部分)之存储引擎与简单的sql优化_第5张图片

外键约束

MySQL支持外键的存储引擎只有InnoDB , 在创建外键的时候, 要求父表必须有对应的索引 , 子表在创建外键的 时候, 也会自动的创建对应的索引。

在创建索引时, 可以指定在删除、更新父表时,对子表进行的相应操作,包括 RESTRICT、CASCADE、SET NULL 和 NO ACTION。 RESTRICT和NO ACTION相同, 是指限制在子表有关联记录的情况下, 父表不能更新;
CASCADE表示父表在更新或者删除时,更新或者删除子表对应的记录; SET NULL 则表示父表在更新或者删除的时候,子表的对应字段被SET NULL 。

外键信息可以使用如下两种方式查看 :

show create table city_innodb  

Mysql2020最新教程(高级部分)之存储引擎与简单的sql优化_第6张图片

存储方式
InnoDB 存储表和索引有以下两种方式 :

①. 使用共享表空间存储, 这种方式创建的表的表结构保存在.frm文件中, 数据和索引保存在 innodb_data_home_dir 和 innodb_data_file_path定义的表空间中,可以是多个文件。
②. 使用多表空间存储, 这种方式创建的表的表结构仍然存在 .frm 文件中,但是每个表的数据和索引单独保存在 .ibd 中。 

 MyISAM 

 MyISAM 不支持事务、也不支持外键,其优势是访问的速度快,对事务的完整性没有要求或者以SELECT、INSERT 为主的应用   基本上都可以使用这个引擎来创建表 。

文件存储方式
每个MyISAM在磁盘上存储成3个文件,其文件名都和表名相同,但拓展名分别是 :

.frm (存储表定义);

.MYD(MYData , 存储数据);

.MYI(MYIndex , 存储索引);

MEMORY 
Memory存储引擎将表的数据存放在内存中。每个MEMORY表实际对应一个磁盘文件,格式是.frm ,该文件中只 存储表的结构,而其数据文件,都是存储在内存中,这样有利于数据的快速处理,提高整个表的效率。MEMORY 类型的表访问非常地快,因为他的数据是存放在内存中的,并且默认使用HASH索引 , 但是服务一旦关闭,表中的 数据就会丢失。

MERGE 
MERGE存储引擎是一组MyISAM表的组合,这些MyISAM表必须结构完全相同,MERGE表本身并没有存储数据,对 MERGE类型的表可以进行查询、更新、删除操作,这些操作实际上是对内部的MyISAM表进行的。 对于MERGE类型表的插入操作,是通过INSERT_METHOD子句定义插入的表,可以有3个不同的值,使用FIRST 或 LAST 值使得插入操作被相应地作用在第一或者后一个表上,不定义这个子句或者定义为NO,表示不能对这个 MERGE表执行插入操作。

 存储引擎的选择 

在选择存储引擎时,应该根据应用系统的特点选择合适的存储引擎。对于复杂的应用系统,还可以根据实际情况选 择多种存储引擎进行组合。以下是几种常用的存储引擎的使用环境。

InnoDB : 是Mysql的默认存储引擎,用于事务处理应用程序,支持外键。如果应用对事务的完整性有比较高 的要求,在并发条件下要求数据的一致性,数据操作除了插入和查询意外,还包含很多的更新、删除操作, 那么InnoDB存储引擎是比较合适的选择。InnoDB存储引擎除了有效的降低由于删除和更新导致的锁定, 还 可以确保事务的完整提交和回滚,对于类似于计费系统或者财务系统等对数据准确性要求比较高的系统, InnoDB是合适的选择。

MyISAM : 如果应用是以读操作和插入操作为主,只有很少的更新和删除操作,并且对事务的完整性、并发 性要求不是很高,那么选择这个存储引擎是非常合适的。

MEMORY:将所有数据保存在RAM中,在需要快速定位记录和其他类似数据环境下,可以提供几块的访问。 MEMORY的缺陷就是对表的大小有限制,太大的表无法缓存在内存中,其次是要确保表的数据可以恢复,数 据库异常终止后表中的数据是可以恢复的。MEMORY表通常用于更新不太频繁的小表,用以快速得到访问结 果。

MERGE:用于将一系列等同的MyISAM表以逻辑方式组合在一起,并作为一个对象引用他们。MERGE表的优 点在于可以突破对单个MyISAM表的大小限制,并且通过将不同的表分布在多个磁盘上,可以有效的改善 MERGE表的访问效率。这对于存储诸如数据仓储等VLDB环境十分合适。

三   优化SQL步骤 

在应用的的开发过程中,由于初期数据量小,开发人员写 SQL 语句时更重视功能上的实现,但是当应用系统正式 上线后,随着生产数据量的急剧增长,很多 SQL 语句开始逐渐显露出性能问题,对生产的影响也越来越大,此时 这些有问题的 SQL 语句就成为整个系统性能的瓶颈,因此我们必须要对它们进行优化。

查看SQL执行频率 
MySQL 客户端连接成功后,通过 show [session|global] status 命令可以提供服务器状态信息。show [session|global] status 可以根据需要加上参数“session”或者“global”来显示 session 级(当前连接)的计结果和 global 级(自数据库上次启动至今)的统计结果。如果不写,默认使用参数是“session”。
Mysql2020最新教程(高级部分)之存储引擎与简单的sql优化_第7张图片

 

Com_xxx 表示每个 xxx 语句执行的次数,我们通常比较关心的是以下几个统计参数。
 

Mysql2020最新教程(高级部分)之存储引擎与简单的sql优化_第8张图片 

定位低效率执行SQL 

可以通过以下两种方式定位执行效率较低的 SQL 语句。
慢查询日志 : 通过慢查询日志定位那些执行效率较低的 SQL 语句,用--log-slow-queries[=file_name]选项启 动时,mysqld 写一个包含所有执行时间超过 long_query_time 秒的 SQL 语句的日志文件。

show processlist : 慢查询日志在查询结束以后才纪录,所以在应用反映执行效率出现问题的时候查询慢查询 日志并不能定位问题,可以使用show processlist命令查看当前MySQL在进行的线程,包括线程的状态、是否 锁表等,可以实时地查看 SQL 的执行情况,同时对一些锁表操作进行优化。
 

 Mysql2020最新教程(高级部分)之存储引擎与简单的sql优化_第9张图片

1) id列,用户登录mysql时,系统分配的"connection_id",可以使用函数connection_id()查看
 
2) user列,显示当前用户。如果不是root,这个命令就只显示用户权限范围的sql语句
 
3) host列,显示这个语句是从哪个ip的哪个端口上发的,可以用来跟踪出现问题语句的用户
 
4) db列,显示这个进程目前连接的是哪个数据库

5) command列,显示当前连接的执行的命令,一般取值为休眠(sleep),查询(query),连接 (connect)等
 
6) time列,显示这个状态持续的时间,单位是秒
 
7) state列,显示使用当前连接的sql语句的状态,很重要的列。state描述的是语句执行中的某一个状态。一 个sql语句,以查询为例,可能需要经过copying to tmp table、sorting result、sending data等状态 才可以完成
 
8) info列,显示这个sql语句,是判断问题语句的一个重要依据


explain分析执行计划 

通过以上步骤查询到效率低的 SQL 语句后,可以通过 EXPLAIN或者 DESC命令获取 MySQL如何执行 SELECT 语句 的信息,包括在 SELECT 语句执行过程中表如何连接和连接的顺序。 

 Mysql2020最新教程(高级部分)之存储引擎与简单的sql优化_第10张图片

 explain 之 id 

id 有相同,也有不同,同时存在。id相同的可以认为是一组,从上往下顺序执行;在所有的组中,id的值越 大,优先级越高,越先执行

 explain 之 select_type 

Mysql2020最新教程(高级部分)之存储引擎与简单的sql优化_第11张图片

 explain 之 table 

 展示这一行的数据是关于哪一张表的
 explain 之 type 

 type 显示的是访问类型,是较为重要的一个指标

Mysql2020最新教程(高级部分)之存储引擎与简单的sql优化_第12张图片

结果值从好到坏以此是:

NULL > system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL
 
 system > const > eq_ref > ref > range > index > ALL

 一般来说, 我们需要保证查询至少达到 range 级别, 好达到ref 

 explain 之 key 

possible_keys : 显示可能应用在这张表的索引, 一个或多个。 
 
key : 实际使用的索引, 如果为NULL, 则没有使用索引。
 
key_len : 表示索引中使用的字节数, 该值为索引字段大可能长度,并非实际使用长度,在不损失精确性的前 提下, 长度越短越好 。

 explain 之 rows 

扫描行的数量。

 explain 之 extra 
其他的额外的执行计划信息,在该列展示 。
Mysql2020最新教程(高级部分)之存储引擎与简单的sql优化_第13张图片

 show profile分析SQL 

 Mysql从5.0.37版本开始增加了对 show profiles 和 show profile 语句的支持。show profiles 能够在做SQL优化时 帮助我们了解时间都耗费到哪里去了。
通过 have_profiling 参数,能够看到当前MySQL是否支持profile:
默认profiling是关闭的,可以通过set语句在Session级别开启profiling:
 

Mysql2020最新教程(高级部分)之存储引擎与简单的sql优化_第14张图片

 

 

 

 

 

你可能感兴趣的:(mysql,数据库,sql)