存储引擎:可以看作是数据表存储数据的一种格式,不同的格式具有的特性也各不相同。
举例说明:只有InnoDB存储引擎支持事务、外键、行级锁等特性,而MyISAM则支持压缩机制等特性。
存储引擎的特点:本身是MySQL数据库服务器的底层组件之一,最大的特点是采用“可插拔”的存储引擎架构。
“可插拔”的理解:指的是对正在运行的MySQL服务器依然可根据实际需求使用特定语句加载(插入,INSTALL PLUGIN语句)或卸载(拔出,UNINSTALL PLUGIN语句)所需的存储引擎文件。
SHOW ENGINES;
执行以上SQL语句,运行的结果中含有6个字段。.
Engine (存储引擎)、Support (是否支持)
Comment (注释说明)、Transactions (是否支持事务)
XA (是否支持分布式事务)和Savepoints ( 是否支持事务的保存点设置)
InnoDB存储引擎:在MySQL 5.7版本中被指定为默认的存储引擎。
特性:是MySQL中第一个提供外键约束的表引擎,尤其对事务处理的能力,是MySQL其他存储引擎无法与之比拟的。
优势:用于完成事务、回滚、崩溃修复和多版本并发控制的事务安全处理。
缺点:读写效率一般。
ibdata1 的位置:通常位于data目录下,与数据库文件处于同级目录。
ibdata1 的作用:集中存储数据和索引。
设置数据表的独立表空间文件:全局变量innodb_ file_ _per_ table
。
#查看默认是否共用同一个表空间文件.
SHOW VARIABLES LIKE 'innodb_file_per_table';
#开启每个表独立的表空间文件
SET GLOBAL innodb_file_per_table=ON;
MyISAM存储引擎:在MySQL5.5以前的版本中是MySQL的默认存储引擎。
特性:是基于ISAM存储引擎发展起来的,不仅解决了ISAM的很多不足,还增加了很多有用的扩展。例如,数据的全文索引、压缩与加密、支持复制与备份的恢复等。
优势:与InnoDB相比,MyISAM的优点是处理速度快。
缺点:InnoDB相比,MyISAM的缺点是不支持事务的完整性和并发性。
MyISAM数据表的文件扩展名分别为frm、myd和myi,文件名与表名相同。
扩展名 | 功能说明 |
---|---|
frm | 用于存储表的结构 |
myd | 用于存储数据,是MYData的缩写 |
myi | 用于存储索引,是MYIndex的缩写 |
MyISAM表的数据移植非常方便,只需将数据库下表中对应的3个文件复制到另一个数据库下即可。
MRG_MYISAM存储引擎:相同MyISAM存储引擎表的集合,也被称为MERGE。
特性:所有合并的表必须具有相同顺序的字段与索引的应用。
优势:可快速拆分大型只读表,执行搜索效率更高等。
缺点:索引读取速度较慢、只针对MyISAM存储引擎的表进行合并、实际应用较少等。
MEMORY存储引擎:在是MySQL中一种特殊的存储引擎。
特性:在MEMORY存储引擎的表中,所有数据都保存在内存中,一旦程序出错或服务器断电都会导致数据的丢失。
优势:数据的处理速度快。
缺点:不适合持久保存数据,而且也不能存储太大的数据。
对读写速度快,数据量小、不需要持久保存的临时数据是理想的选择。
CSV是存储引擎:是采用文本方式存储数据的一种存储引擎,数据在文件中通过逗号分隔保存。
结构:数据表会分为后缀frm(存储表结构信息)、csv(存储表内容)和csm(存储表的状态、数据量等元数据)3个文件存储,文件名与数据表名相同。
一是不支持索引和分区,二是表中所有字段必须含有NOT NULL
属性。
ARCHIVE存储引擎:适合保存数量庞大、长期维护但很少被访问的数据。
特性:数据存储时会用zlib压缩库进行压缩,在记录被请求时会实时进行解压。
提示: ARCHIVE存储引擎仅仅支持查询和插入操作,并且因不支持数据索引,查询效率较低。
BLACKHOLE存储引擎:被称为“黑洞”存储引擎。
特性:写入的数据都会消失,就像被“黑洞”吞噬了一样。
作用:利用此特性可以将其作为转发器或过滤器。
举例:将主服务器中的大量数据经过过滤后搬到从服务器,可将BL ACKHOLE的数据表作为过滤器使用,且不会保存任何数据,但是会在二进制日志中记录下所有SQL语句,然后可复制并执行这些语句,将结果保存到从服务器中。
PERFORMANCE_SCHEMA存储引擎: MySQL .5.7中performance_ schema数据库中所有数据表的存储引擎。
特性:用户不能为数据表创建此类型的存储引擎。
作用:主要用于收集数据库服务器性能参数。
FEDERATED存储引擎:默认情况下在MySQL中不可用。
启动:利用“–federated"选项。
特性:创建从远程MySQL服务器访问数据的表,本地的FEDERATED表只保存结构信息(后缀为frm),远程服务器同时要保存结构信息和数据文件,所有的增删改查操作都通过访问远程服务器后,才将结果返回给本地的服务器。
索引:是一种特殊的数据结构,可以看做是利用MySQL提供的语法将数据表中的某个或某些字段与记录的位置建立一一个对应的关系,并按照一定的顺序排序好。
且的:就是为了快速定位指定数据的位置。
普通索引:是MySQL 中的基本索引类型,使用KEY
或INDEX
定义,不需要添加任何限制条件,作用是加快对数据的访问速度。
唯一性索引:由UNIQUE INDEX
定义,创建唯一性索引的字段需要添加唯一性约束,用于防止用户添加重复的值。
主键索引:由PRIMARY KEY
定义的一种特殊的唯一性索引, 用于根据主键自身的唯一性标识每条记录,防止添加主键索引的字段值重复或为NULL。
- 若在InnoDB表中数据保存的顺序与主键索引字段的顺序一致时,可将这种主键索引称为“聚簇索引”。一般聚簇索引指的都是表的主键
- 一张数据表中只能有一个聚簇索引。
全文索引:由FULLTEXT INDEX
定义,用于根据查询字符提高数据量较大的字段查询速度。此索引在定义时字段类型必须是CHAR、VARCHAR或TEXT中的一种,在MySQL 5.7版本中,仅MylSAM和InnoDB存储引擎支持全文索引。
空间索引:由SPATIAL INDEX
定义在空间数据类型字段上的索引,提高系统获取空间数据的效率。仅MyISAM和InnoDB存储引擎支持空间索引,还要保证创建索引的字段不能为空。
根据创建索引的字段个数,还可以将它们分为单列索引和复合索引:
#方式1: CREATE TABLE创建数据表时添加索引
CREATE TABLE数据表名(
字段名数据类型[约束条件]
...
PRIMARY KEY [索引类型] (字段列表)[索引选项],
{
INDEX|KEY} [索引名称] [索引类型] (字段列表)[索引选项],
UNIQUE [INDEXIKEY] [索引名称] [索引类型] (字段列表)[索引选项],
{FULLTEXT|SPATIAL} [INDEX|KEY] [索引名称] (字段列表)[索引选项]
)[表选项];
#方式2: ALTER TABLE向已创建的数据表添加索引
ALTER TABLE 数据表名
ADD PRIMARY KEY[索引类型] (字段列表) [索引选项]
|ADD {
INDEX|KEY} [索引名称] [索引类型] (字段列表) [索引选项]
|ADD UNIQUE [INDEX|KEY] [索引名称] [索引类型] (字段列表) [索引选项]
|ADD FULLTEXT [INDEX|KEY] [索引名称] (字段列表)[索引选项]
IADD SPATIAL [INDEX|KEY] [索引名称] (字段列表)[索引选项], ...;
#方式3: CREATE INDEX向已创建的数据表添加索引.
CREATE [UNIQUE|FULLTEXT|SPATIAL] INDEX 索引名称
[索引类型] ON 数据表名(字段列表)[索引选项][算法选项|锁选项]
索引可设置选项
索引选项 | 语法 |
---|---|
索引类型 | USING {BTREE | HASH} |
字段列表 | 字段[(长度)[ASC | DESC]] |
索引选项 | KEY_BLOCK_SIZE [=]值|索引类型| WITH PARSER解析器插件名| COMMENT ‘描述信息’ |
算法选项 | ALGORITHM [=] {DEFAULT|INPLACE|COPY} |
锁选项 | LOCK [=] {DEFAULT|NONE|SHARED\IEXCLUSIVE} |
主键索引不能设置索引名称,其他索引的名称也可以省略,默认使用建立索引的字段表示,复合索引则使用第一个字段的名称作为索引名。
字段名称 | 描述 |
---|---|
Non_unique | 索引是否可以重复,0表示不可以,1表示可以 |
Key_name | 索引的名字,如果索引是主键索引,则它的名字为PRIMARY |
Seq_in_index | 建立索引的字段序号值,默认从1开始 |
Column_name | 建立索引的字段 |
Collation | 索引字段是否有排序,A表示排序,NULL表示没有排序 |
Cardinality | 计算MySQL连接时使用索引的可能性(精确度不高),值越大,可能性越高 |
Sub_part | 前缀索引的长度,如3,若字段值都被索引则为NULL |
Index_type | 索引类型,可选值有BTREE、FULLTEXT、 HASH、RTREE |
Comment | 索引字段的注释信息 |
Index_comment | 创建索引时添加的注释信息 |
字段名称 | 描述 |
---|---|
id | 查询标识符,默认从1开始,若使用了联合查询,则该值依次递增,联合查询结果对应的该值为NULL |
select_ type | 操作类型,如DELETE、UPDATE等,但是当执行SEL ECT语句时,它的值有多种,如SIMPLE表示不需联合查询或简单的子查询。 |
table | 输出数据的表 |
partitions | 匹配的分区 |
type | 连接的类型,如const使用了主键索引或唯一性索引,ref表示使用前缀索引或条件中含有运算符“=”或“<=>”等 |
key_ len | 索引字段的长度 |
ref | 表示哪些字段或常量与索引比较了比较,如const表示常量与索引进行了比较 |
rows | 预计需要检索的记录数 |
filtered | 按条件过滤的百分比 |
Extra | 附加信息,如Using index表示使用了索引覆盖 |
所谓索引覆盖指的是查询的字段恰好是索引的一部分或与索引
完全一致,那么查询只需要在索引区上进行,不需要到数据区
检索数据的情况。
这种查询的的特点是速度非常快,但同时也会增加索引文件的
大小,只有此索引的使用率尽可能高的情况下,索引覆盖才有
意义。否则,在使用时应该避免此情况的发生。
主键索引在删除时,需要考虑该主键字段是否含有AUTO_INCREMENT属性,若有则需在删除主键索引前删除该属性,否则程序会报以下的错误提示信息。
#删除主键字段的AUTO_ INCREMENT属性
ALTER TABLE 数据表 MODIFY 字段名字段类型
#删除主键索引
ALTER TABLE 数据表 DROP PRIMARY KEY 或 DROP INDEX、'PRIMARY' ON 数据表
当使用DROP INDEX删除主键索引时,其后的PRIMARY由于是MySQL中的保留字,因此必须使用反引号(‘) 包裹。
删除命令:
#语法1
ALTER TABLE 数据表 DROP INDEX 索引名
#语法2
DROP INDEX 索引名 ON 数据表 [算法选项][锁选项]
简单的说,锁机制就是为了保证多用户并发操作时,能使被操作的数据资源保持一致性的设计规则。
表级锁:是MySQL中锁的作用范围( 锁的粒度)最大的一种锁。
锁定范围:是用户操作资源所在的整个数据表。
优势:有效的避免了死锁的发生,且具有加锁速度快、消耗资源小的特点。
缺陷:因其锁定的粒度大,在并发操作时发生锁冲突的概率也大。
行级锁:是MySQL 中锁的作用范围最小的一种锁。
锁定范围:仅锁定用户操作所涉及的记录资源。
优势:能减少锁定资源的竞争,较高并发处理能力,提升系统的整体性能。
缺陷:因其锁定的粒度过小,每次加锁和解锁所消耗的资源也会更多,发生死锁的可能性更高。
表级锁:根据操作的不同可以分为读锁和写锁。
读锁:表示用户读取(如SELECT
查询)数据资源时添加的锁,其他用户不可修改或增加数据资源,但是可以读取该数据资源,因此读锁也可称为共享锁。
写锁:表示用户对数据资源执行写(如INSERT、UPDATE、DELETE
等)操作时添加的锁,除了当前添加写锁的用户外,其他用户都不能对其进行读/写操作
,因此写锁也可以称为排他锁或独占锁。
MyISAM存储引擎表:是MySQL 数据库中最典型的表级锁。
“隐式”读的表级锁:当用户对MyISAM存储引擎表执行SELECT查询操作前,服务器会“自动”地为其添加-一个表级的读锁。
“隐式”写的表级锁:执行INSERT、 UPDATE、DELETE等写操作前,服务器会“自动”地为其添加一个表级的写锁。
“隐式”读的表级锁与“隐式”写的表级锁添加的优先级顺序:
表级锁语法:
LOCK TABLES 数据表名 READ [LOCAL]| WRITE,...
表级锁的问题:锁定的粒度大,多用户访问会造成锁竞争,降低并发处理能力。
从数据库优化的角度来考虑:尽量减少表级锁定时间,提高多用户的并发能力。.
如何释放“显式”表级锁: UNLOCK TABLES语句
。
InnoDB存储引擎的锁机制相对于MyISAM存储引擎的锁复杂一些。
InnoDB存储引擎既有表级锁又有行级锁。
InnoDB表级锁的应用与MyISAM表级锁的相同。
“隐式”行级排他锁:当用户对InnoDB存储引擎表执行INSERT、UPDATE、DELETE
等写操作前,服务器会“自动”地为通过索引条件检索的记录添加行级排他锁。
“隐式”行级排他锁要如何解锁:直到操作语句执行完毕,服务器再“自动”地为其解锁。
“隐式”行级排他锁的生命周期:语句的执行时间可以看作是“隐式”行级锁的生命周期,且该生命周期的持续时间–般都比较短暂。
延长“隐式”行级排他锁的生命周期:通常情况下,若要增加行级锁的生命周期,最常使用的方式是事务处理,让其在事务提交或回滚后再释放行级锁,使行级锁的生命周期与事务的相同。
对于InnoDB表来说,若要保证当前事务中查询出的数据不会被其他事务更新或删除,利用普通的SELECT语句是无法办到的,此时需要利用MySQL提供的“锁定读取”的方式为查询操作显式的添加行级锁。
SELECT 语句 FOR UPDATE|LOCK IN SHARE MODE
# FOR UPDATE:表示在查询时添加行级排他锁
# LOCK IN SHARE MODE:表示在查询时添加行级共享锁
用户在向InnoDB表显式添加行级锁时,InnoDB存储引擎首先会“自动”地向此表添加一个意向锁,然后再添加行级锁。
默认当InnoDB处于REPEATABLE READ
(可重复读)的隔离级别时,行级锁实际上是一个next-key
锁,它是由间隙锁(gap lock
)和记录锁(record lock
)组成。
record lock
)就是前面讲解的行锁。gap lock
)指的是在记录索引之间的间隙、负无穷到第1个索引记录之间或最后1个索引记录到正无穷之间添加的锁。分表技术: 将单张数据表根据不同的需求进行拆分,从而达到分散单表压力的目的,提升数据库的访问性能。
水平分表:将一张数据表中的全部记录分别存储到多张数据表中,因此水平分表在创建时,必须保证各数据表涉及到的字段全部相同。
水平分表使单张表的数据能够保持在一定的量级。
垂直分表:将同一个业务的不同字段分别存储到多张数据表中,因此垂直分表在创建时,各数据表仅通过一个字段进行连接,其他字段都不相同。
分区技术:就是在操作数据表时可以根据给定的算法,将数据在逻辑上分到多个区域中存储。在分区中还可以设置子分区,将数据存放到更加具体的区域内。
CREATE TABLE 数据表名称
[(字段与索引列表)][表选项]
PARTITION BY 分区算法(分区字段)[PARTITIONS分区数量]
[SUBPARTITION BY子分区算法(子分区字段)[SUBPARTITIONS子分区数量]]
[(
PARTITION分区名[VALUES值][其他选项][(SUBPARTITION 子分区名 [其他选项])],
...
)];
分区是在表选项后添加PARTITION BY实现。
一个表最多仅可以创建1024个分区。
分区算法有4种,分别为LIST、RANGE、HASH和KEY。
分区创建完成后,会在数据文件data/mydb目录下看到对应的分区数据文件
p_list#p#p1.idb
p_list#p#p2.idb
使用HASH算法为p_hash表创建了3个分区,分区文件的序号默认从0开始,当有多个分区时依次递增加1。例如,以上创建的分区序号依次为0、1和2。
#已创建的数据表没有创建分区,添加分区的方式
ALTER TABLE数据表名称PARTITION BY分区算法...;
#已创建的数据表含有分区,添加分区的方式
#LIST或RANGE分区
ALTER TABLE数据表名称ADD PARTITION (分区选项,..;, .
#HASH或KEY分区
ALTER TABLE数据表名称PARTITIONS 数量;
#删除HASH、KEY分区
ALTER TABLE数据表名称COALESCE PARTITION数量;
#删除RANGE、LIST分区
ALTER TABLE数据表名称DROP PARTITION分区名称; .
- 删除HASH与KEY算法分区时,会将该分区内的数据重新整合到剩余的分区。
- 删除RANGE与LIST算法分区时,会同时删除分区中保存的数据。
- 当数据表的分区仅剩一个时,不能通过以上的方式删除,只能利用
DROP TABLE
的方式删除表。
若在开发中仅要清空各分区表中的数据,不删除对应的分区文件,可以使用以下的语句实现。
ALTER TABLE 数据表名称 TRUNCATE PARTITION{分区名称|ALL}
在MySQL数据库中,DELETE
删除一条记录时,仅删除了数据表中保存的数据,而记录占用的存储空间会被保留。
长期删除数据、添加数据的过程中,索引文件和数据文件都将产生“空洞”,形成很多不连续的碎片,造成数据表占用空间变大,但表中记录数却很少的情况发生。
修复数据表的数据及索引碎片时,会把所有的数据文件重新整理一遍。因此,若数据表的记录数比较大,也会消耗一定的资源,所以不能频繁的对数据碎片进行维护,可根据实际的情况按周、月或季度等进行操作。.