mysql索引

MySQL索引

概念

  • 索引是一个排序的列表,在这个列表中存储着索引的值和包含这个值的数据所在行的物理地址
  • 使用索引后可以不用扫描全表来定位某行的数据,而是通过索引表找到该行数对应的物理地址然后访问相应的数据
  • 索引好比是一本书的目录,可以根据目录中的页码快速找到所需的内容
  • 索引是表中一列或者若干列值排序的方法
  • 建立索引的目的是加快对表中记录的查找或排序

作用

  • 设置了合适的索引之后,数据库利用各种快速定位技术,能够大大加快查询速度,这是创建索引的最主要原因
  • 当表很大或查询涉及到多个表时,使用索引可以成千上万倍地提高查询速度
  • 可以降低数据库的IO成本,并且索引还可以降低数据库的排序成本
  • 通过创建唯一性索引,可以保证数据表中每一行数据的唯一性
  • 可以加快表与表之间的连接
  • 在使用分组和排序时,可大大减少分组和排序的时间
  • 建立索引在搜索和恢复数据库中的数据时能显著提高性能

索引的缺点

  • 索引需要占用额外的磁盘空间(对于MyISAM引擎而言,索引文件和数据文件是分离的,索引文件用于保存数据记录的地址;而InnoDB引擎的表数据文件本身就是索引文件)
  • 更新一个包含索引的表需要比更新一个没有索引的表花费更多的时间,这是由于索引本身也需要更新。因此在,理想的做法是仅仅在常常被搜索到的列(以及表)上面创建索引

创建索引的原则依据

索引虽可以提升数据库查询的数据,但并不是任何情况下都适合创建索引。因为索引本身会消耗系统资源,在有索引的情况下,数据库会先进行索引查询,然后定位到具体的数据行,如果索引使用不当,反而会增加数据库的负担

  • 表的主键,外键必须有索引。因为主键具有唯一性,外键关联的是主表的主键,查询时可以快速定位
  • 记录数超过300行的表应该有索引。如果没有索引,每次查询都需要把表遍历一遍,会严重影响数据库的性能
  • 经常与其他表进行连接的表,在连接字段上应该建立索引
  • 唯一性太差的字段不适合建立索引
  • 更新太频繁地字段不适合创建索引
  • 经常出现在where子句中的字段,特别是大表的字段,应该建立索引
  • 在经常进行GROUP BY、ORDER BY的字段上建立索引
  • 索引应该建在选择性高的字段上
  • 索引应该建在小字段上,对于大的文本字段甚至超长字段,不要建索引

索引分类和创建 

1)普通索引:最基本的索引类型,没有唯一性之类的限制
create index 索引名 on 表(字段)
alter table 表名 add index 索引名 (字段);



2)唯一索引:与普通索引类似,但区别是唯一索引列的每个值都是唯一。唯一索引允许有空值(注意和主键不同)。如果是用组合索引创建,则列值的组合必须唯一。添加唯一键将自动创建唯一索引
create unique index 索引名 on 表名 (字段);    
alter table 表名 add unique 索引名 (字段);


3)主键索引:是一种特殊的唯一索引,必须指定为"PRIMARY KEY"。一个表只能有一个主键,不允许有空值。添加主键将自动创建主键索引
alter table 表名 add primary key (字段);


4)组合索引(单列索引与多列索引):可以是单列上创建的索引,也可以是在多列上创建的索引。需要满足最左原则,因为select语句的where条件是依次从左往右执行的,所以在使用select语句查询时where条件使用的字段顺序必须和组合索引中的排序一致,否则索引将不会生效
create unique index 索引名 on 表名 (字段1, 字段2, 字段3);    
alter table 表名 add index 索引名 (字段1, 字段2, 字段3);

#select ... from 表名 where 字段1=XX and 字段2=xx and 字段3=XX 用 and 做条件逻辑运算符时,要创建组合索引且要满足最左原则 用 or 做条件逻辑运算符时,所有字段都要创建索引

5)全文索引(FULLTEXT):适合在进行模糊查询的时候使用,可用于在一篇文章中检索文本信息
create fulltext index 索引名 on 表名 (字段);       
alter table 表名 add fulltext 索引名 (字段);
 
模糊查询: select ... from 表名 where match(字段) against('查询内容');


mysql索引_第1张图片

 mysql索引_第2张图片

 mysql索引_第3张图片

 mysql索引_第4张图片

 mysql索引_第5张图片

 mysql索引_第6张图片

mysql索引_第7张图片

 mysql索引_第8张图片

mysql索引_第9张图片

mysql索引_第10张图片

查看索引
show create table 表名;
show index from 表名;
show keys from 表名;

删除索引
drop index 索引名 on 表名;
alter table 表名 drop 索引名;
alter table 表名 drop primary key;


explain select ... 可以用于分析select查询语句,看key字段,确定是否使用了索引或索引使用是否正确

MySQL 事务

1.事务的概念

●事务是一种机制、一个操作序列,包含了一组数据库操作命令,并且把所有的命令作为一个整体一起向系统提交或撤销操作请求,即这一组数据库命令要么都执行,要么都不执行。
●事务是一个不可分割的工作逻辑单元,在数据库系统上执行并发操作时,事务是最小的控制单元。
●事务适用于多用户同时操作的数据库系统的场景,如银行、保险公司及证券交易系统等等。
●事务通过事务的整体性以保证数据的一致性。
●事务能够提高在向表中更新和插入信息期间的可靠性。
 

2.事务的ACID特点

ACID,是指在可靠数据库管理系统(DBMS)中,事务(transaction)应该具有的四个特性:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability)。这是可靠数据库所应具备的几个特性。


●原子性:指事务是一个不可再分割的工作单位,事务中的操作要么都发生,要么都不发生。
事务是一个完整的操作,事务的各元素是不可分的。
事务中的所有元素必须作为一个整体提交或回滚。
如果事务中的任何元素失败,则整个事务将失败。

●一致性:指在事务开始之前和事务结束以后,数据库的完整性约束没有被破坏。
当事务完成时,数据必须处于一致状态。
在事务开始前,数据库中存储的数据处于一致状态。
在正在进行的事务中,数据可能处于不一致的状态。
当事务成功完成时,数据必须再次回到已知的一致状态。
●隔离性:指在并发环境中,当不同的事务同时操纵相同的数据时,每个事务都有各自的完整数据空间。
对数据进行修改的所有并发事务是彼此隔离的,表明事务必须是独立的,它不应以任何方式依赖于或影响其他事务。
修改数据的事务可在另一个使用相同数据的事务开始之前访问这些数据,或者在另一个使用相同数据的事务结束之后访问这些数据。
也就是说并发访问数据库时,一个用户的事务不被其他事务所干扰,各并发事务之间数据库是独立的。

●持久性:在事务完成以后,该事务所对数据库所作的更改便持久的保存在数据库之中,并不会被回滚。
指不管系统是否发生故障,事务处理的结果都是永久的。
一旦事务被提交,事务的效果会被永久地保留在数据库中。

总结:在事务管理中,原子性是基础,隔离性是手段,一致性是目的,持久性是结果

//当多个客户端并发地访问同一个表时,可能出现下面的一致性问题:
(1)脏读:当一个事务正在访问数据,并且对数据进行了修改,而这种修改还没有提交到数据库中,这时,另外一个事务也访问这个数据,然后使用了这个数据。
(2)不可重复读:指在一个事务内,多次读同一数据。在这个事务还没有结束时,另外一个事务也访问该同一数据。那么,在第一个事务中的两次读数据之间,由于第二个事务的修改,那么第一个事务两次读到的的数据可能是不一样的。这样就发生了在一个事务内两次读到的数据是不一样的,因此称为是不可重复读。(即不能读到相同的数据内容)
(3)幻读:一个事务对一个表中的数据进行了修改,这种修改涉及到表中的全部数据行。同时,另一个事务也修改这个表中的数据,这种修改是向表中插入一行新数据。那么,操作前一个事务的用户会发现表中还有一个没有修改的数据行,就好象发生了幻觉一样。
(4)丢失更新:两个事务同时读取同一条记录,A先修改记录,B也修改记录(B不知道A修改过),B提交数据后B的修改结果覆盖了A的修改结果。

//事务隔离级别的作用范围分为两种
● 全局级:对所有的会话有效
● 会话级:只对当前的会话有效

查询全局事务隔离级别
show session variables like '%isolation%';
SELECT @@global.tx_isolation;

mysql索引_第11张图片 查询会话事务隔离级别
show session variables like '%isolation%';
SELECT @@session.tx_isolation; 
SELECT @@tx_isolation;

mysql索引_第12张图片

 设置全局事务隔离级别:
set global transaction isolation level read committed;
set @@global.tx_isolation='read-committed';   #重启服务后失效

设置会话事务隔离级别:
set session transaction isolation level repeatable read;
set @@session.tx_isolation='repeatable-read';
 

 3.事务控制语句

BEGIN 或 START TRANSACTION:显式地开启一个事务。
COMMIT 或 COMMIT WORK:提交事务,并使已对数据库进行的所有修改变为永久性的。
ROLLBACK 或 ROLLBACK WORK:回滚会结束用户的事务,并撤销正在进行的所有未提交的修改。
SAVEPOINT S1:使用 SAVEPOINT 允许在事务中创建一个回滚点,一个事务中可以有多个 SAVEPOINT;“S1”代表回滚点名称。
ROLLBACK TO [SAVEPOINT] S1:把事务回滚到标记点。
 

4.使用 set 设置控制事务

SET AUTOCOMMIT=0;                        #禁止自动提交
SET AUTOCOMMIT=1;                        #开启自动提交,Mysql默认为1
SHOW VARIABLES LIKE 'AUTOCOMMIT';        #查看Mysql中的AUTOCOMMIT值

如果没有开启自动提交,当前会话连接的mysql的所有操作都会当成一个事务直到你输入rollback|commit;当前事务才算结束。当前事务结束前新的mysql连接时无法读取到任何当前会话的操作结果。
如果开起了自动提交,mysql会把每个sql语句当成一个事务,然后自动的commit。
当然无论开启与否,begin; commit|rollback; 都是独立的事务。
mysql索引_第13张图片

mysql存储引擎

1.概念

MySQL中的数据用各种不同的技术存储在文件中,每一种技术都使用不同的存储机制、索引技巧、锁定水平并最终提供不同的功能和能力,这些不同的技术以及配套的功能在MySQL中称为存储引擎。
存储引擎是MySQL将数据存储在文件系统中的存储方式或者存储格式
MySQL数据库中的组件,负责执行实际的数据I/O操作
MySQL系统中,存储引擎处于文件系统之上,在数据保存到数据文件之前会传输到存储引擎,之后按照各个存储引擎的存储格式进行存储。

2.常用的存储引擎

2.1MyISAM特点

  • 不支持事务和外键约束,占用资源较小,访问速度快,表级锁定,支持全文索引,适用于不需要事务处理,单独写入或查询的应用场景。
  • 访问速度快,对事务完整性没有要求
  • MyISAM适合查询、插入为主的应用
  • MyISAM在磁盘上存储成三个文件,文件名和表名都相同,但扩展名分别为:.fm(文件存储表结构的定义),.MYD(MYData 数据文件的扩展名),.MYI(MYIndex 索引文件的扩展名)
  • 表级锁定形式,数据在更新时锁定整个表
  • 数据库在读写过程中相互阻塞,会在数据写入的过程阻塞用户数据的读取,也会在数据读取的过程中阻塞用户的数据写入
  • 数据单独写入或读取,速度过程较快且占用资源相对较少

2.2MyISAM适用的生产场景

公司业务不需要事务的支持
单方面读取或写入数据比较多的业务
MyISAM存储引擎数据读写都比较频繁
使用读写并发访问相对较低的业务
数据修改相对较少的业务
对业务一致性要求不是非常高的业务
服务器硬件资源相对较差

2.3InnoDB特点

支持事务处理、外键约束,缓存能力较好,支持行级锁定,读写并发能力较好,5.5版本后支持全文索引,适用于一致性要求高、数据更新频繁的应用场景。
MySQL从5.5.5版本开始,默认存储引擎为InnoDB
读写阻塞与事务隔离级别相关,能非常高效的缓存索引和数据
表与主键一簇的方式存储
支持分区、表空间,类似oracle数据库
行级锁定,但是全表扫描仍然会是表级锁定
InnoDB中不保存表的行数,InnoDB需要扫描整表来计算行数,而MyISAM只要简单的读出保存好的行数即可。
对于自增长的字段,InnoDB中必须包含只有该字段的索引,但在MyISAM表中可以和其他字段一起建立组合索引
清空整个表时,InnoDB是一行行的删除,效率非常慢。MyISAM则会重建表

2.4InnoDB适用的生产场景

  • 业务需要事务支持
  • 行级锁定对高并发有很好的适应能力,但需要确保查询是通过索引来完成
  • 业务数据更新较为频繁的场景,如论坛,微博
  • 业务数据一致性要求较高,如银行业务
  • 硬件设备内存较大,利用InnoDB较好的缓存能力来提高内存利用率,减少磁盘IO的压力
     

3.MyISAM表支持的不同存储格式

3.1静态(固定长度)表

静态表是默认的存储格式。静态表中的字段都是非可变字段,这样每个记录都是固定长度的,这种存储方式的优点是存储非常迅速,容易缓存,出现故障容易恢复;缺点是占用的空间通常比动态表多。

3.2动态表

动态表包含可变字段,记录不是固定长度的,这样存储的优点是占用空间较少,但是频繁的更新、删除记录会产生碎片,需要定期执行 OPTIMIZE TABLE 语句或 myisamchk -r 命令来改善性能,并且出现故障的时候恢复相对比较困难。

3.3压缩表

压缩表由 myisamchk 工具创建,占据非常小的空间,因为每条记录都是被单独压缩的,所以只有非常小的访问开支
 

 4. 存储引擎相关命令

 

show engines;   #查看系统支持的存储引擎



查看表使用的存储引擎
方法1:
show table status from 库名 where name='表名'
 
方法2:
use 库名;
show create table 表名;




修改存储引擎
方法1:通过 alter table 修改
use 库名;
alter table 表名 engine=MyISAM;
方法2:通过修改 /etc/my.cnf 配置文件,指定默认存储引擎并重启服务
vim /etc/my.cnf
......
[mysqld]
......
default-storage-engine=INNODB
 
systemctl restart mysql.service
注意:此方法只对修改了配置文件并重启mysql服务后新创建的表有效,已经存在的表不会有变更。


方法3:通过 create table 创建表时指定存储引擎
use 库名;
create table 表名(字段1 数据类型,...) engine=MyISAM;

mysql索引_第14张图片

mysql索引_第15张图片 mysql索引_第16张图片

mysql索引_第17张图片mysql索引_第18张图片 mysql索引_第19张图片

 

 

InnoDB行锁与索引的关系

InnoDB行锁是通过给索引项加锁来实现的,如果没有索引,InnoDB将通过隐藏的聚簇索引来对记录加锁。

delete from t1 where id=1;    如果id字段是主键,innodb对于主键使用了聚簇索引,会直接锁住整行记录。
delete from t1 where name='aaa';   如果name字段是普通索引,会先锁住索引的两行,接着会锁住相应主键对应的记录。
delete from t1 where age=23;   如果age字段没有索引,会使用全表扫描过滤,这时表上的各个记录都将加上锁。

死锁

死锁一般是事务相互等待对方资源,最后形成环路造成。

 如何尽可能避免死锁

使用更合理的业务逻辑,以固定的顺序访问表和行。
大事务拆小。大事务更倾向于死锁,如果业务允许,将大事务拆小。
在同一个事务中,尽可能做到一次锁定所需要的所有资源,减少死锁概率。
降低隔离级别。如果业务允许,将隔离级别调低也是较好的选择,比如将隔离级别从RR调整为RC,可以避免掉很多因为gap锁造成的死锁。
为表添加合理的索引。如果不使用索引将会为表的每一行记录添加上锁,死锁的概率大大增大。

for update

可以为数据库中的行上一个排它锁。当一个事务的操作未完成时候,其他事务可以读取但是不能写入或更新。

  • 共享锁:又叫做读锁,当用户要进行数据的读取时,对数据加上共享锁,共享锁可以同时加上多个。
  • 排他锁:又叫做写锁,当用户要进行数据的写入时,对数据加上排他锁,排他锁只可以加一个,它和其它的排他锁,共享锁都相斥。
     

你可能感兴趣的:(数据库)