目录
一、MySQL 索引
1.索引的概念
2.索引的作用
3.创建索引的原则依据
4.索引的分类和创建
5.查看索引
6.删除索引
二、MySQL事务
1.事务的概念
2.事务的ACID特点
3.事务控制语句
4.使用set设置控制事务
三、MySQL存储引擎
存储引擎概念1-1
存储引擎概念1-2
MyISAM的特点介绍2-1
MyISAM的特点介绍2-2
InnoDB特点介绍3-1
InnoDB特点介绍3-2
企业选择存储引擎依据2-1
企业选择存储引擎依据2-2
查看和设置存储引擎的命令
查看系统支持的存储引擎
查看表使用的存储引擎
修改存储引擎
InnoDB行锁与索引的关系
四、MySQL死锁
产生死锁的原因
产生死锁的四个必要条件
如何尽可能避免死锁
五、MySQL悲观锁
六、MySQL乐观锁
总结
●索引是一个排序的列表,在这个列表中存储着索引的值和包含这个值的数据所在行的物理地址(类似于C语言的链表通过指针指向数据记录的内存地址)。
●使用索引后可以不用扫描全表来定位某行的数据,而是先通过索引表找到该行数据对应的物理地址然后访问相应的数据,因此能加快数据。库的查询速度。
●索引就好比是一本书的目录, 可以根据目录中的页码快速找到所需的内容。
●索引是表中一列或者若干列值排序的方法。
●建立索引的目的是加快对表中记录的查找或排序。
●设置了合适的索引之后,数据库利用各种快速定位技术,能够大大加快查询速度,这是创建索引的最主要的原因。
●当表很大或查询涉及到多个表时,使用索引可以成千上万倍地提高查询速度。
●可以降低数据库的IO成本,并且索引还可以降低数据库的排序成本。
●通过创建唯一性索引, 可以保证数据表中每一行 数据的唯一性。
●可以加快表与表之间的连接。
●在使用分组和排序时,可大大减少分组和排序的时间。
建立索引在搜索和恢复数据库中的数据时能显著提高性能。
索引虽可以提升数据库查询的速度,但并不是任何情况下都适合创建索引。因为索引本身会消耗系统资源,在有索引的情况下,数据库会先进行索引查询,然后定位到具体的数据行,如果索引使用不当,反而会增加数据库的负担。
●表的主键、外键必须有索引。因为主键具有唯一性,外键关联的是主表的主键,查询时可以快速定位。
●记录数超过300行的表应该有索引。如果没有索引,每次查询都需要把表遍历一遍,会严重影响数据库的性能。
●经常与其他表进行连接的表,在连接字段上应该建立索引。
●唯一性太差的字段不适合建立索引。
●更新太频繁地字段不适合创建索引。
●经常出现在where子句中的字段,特别是大表的字段,应该建立索引。
●在经常进行GROUP BY、ORDER BY的字段上建立索引;
●索引应该建在选择性高的字段上。
●索引应该建在小字段上,对于大的文本字段甚至超长字段,不要建索引。
create table member (id int (10) , name varchar (10) ,cardid int (18) ,phone int (11) , address varchar (50) , remark text) ;
(1)普通索引:最基本的索引类型,没有唯一性之类的限制。
●直接创建索引 CREATE INDEX 索引名ON表名(列 名[ (length)]);
(列名(length)): length是可选项,下同。如果忽略length 的值,则使用整个列的值作为索引。如果指定,使用列的前length个字符来创建索引,这样有利于减小索引文件的大小。在不损失精确性的情况下,长度越短越好。 #索引名建议以“index" 结尾。
create index name_ index on member (name) ;
●修改表方式创建
ALTER TABLE表名ADD INDEX索引名(列名);
●创建表的时候指定索引
CREATE TABLE 表名(字段1数据类型,字段2数据类型[...,INDEX索引名(列名));
(2)唯一索引:与普通索引类似,但区别是唯一索引列的每个值都唯一。 唯一索引允许有空值(注意和主键不同)。如果是用组合索引创建,则列值的组合必须唯一。 添加唯一键将 自动创建唯一索引。 ●直接创建唯一 索引:
CREATE UNIQUE INDEX 索引名ON表名(列名);
create unique index cardid index on member (cardid) ;
●修改表方式创建
ALTER TABLE 表名 ADD UNIQUE 索引名 (列名);
●创建表的时候指定
CREATE TABLE 表名 (字段1 数据类型,字段2 数据类型[,...],UNIQUE 索引名 (列名));
(3)主键索引: 是一种特殊的唯一索引,必须指定为"PRIMARY KEY”。一个表只能有一个主键,不允许有空值。添加主键将自动创建主键索引。
●创建表的时候指定
CREATE TABLE 表名([ ... ],PRIMARY KEY(列名));
●修改表方式创建
ALTER TABLE表名ADD PRIMARY KEY (列名);
alter table member add primary key (id) ;
(4)组合索引(单列索引与多列索引):可以是单列上创建的索引,也可以是在多列上创建的索引。需要满足最左原则,因为select语句的where条件是依次从左往右执行的,所以在使用select 语句查询时where 条件使用的字段顺序必须和组合索引中的排序一致,否则索引将不会生效。
CREATE TABLE 表名(列名1数据类型,列名2数据类型,列名3数据类型,INDEX索引名(列名1,列名2,列名3));
select * from 表名where 列名1='...' AND列名2='...' AND列名3='...';
(5)全文索引(FULLTEXT) :适合在进行模糊查询的时候使用,可用于在一篇文章中检索文本信息。在MySQL5.6版本以前FULLTEXT 索引仅可用于MyISAM 引擎,在5.6版本之后innodb 引擎也支FULLTEXT 索引。全文索引可以在CHAR、VARCHAR 或者TEXT类型的列上创建。每个表只允许有一个全文索引。
●直接创建索引
CREATE FULLTEXT INDEX 索引名 ON 表名 (列名);
●修改表方式创建
ALTER TABLE表名ADD FULLTEXT索引名(列名) ;
alter table member add fulltext remark_ index (remark) ;
●创建表的时候指定索引
CREATE TABLE表名(字段1数据类型[,...], FULLTEXT 索引名(列名));
数据类型可以为CHAR、VARCHAR 或者TEXT
●使用全文索引查询
SELECT * FROM表名WHERE MATCH(列名) AGAINST('查询内容') ;
insert into member values (1, zhangsan, 123123, 123123, 'nanjing', 'this is member!'); insert into member values (2, 'lisi', 456456, 456456, 'beijing', 'this is vip!'); insert into member values (3, 'wangwu' , 789789, 78979, ' shanghai', 'this is vip member!'); select * from member where match (remark) against('vip') ;
show index from表名;
show keys from 表名;
各字段的含义如下:
●直接删除索引
DROP INDEX 索引名ON表名;
●修改表方式删除索引
ALTER TABLE表名DROP INDEX 索引名;
●删除主键索引
ALTER TABLE表名DROP PRIMARY KEY;
案例:比如为某商场做一 个会员卡的系统。这个系统有一个会员表,有下列字段:
create table member (id int (10) , name varchar (10) , cardid varchar (10),phone int (11) , address varchar (50), remark text) ;
alter table member add primary key (id) ;
create index name_index on member (name) ;
create unique index cardid_index on member (cardid) ;
alter table member add fulltext remark_index (remark) ;
●事务是一种机制、一个操作序列,包含了一组数据库操作命令,并且把所有的命令作为一个整体一起向系统提交或撤销操作请求,即这一组数据库命令要么都执行,要么都不执行。
●事务是一个不可分割的工作逻辑单元,在数据库系统上执行并发操作时,事务是最小的控制单元。
●事务适用于多用户同时操作的数据库系统的场景,如银行、保险公司及证券交易系统等等。
●事务通过事务的整体性以保证数据的一致性。
●事务能够提高在向表中更新和插入信息期间的可靠性。
说白了,所谓事务,它是--个操作序列,这些操作要么都执行,要么都不执行,它是一个不可分割的工作单位。
ACID, 是指在可靠数据库管理系统(DBMS) 中,事务(transaction)应该具有的四个特性:原子(Atomicity) 、一 致性(Consistency)、隔离性(Isolation) 、持久性(Durability) 。这是可靠数据库所应具备的几个特性。
●原子性:指事务是一个不可再分割的工作单位,事务中的操作要么都发生,要么都不发生。 事务是一个完整的操作,事务的各元素是不可分的。 事务中的所有元素必须作为一个整体提交或回滚。 如果事务中的任何元素失败,则整个事务将失败。
案例: A给B转帐100元钱的时候只执行了扣款语句,就提交了,此时如果突然断电,A账号已经发生了扣款,B账号却没收到加款,在生活中就会引起纠纷。这种情况就需要事务的原子性来保证事务要么都执行,要么就都不执行。
●一致性:指在事务开始之前和事务结束以后,数据库的完整性约束没有被破坏。
当事务完成时,数据必须处于一致状态。 在事务开始前,数据库中存储的数据处于一致状态 。
在正在进行的事务中,数据可能处于不一致的状态 。 当事务成功完成时,数据必须再次回到已知的一致状态 。
案例: 对银行转帐事务,不管事务成功还是失败,应该保证事务结束后表中A和B的存款总额跟事务执行前一致。
●隔离性:指在并发环境中,当不同的事务同时操纵相同的数据时,每个事务都有各自的完整数据空间。 对数据进行修改的所有并发事务是彼此隔离的,表明事务必须是独立的,它不应以任何方式依赖于或影响其他事务。
修改数据的事务可在另一个使用相同数据的事务开始之前访问这些数据,或者在另一个使用相同数据的事务结束之后访问这些数据。
也就是说并发访问数据库时,一个用户的事务不被其他事务所干扰,各并发事务之间数据库是独立的。
//当多个客户端并发地访问同一个表时,可能出现下面的一致性问题:
(1)脏读:一个事务读取了另一个事务未提交的数据,而这个数据是有可能回滚的。
(2)不可重复读:一个事务内两个相同的查询却返回了不同数据。这是由于查询时系统中其他事务修改的提交而引起的。
(3)幻读:一个事务对一个表中的数据进行了修改,这种修改涉及到表中的全部数据行。同时,另一个事务也修改这个表中的数据,这种修改是向表中插入一行新数据。那么,操作前一个事务的用户会发现表中还有没有修改的数据行,就好象发生了幻觉一样。
(4)丢失更新:两个事务同时读取同一条记录,A先修改记录,B也修改记录(B不知道A修改过),B提交数据后B的修改结果覆盖了A的修改结果。
事务的隔离级别决定了事务之间可见的级别。 MySQL事务支持如下四种隔离,用以控制事务所做的修改,并将修改通告至其它并发的事务:
(1)未提交读(Read Uncommitted) : 允许脏读,即允许一个事务可以看到其他事务未提交的修改。
(2)提交读(Read Committed) : 允许一个事务只能看到其他事务已经提交的修改,未提交的修改是不可见的。
(3)可重复读(Repeated Read): ---mysql默认 的隔离级别 确保如果在一个事务中执行两次相同的SELECT语句,都能得到相同的结果,不管其他事务是否提交这些修改。
(4)串行读(Serializable): ---相当于锁表 完全串行化的读,将一个事务与其他事务完全地隔离。每次读都需要获得表级共享锁,读写相互都会阻塞。
mysql默认的事务处理级别是repeatable read ,而Oracle和SQL Server是read committed 。
//事务隔离级别的作用范围分为两种:
●全局级:对所有的会话有效
●会话级:只对当前的会话有效
查询全局事务隔离级别:
show global variables like '%isolation%' ;
SELECT @@global.tx_isolation;
查询会话事务隔离级别:
show session variables like '%isolation%';
SELECT @@session.tx_isolation;
SELECT @@tx_isolation;
设置全局事务隔离级别:
set global transaction isolation level read committed;
设置会话事务隔离级别:
set session transaction isolation level read committed;
●持久性:在事务完成以后,该事务所对数据库所作的更改便持久的保存在数据库之中,并不会被回滚。
指不管系统是否发生故障,事务处理的结果都是永久的。
一旦事务被提交,事务的效果会被永久地保留在数据库中。
总结:在事务管理中,原子性是基础,隔离性是手段,一致性是目的,持久性是结果。
案例: use kgc;
create table account (
id int(10) primary key not null,
name varchar (40), money double
);
insert into account values(1, 'A' , 1000) ;
insert into account values(2, 'B', 1000) ;
#测试提交事务
begin;
update account set money= money - 100 where name= 'A' ;
commit ;
quit
mysql -U root -P
use kgc;
select *from account ;
#测试回滚事务
begin;
update Fmoney set money= money + 100 where name='zhangsan';
select * from MYmoney;
rollback;
select * from MYmoney;
#测试多点回滚
begin;
update Fmoney set money= money + 100 where name='zhangsan';
select * from MYmoney;
SAVEPOINT S1;
update MYmoney set money= money - 100 where name='lisi';
select * from MYmoney;
SAVEPOINT S2;
insert into MYmoney values(3,'wangchao',500);
select * from MYmoney;
ROLLBACK TO S1;
select * from MYmoney;
SET AUTOCOMMIT=0; #禁止自动提交
SET AUTOCOMMIT=1; #开启自动提交,Mysql默 认为1
SHOW VARIABLES LIKE ' AUTOCOMMIT'; #查看Mysql中的AUTOCOMMIT值
如果没有开启自动提交,当前会话连接的mysq1的所有操作都会当成一个事务直到你输入rollbackIcommit;当前事务才算结束。当前事务结束前新的mysql连接时无法读取到任何当前会话的操作结果。
如果开起了自动提交,mysql 会把每个sql语句当成一个事务,然后自动的commit。
当然无论开启与否,begin; commit lrollback;都是独立的事务。
use kgc;
select * from account;
SET AUTOCOMMIT=0;
update account set money= money + 100 where name='B' ;
select * from account;
quit
mysq1 -u root -use kgc;
select * from account;
表级锁定形式,数据在更新时锁定整个表
数据库在读写过程中相互阻塞
数据单独写入或读取,速度过程较快且占用资源相对少
MyIAM支持的存储式
MyISAM适用的生产场景举例
InnoDB中不保存表的行数,如select count(*) from table; 时InnoDB需要扫描一遍整个表来计算有多少行,但是MyISAM只要简单的读出保存好的行数即可。需要注意的是当count(*)语句包含where条件时MyISAM也需要扫描整个表
对于自增长的字段,InnoDB 中必须包含只有该字段的索引, 但是在MylSAM表中可以和其他字段一起建立组合索引
清空整个表时,InnoDB是一行一 行的删除,效率非常慢。MyIS AM则会重建表
InnoDB适用生产场景分析
如:论坛,微博等
如:银行业务
需要考虑每个存储引擎提供了哪些不同的核心功能及应用场景
支持的字段和数据类型
●所有引擎都支持通用的数据类型
●但不是所有的引擎都支持其它的字段类型,如二进制对象
锁定类型:不同的存储引擎支持不同级别的锁定
●表锁定: MyISAM 支持
●行锁定: InnoDB 支持
索引的支持
事务处理的支持
show engines;
方法一:
show table status from 库名 where name='表名'\G;
方法二:
use 库名;
show create table表名;\G
方法1:alter table修改
MySQL [auth]> alter table user_ info engine=MyISAM;
方法2:修改my.cnf,指定默认存储引擎并重启服务
vim my.cnf;default-storage-engine=InnoDB
方法3: create table创建表时指定存储引擎
MySQL [auth]> create table engine Test(id int) engine=MyISAM;
InnoDB行锁是通过给索引项加锁来实现的,如果没有索引,InnoDB将通过隐藏的聚簇索引来对记录加锁。
1)
delete from tl where id=1;
如果id字段是主键,innodb对 于主键使用了聚簇索引,会直接锁住整行记录。
2)
delete from tl where name='aaa' ;
如果name字段是普通索引,会先锁住索引的两行,接着会锁住相应主键对应的记录。
3)
delete from t1 where age=23;
如果age字段没有索引,会使用全部打描过滤,这时表上的各个记录都将加上锁。
所谓死锁:是指两个或两个以上的进程在执行过程中,因争夺资源而造成的一种互相等待的现象,若无外力作用,它们都将无法推进下去。此时称系统处于死锁状态或系统产生了死锁,这些永远在互相等待的进程称为死锁进程。
由于资源占用是互斥的,当某个进程提出申请资源后,使得有关进程在无外力协助下,永远分配不到必需的资源而无法继续运行,这就产生了一种特殊现象死锁。
一种情形,此时执行程序中两个或多个线程发生永久堵塞(等待),每个线程都在等待被其他线程占用并堵塞了的资源。例如,如果线程A锁住了记录1并等待记录2,而线程B锁住了记录2并等待记录1,这样两个线程就发生了死锁现象。
计算机系统中,如果系统的资源分配策略不当,更常见的可能是程序员写的程序有错误等,则会导致进程因竞争资源不当而产生死锁的现象。
锁有多种实现方式,比如意向锁,共享-排他锁,锁表,树形协议,时间戳协议等等。锁还有多种粒度,比如可以在表上加锁,也可以在记录上加锁。
主要是:
(1)系统资源不足。
(2) 进程运行推进的顺序不合适。
(3)资源分配不当等。
如果系统资源充足,进程的资源请求都能够得到满足,死锁出现的可能性就很低,否则就会因争夺有限的资源而陷入死锁。其次,进程运行推进顺序与速度不同,也可能产生死锁。
(1) 互斥条件:一个资源每次只能被一个进程使用。
(2) 请求与保持条件:一个进程因请求资源而阻塞时,对已获得的资源保持不放。
(3) 不剥夺条件:进程已获得的资源,在末使用完之前,不能强行剥夺。
(4) 循环等待条件:若干进程之间形成一种头尾相接的循环等待资源关系。
这四个条件是死锁的必要条件,只要系统发生死锁,这些条件必然成立,而只要上述条件之一不满足,就不会发生死锁。
1)以固定的顺序访问表和行。
2)大事务拆小。大事务更倾向于死锁,如果业务允许,将大事务拆小。
3)在同一个事务中,尽可能做到一次锁定所需要的所有资源,减少死锁概率。
4)降低隔离级别。如果业务允许,将隔离级别调低也是较好的选择,比如将隔离级别从RR调整为RC,可以避免掉很多因为gap锁造成的死锁。
5)为表添加合理的索引。如果不使用索引将会为表的每一行记录添加上锁,死锁的概率大大增大。
当我们使用悲观锁的时候我们首先必须关闭mysql数据库的自动提交属性,因为MySQL默认使用autocommit模式,也就是说,当你执行一个更新操作后,MySQL会立刻将结果进行提交。
关闭命令为:set autocommit=0;
悲观锁可以使用select…for update实现,在执行的时候会锁定数据,虽然会锁定数据,但是不影响其他事务的普通查询使用。此处说普通查询就是平时我们用的:select * from table 语句。在我们使用悲观锁的时候事务中的语句例如:
//开始事务
begin;/begin work;/start transaction; (三选一)
//查询信息
select * from order where id=1 for update;
//修改信息
update order set name=’names’;
//提交事务
commit;/commit work;(二选一)
此处的查询语句for update关键字,在事务中只有SELECT … FOR UPDATE 或LOCK IN SHARE MODE 同一条数据时会等待其它事务结束后才执行,一般的SELECT查询则不受影响。
执行事务时关键字select…for update会锁定数据,防止其他事务更改数据。但是锁定数据也是有规则的。
查询条件与锁定范围:
1、具体的主键值为查询条件,比如查询条件为主键ID=1等等,如果此条数据存在,则锁定当前行数据,如果不存在,则不锁定。
2、不具体的主键值为查询条件,比如查询条件为主键ID>1等等,此时会锁定整张数据表。
3、查询条件中无主键会锁定整张数据表。
4、如果查询条件中使用了索引为查询条件
明确指定索引并且查到,则锁定整条数据。如果找不到指定索引数据,则不加锁。
悲观锁的确保了数据的安全性,在数据被操作的时候锁定数据不被访问,但是这样会带来很大的性能问题。因此悲观锁在实际开发中使用是相对比较少的。
相对悲观锁而言,乐观锁假设数据一般情况下不会造成冲突,所以在数据进行提交更新的时候,才会对数据的冲突与否进行检测,如果发现冲突,则让返回用户错误的信息,让用户决定如何去做。
一般来说,实现乐观锁的方法是在数据表中增加一个version字段,每当数据更新的时候这个字段执行加1操作。
这样当数据更改的时候,另外一个事务访问此条数据进行更改的话就会操作失败,从而避免了并发操作错误。当然,还可以将version字段改为时间戳,不过原理都是一样的。
例如有表student,字段:
id,name,version
1 a 1
当事务一进行更新操作:update student set name=’ygz’ where id = #{id} and version = #{version};
此时操作完后数据会变为id = 1,name = ygz,version = 2,当另外一个事务二同样执行更新操作的时候,却发现version != 1,此时事务二就会操作失败,从而保证了数据的正确性。悲观锁和乐观锁都是要根据具体业务来选择使用,本文仅作简单介绍。
悲观锁会锁定数据,其他操作不会影响到被锁的数据,但是普通的查询没有影响,需要用到 for update语句。
实现乐观锁的方法是在数据表中增加一个version字段,每当数据更新的时候这个字段执行加1操作。
这样当数据更改的时候,另外一个事务访问此条数据进行更改的话就会操作失败,从而避免了并发操作错误。