1)索引是一个排序的列表,在这个列表中存储着索引的值和包含这个值的数据所在行的物理地址(类似于C语言的链表通过指针指向数据记录的内存地址)
2)使用索引后可以不用扫描全表来定位某行的数据,而是先通过索引表找到该行数据对应的物理地址然后访问相应的数据,因此能加快数据库的查询速度
3)索引就好比是一本书的目录,可以根据目录中的页码快速找到所需的内容
4)索引是表中一列或者若干列值排序的方法
5)建立索引的目的是加快对表中记录的查找和排序
1)设置了合适的索引之后,数据库利用各种快速定位技术,能够大大加快查询速度,这是创建索引的最主要的原因
2)当表很大或查询涉及到多个表时,使用索引可以成千上万倍的提高查询速度
3)可以降低数据库的IO成本,并且数据库可以降低数据库的排序成本
4)通过创建唯一性索引,可以保证数据表中每一行数据的唯一性
5)可以加快表与表之间的连接
6)在使用分组和排序时,可大大减少分组和排序的时间
7)建立索引在搜索和恢复数据库中的数据时能显著提高性能
总结:索引的作用其实就是加快表的查询速度,同时对表的字段进行排序
1)索引需要占用额外的磁盘空间
对于MyISAM 引擎而言,索引文件和数据文件是分离的,索引文件用于保存数据记录的地址。而 InnoDB 引擎的表数据文件本身就是索引文件
2)更新一个包含索引的表需要比更新一个没有索引的表花费更多的时间,这是由于索引本身也需要更新。因此,理想的做法是仅仅在常常被搜索的列(以及表)上面创建索引
索引虽可以提升数据库查询的速度,但并不是任何情况下都适合创建索引。因为索引本身会消耗系统资源,在有索引的情况下,数据库会先进行索引查询,然后定位到具体的数据行,如果索引使用不当,反而会增加数据库的负担
1)表的主键、外键必须有索引。因为主键具有唯一性,外键关联的是主表的主键,查询时可以快速定位
2)记录数超过300行的表应该有索引。如果没有索引,每次查询都需要把表遍历一遍,会严重影响数据库的性能
3)经常与其他表进行连接的表,在连接字段上应该建立索引
4)唯一性太差的字段不适合建立索引(有重复值的字段),会降低效率
5)更新太频繁地字段不适合创建索引
6)经常出现在 where子句中的字段,特别是大表的字段,应该建立索引
7)在经常进行GROUP BY(分组)、ORDER BY(排序)的字段上建立索引
8)索引应该建在选择性高的字段上(重复率较小的字段)
9)索引应该建在小字段上,对于大的文本字段甚至超长字段,不要建索引。由于索引需要表来记录索引的字段,如果存储大文本字段,会占用更多的资源,降低效率
create table member (id int (10),name varchar(10),cardid int(18) , phone int (11),adress varcohar(50),remark text);
最基本的索引类型,没有唯一性之类的限制
①直接创建索引
CREATE INDEX 索引名 ON 表名 (列名[(length)]);
###(列名(length)):length是可选项。如果忽略 length 的值,则使用整个列的值作为索引。如果指定使用列前的 length 个字符来创建索引,这样有利于减小索引文件的大小。在不损失精准性的情况下,长度越短越好。
###索引名建议以“_index”结尾。
②修改表方式创建
ALTER TABLE 表名 ADD INDEX 案引名 (列名);
③创建表的时指定索引
CREATE TABLE 表名 ( 字段1 数据类型,字段2 数据类型[,...],INDEX 索引名 (列名));
与普通索引类似,但区别是唯一索引列的每个值都唯一
唯一索引允许有空值(注意和主键不同)。如果是用组合索引创建,则列值的组合必须唯一。添加唯一键将自动创建唯一索引
①直接创建唯一索引
CREATE UNIQUE INDEX 索引名 ON 表名(列名);
②修改表方式创建
ALTER TABLE 表名 ADD UNIQUE 索引名 (列名);
③创建表的时候指定
CREATE TABLE 表名 (字段1 数据类型,字段2 数据类型[,...],UNIQUE 索引名 (列名));
是一种特殊的唯一索引,必须指定为 “PRIMARY KEY”
一个表只能有一个主键,不允许有空值。 添加主键将自动创建主键索引
①创建表的时指定
CREATE TABLE 表名 ([...],PRIMARY KEY (列名));
②修改表方式创建
ALTER TABLE 表名 ADD PRIMARY KEY (列名);
可以是单列上创建的索引,也可以是在多列上创建的索引
CREATE TABLE 表名 (列名1 数据类型,列名2 数据类型,列名3 数据类型,INDEX 索引名 (列名1,列名2,列名3));
适合在进行模糊查询的时候使用,可用于在一篇文章中检索文本信息
在 MySQL5.6 版本以前FULLTEXT 索引仅可用于 MyISAM 引擎,在 5.6 版本之后 innodb 引擎也支持 FULLTEXT 索引
全文索引可以在 CHAR、VARCHAR 或者 TEXT 类型的列上创建。每个表只允许有一个全文索引
①直接创建索引
CREATE FULLTEXT INDEX 索引名 ON 表名 (列名);
②修改表方式创建
ALTER TABLE 表名 ADD FULLTEXT 索引名 (列名);
③创建表的时指定索引
CREATE TABLE 表名 (字段1 数据类型[,...],FULLTEXT 索引名 (列名));
数据类型可以为 CHAR、VARCHAR 或者 TEXT
④使用全文索引查询
SELECT * FROM 表名 WHERE MATCH(列名) AGAINST('查询内容');
show index from 表名;
show index from 表名\G; ###竖向显示表索引信息
show keys from 表名;
show keys from 表名\G;
各索引字段 | 含义 |
---|---|
Table | 表的名称 |
Non_unique | 如果索引不能包括重复词,则为 0 ;如果可以,则为 1 |
Key_name | 索引的名称 |
Seq_in_index | 索引中的列序号,从 1 开始 |
Column_name | 列名称 |
Collation | 列以什么方式存储在索引中。在 MySQL 中,有值 A (升序)或 NULL (无分类) |
Cardinality | 索引中唯一值数目的估计值 |
Sub_part | 如果列只是被部分地编入索引,则为被编入索引的字符的数目。如果整列被编入索引,则为 NULL |
Packed | 指示关键字如何被压缩。如果没有被压缩,则为 NULL |
Null | 如果列含有 NULL ,则含有 YES 。如果没有,则该列含有 NO |
Index_type | 用过的索引方法(BTREE , FULLTEXT , HASH , RTREE ) |
Comment | 备注 |
DROP INDEX 索引名 ON 表名;
ALTER TABLE 表名 DROP INDEX 索引名;
ALTER TABLE 表名 DROP PRIMARY KEY;
EXPLAIN 来分析和优化,explain 显示了 MySQL 如何使用索引来处理 select 语句以及连接表
explain 的相关参数 | 含义 |
---|---|
possible_keys | 显示可能应用在这张表中的索引 |
key | 实际使用的索引。如果为 NULL,则没有使用索引 |
key_len | 使用的索引的长度。在不损失精确性的情况下,长度越短越好 |
ref | 显示索引的哪一列被使用了,如果可能,则是一个常数 |
Extra | 关于 MySQL 如何解析查询的额外信息 |
explain select语句
###可以用户分析select查询语句,看key字段,确定是否使用了索引或索引使用是否正确
事务是一种机制、一个操作序列,包含了一组数据库操作命令(增删改),并且把所有的命令作为一个整体一起向系统提交或撤销操作请求,即这一组数据库命令要么都执行,要么都不执行
事务是一个不可分割的工作逻辑单元,在数据库系统上执行并发操作时,事务是最小的控制单元。事务是通过事务的整体性以保证数据的一致性。事务能够提高在向表中更新和插入信息期间的可靠性
事务适用于多用户同时操作的数据库系统的场景,如银行、保险公司及证券交易系统等等。
总的来说所谓事务,它是一个操作序列,这些操作(增删改)要么都执行,要么都不执行,它是一个不可分割的工作单位
ACID,是指在可靠数据库管理系统(DBMS)中,事务(transaction)应该具有的四个特性:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability)。这是可靠数据库所应具备的几个特性
总结:在事务管理中,原子性是基础,隔离性是手段,一致性是目的,持久性是结果
指事务是一个不可再分割的工作单位,事务中的操作要么都发生,要么都不发生
事务是一个完整的操作,事务的各元素是不可分的。事务中的所有元素必须作为一个整体提交或回滚。如果事务中的任何元素失败,则整个事务将失败
指在事务开始之前和事务结束以后,数据库的完整性约束没有被破坏
当事务完成时,数据必须处于一致状态。在事务开始前,数据库中存储的数据处于一致状态。在正在进行的事务中,数据可能处于不一致的状态。当事务成功完成时,数据必须再次回到已知的一致状态
指在并发环境中,当不同的事务同时操纵相同的数据时,每个事务都有各自的完整数据空间
对数据进行修改的所有并发事务是彼此隔离的,表明事务必须是独立的,它不应以任何方式依赖于或影响其他事务。修改数据的事务可在另一个使用相同数据的事务开始之前访问这些数据,或者在另一个使用相同数据的事务结束之后访问这些数据
也就说并发访问数据库时,一个用户的事务不被其他事务所干扰,各并发事务之间数据库是独立的
在事务完成以后,该事务所对数据库所作的更改便持久的保存在数据库之中,并不会被回滚
指不管系统是否发生故障,事务处理的结果都是永久的。一旦事务被提交,事务的效果会被永久地保留在数据库中
在多个事务并发操作同意给表数据时,不同的隔离级别可能会出现的一致性问题
一致性问题 | 说明 |
---|---|
脏读 | 一个事务读取了另一个事务未提交的数据,而这个数据是有可能回滚的 |
不可重复读 | 一个事务内两个相同的查询却返回了不同数据。这是由于查询时系统中其他事务修改的提交而引起的 |
幻读 | 在一个事务里的两次查询会看到数据不一致的情况(可能是发现之前没有的数据),这种情况可能因为两次查询过程中间有其它事务插入了新的数据并己提交 |
丢失更新 | 一个事务修改数据并提交可能会覆盖另一个事务修改和提交的数据 |
隔离级别 | 含义 | 脏读取 | 不可重复读 | 幻像读 |
---|---|---|---|---|
未提交读:Read Uncommitted (RU) | 允许脏读,即允许一个事务可以看到其他事务未提交的修改。 | 允许 | 允许 | 允许 |
提交读:Read Committed(RC) | 允许一个事务只能看到其他事务已经提交的修改,未提交的修改是不可见的。 | 不允许 | 允许 | 允许 |
重读读取:Repeatable Read(RR) | mysql默认的隔离级别,确保如果在一个事务中执行两次相同的SELECT语句,都能得到相同的结果,不管其他事务是否提交这些修改 | 不允许 | 不允许 | 对 InnoDB 不允许,对有条件的允许 |
串行读:Serializable | 完全串行化的读,将一个事务与其他事务完全地隔凶。每次读都需要获得表级共享锁,读写相互都会阻案。会降低数据库的效率。 | 不允许 | 不允许 | 不允许 |
mysql默认的事务处理级别是 repeatable read ,而Oracle和SQL Server是 read committed
范围 | 说明 |
---|---|
全局级 | 对所有的会话有效 |
会话级 | 只对当前的会话有效 |
show global variables like '%isolation%';
SELECT @@global.tx_isolation;
show session variables like '%isolation%';
SELECT @@session.tx_isolation;
SELECT @@tx_isolation;
set global transaction isolation level read committed;
set @@global.tx_isolation='read-committed';
###重启服务后失效
set session transaction isolation level repeatable read;
set @@session.tx_isolation='repeatable-read';
语句 | 说明 |
---|---|
BEGIN 或 START TRANSACTION | 显式地开启一个事务 |
COMMIT 或 COMMIT WORK | 提交事务,并使已对数据库进行的所有修改变为永久性的 |
ROLLBACK 或 ROLLBACK WORK | 回滚会结束用户的事务,并撤销正在进行的所有未提交的修改 |
SAVEPOINT S1 | 使用 SAVEPOINT 允许在事务中创建一个回滚点,一个事务中可以有多个 SAVEPOINT;“S1”代表回滚点名称 |
ROLLBACK TO [SAVEPOINT] S1 | 把事务回滚到标记点 |
案例:
use kb;
create table account(
id int(10) primary key not null,
name varchar(40),
money double
);
insert into account values(1,'A',1000);
insert into account values(2,'B',1000);
#测试提交事务
begin;
update account set money= money - 100 where name='A';
commit;
quit
mysql -u root -p
use kb;
select * from account;
#测试回滚事务
begin;
update account set money= money + 100 where name='A';
rollback;
mysql -u root -p
use t1;
select * from account;
#测试多点回滚
begin;
update account set money= money + 100 where name='A';
SAVEPOINT S1;
update account set money= money + 100 where name='B';
SAVEPOINT S2;
insert into account values(3,'C',1000);
select * from account;
ROLLBACK TO S1;
select * from account;
SET AUTOCOMMIT=0;
###禁止自动提交
SET AUTOCOMMIT=1;
###开启自动提交,Mysql默认为1
SHOW VARIABLES LIKE 'AUTOCOMMIT';
###查看Mysql中的AUTOCOMMIT值
如果没有开启自动提交,当前会话连接的mysql的所有操作都会当成一个事务直到你输入rollback|commit;当前事务才算结束。当前事务结束前新的mysql连接时无法读取到任何当前会话的操作结果。
如果开起了自动提交,mysql会把每个sql语句当成一个事务,然后自动的commit。
当然无论开启与否,begin; commit|rollback; 都是独立的事务。
use t1;
select * from account;
SET AUTOCOMMIT=0;
update account set money= money + 100 where name='B';
select * from account;
quit
mysql -u root -p
use kb;
select * from account;
MySQL中的数据用各种不同的技术存储在文件中,每一种技术都使用不同的存储机制、索引技巧、锁定水平并最终提供不同的功能和能力,这些不同的技术以及配套的功能在MySQL中称为存储引擎。
存储引擎是MySQL将数据存储在文件系统中的存储方式或者存储格式。Mysql常用的存储引擎是MyISAM、InnoDB。
MySQL数据库中的组件,负责执行实际的数据I/O操作。MySQL系统中,存储引擎处于文件系统之上,在数据保存到数据文件之前会传输到存储引擎,之后按照各个存储引擎的存储格式进行存储
MyISAM 表支持 3 种不同的存储格式
存储格式 | 说明 |
---|---|
静态(固定长度)表 | 静态表是默认的存储格式。静态表中的字段都是非可变字段,这样每个记录都是固定长度的,这种存储方式的优点是存储非常迅速,容易缓存,出现故障容易恢复;缺点是占用的空间通常比动态表多 |
动态表 | 动态表包含可变字段,记录不是固定长度的,这样存储的优点是占用空间较少,但是频繁的更新、删除记录会产生碎片,需要定期执行 OPTIMIZE TABLE 语句或 myisamchk -r 命令来改善性能,并且出现故障的时候恢复相对比较困难 |
压缩表 | 压缩表由 myisamchk 工具创建,占据非常小的空间,因为每条记录都是被单独压缩的,所以只有非常小的访问开支 |
常用存储引擎 | |
---|---|
MyISAM | 不支持事务和外键约束,占用资源较小,访问速度快,表级锁定,支持全文索引,适用于不需要事务处理,单独写入或查询的应用场景 |
InnoDB | 支持事务处理、外键约束,缓存能力较好,支持行级锁定,读写并发能力较好,5.5版本后支持全文索引,适用于一致性要求高、数据更新频繁的应用场景 |
show engines;
方法一:
show table status from 库名 where name='表名'\G
方法二:
use 库名;
show create table 表名;
1.通过 alter table 修改
use 库名;
alter table 表名 engine=MyISAM;
2.通过修改 /etc/my.cnf 配置文件,指定默认存储引擎并重启服务
vim /etc/my.cnf
......
[mysqld]
......
default-storage-engine=INNODB
systemctl restart mysql.service
注意:此方法只对修改了配置文件并重启mysql服务后新创建的表有效,已经存在的表不会有变更。
3.通过 create table 创建表时指定存储引擎
use 库名;
create table 表名(字段1 数据类型,...) engine=MyISAM;
InnoDB行锁是通过给索引项加锁来实现的,如果没有索引,InnoDB将通过隐藏的聚簇索引来对记录加锁
1)
delete from t1 where id=1;
如果id字段是主键,innodb对于主键使用了聚簇索引,会直接锁住整行记录。
2)
delete from t1 where name='aaa';
如果name字段是普通索引,会先锁住索引的两行,接着会锁住相应主键对应的记录。
3)
delete from t1 where age=23;
如果age字段没有索引,会使用全表扫描过滤,这时表上的各个记录都将加上锁
死锁一般是事务相互等待对方资源,最后形成环路造成的
案例:
create table t1(id int primary key, name char(3), age int);
insert into t1 values(1,'aaa',22);
insert into t1 values(2,'bbb',23);
insert into t1 values(3,'aaa',24);
insert into t1 values(4,'bbb',25);
insert into t1 values(5,'ccc',26);
insert into t1 values(6,'zzz',27);
session 1 session 2
begin; begin;
delete from t1 where id=5;
select * from t1 where id=1 for update;
delete from t1 where id=1;
###死锁发生
update t1 set name='abc' where id=5;
###死锁发生
#for update 可以为数据库中的行上一个排它锁。当一个事务的操作未完成时候,其他事务可以读取但是不能写入或更新。
#共享锁:又叫做读锁,当用户要进行数据的读取时,对数据加上共享锁,共享锁可以同时加上多个。
#排他锁:又叫做写锁,当用户要进行数据的写入时,对数据加上排他锁,排他锁只可以加一个,它和其它的排他锁,共享锁都相斥
1)使用更合理的业务逻辑,以固定的顺序访问表和行
2)大事务拆小。大事务更倾向于死锁,如果业务允许,将大事务拆小
3)在同一个事务中,尽可能做到一次锁定所需要的所有资源,减少死锁概率
4)降低隔离级别。如果业务允许,将隔离级别调低也是较好的选择,比如将隔离级别从RR调整为RC,可以避免掉很多因为gap锁造成的死锁
5)为表添加合理的索引。如果不使用索引将会为表的每一行记录添加上锁,死锁的概率大大增大